[編集発行] (公財)つくば科学万博記念財団 [協力] 科学技術振興機構(JST)・文科省研究交流センター

つくばサイエンスニュース

トピックスつくばサイエンスニュース

ネットに投稿された料理レシピの重複を精度良く検出:筑波大学

(2017年8月20日発表)

 筑波大学図書館情報メディア系は820日、ネットに投稿されたレシピ(料理手順書)の中から重複や類似しているものを検出し、排除する手法を開発したと発表した。レシピの精度を上げ、利用者の混乱を防ぐ狙いがある。IT企業の楽天(株)、楽天技術研究所との共同研究による。

 楽天がネット上で運営するレシピサービスは、投稿者の提供による100万件以上の調理法が常時紹介されていて注目度が高い。気になる食材や料理名を打ち込むだけで、簡単に無料で検索できることから主婦層や一人暮らしの若者たちに好まれている。

 投稿数は年間約10数万件にものぼる。中には掲載済みのレシピの一部や料理画像を再利用した投稿も紛れ込んでおり、より内容の豊かなレシピをそろえるために、本質的でない改変をした投稿を取り除く必要があった。

 そこで常連投稿者の中から、過去の投稿内容と新しい内容との類似度を計算した。同時に料理画像を色素に分解した類似度を解析して、重複や改変されたレシピを精度良く検出することに成功した。

 類似度の計算には、自然言語処理やウェブ検索で使われる方法を利用した。この方法は改変レシピの排除だけでなく、独創的で上質なレシピを積極的に拾い出し、ランキング上位に紹介するためのサービスにも応用できるとみている。