研究事例紹介
「みんなが○○と評している映画」を、キーワードで検索できるようにしよう
この研究では、「みんなが○○と言っている映画を探したい」というような、自由なキーワードでレビューから映画を探せる検索アルゴリズムを提案しています。
従来は、「みんなが○○と言っている映画を探したい」と思った際には、ネタバレ覚悟で、人手でレビューを読み進めて、該当する映画を探す必要がありました。 この研究では、レビューを読み進める部分を、人間ではなくAIにやらせることで、キーワード検索を可能にしています。
ネットフリックスやPrimeビデオなどのサブスク配信サービスは、人々の映画の選び方を変えました。 公開中のたかだか10本程度の映画や、レンタルビデオ店の在庫の中からでなく、これまでに公開された数万本の映画の中から、次に見るべき1本の映画を探さないといけません。 膨大な数の映画から自分の好みに合うものを探すのは困難です。
従来の映画検索では、映画のタイトルやジャンルなどのメタデータが主な検索対象でしたが、これでは「泣ける映画」や「デートにおすすめ」といったユーザの感覚に基づいた検索ができません。 この研究では、映画レビューやユーザーが作成したランキングを活用し、ユーザーの感覚に寄り添った検索を可能にします。
この研究では、個人の投稿したレビューデータと、個人の投稿した「マイベスト泣ける映画トップ10」などのランキングを、BERTという言語を理解するAIを用いて検索可能にしました。 実際の検索のために、AIは、「『○○な映画トップ10』というランキングに登場しがちな映画に対するレビューには、『××だ』という表現が登場しやすい」という関係性を学習します。 こうすることで、任意の「○○な映画」という検索要求に対して、適切な映画のランキングを自動で生成できるようになります。
具体的な処理としては、
- BERTによるベクトル化: 映画レビューやユーザーランキングのタイトルをベクトル化し、意味を数値で表現します。
- 関連性の学習: ランキングのタイトルのベクトルと、映画レビューのベクトルの関連性を、ニューラルネットワークを用いて学習します。
- ランキング生成: 学習したモデルを使い、入力されたキーワードに最も関連性の高い映画をランキングします。
ということをやっています。
10種類のキーワードについて、提案手法を含む4つの比較手法でランキングを生成し、実際に被験者に検索結果が正しいか聞いてみました。 その結果、提案手法は「泣ける映画」や「デートにおすすめ」といった感覚的なクエリに対して、従来の手法を上回る精度を示しました。 一方で、アニメ作品の検索など特定のジャンルに関するクエリでは、メタデータを活用した手法のほうが適している場合もありました。
ランキングタイトルとレビュー文の関連度計算。
文献情報
- タイトル:
- BERT-Based Movie Keyword Search Leveraging User-Generated Movie Rankings and Reviews
- 著者:
- Tensho Miyashita, Yoshiyuki Shoji, Sumio Fujita, Martin J. Dürst
- 書誌情報:
- Proc. of 2024 International Conference on Big Data and Smart Computing (BigComp 2024), pp. 246 – 253, 2024
- 掲載サイト(IEEE)