研究事例紹介
ある観点に言及したレビューに含まれそうな「文の断片」を見つけよう!
この研究では、ある観点に言及した商品レビューを検索するための、効率的なキーワードの書き換え手法を提案しています。 たとえば、「接写性能」の高いカメラがあったとして、人々はそれに対して「このカメラは、接写性能が高いです。」とは書きません。 多くの場合、「微細な写真が取れます」や「繊細な写りです」、「フィギュアにつくまで寄れます」や「ここまで寄せられるレンズ」といった、具体的なメリットを書くはずです。 こういった具体的なレビュー文に頻出する「細な写」や「まで寄」などのキーワードの断片(ワイルドカード)を集めることができれば、効率的に欲しいレビューを探せるようになります。
近年、オンラインショッピングサイトで買いたい商品を探すことが一般的になっています。 この時に、「コスパのいいカメラを探したい」と思った場合、商品のスペック欄に「コスパ」という項目はないので、レビューの中から「コスパの良さ」に言及したレビューを探して、購入するかの判断に使います。
・・・一方で、こうした「コスパの良さ」に言及したレビューだけを検索することは、実は、結構難しい課題です。 「コスパの良さ」はレビューの中では、直接的に「コスパがいい」とは書かれずに、「値段の割にいい」とか、「安い割によく映る」とか、「この安さなら満足です」など、様々な具体的な書かれ方をします。 そのため、「コスパ」と検索しても、買うかどうかの判断に使えるレビューは、見つかりません。 人々は、「コスパのいいカメラ」を探すために、レビューを片っ端からたくさん読んで、「コスパの良さ」を判断しないといけません。
そこで、この研究では、「コスパ」と入力すると「の割に良」などの、その観点に言及しているレビューによく出てきそうなキーワードの断片をたくさん出力するアルゴリズムを提案しています。 このキーワードで実際にレビューを検索し、その観点に言及している多様なレビューを提示するシステムを、実際に作りました。
このようなシステムを実現するために、この研究では、
- 生成AIをトレーニングして、実際にありそうな、観点に言及するレビューをたくさん生成する
- それらの生成レビューに多く含まれ、一般的なレビューにはあまり登場しない部分文字列を切り出してくる
- その文字列でレビューを検索して、結果がなるべく多様になるようにレビューを並び替える
ということをやっています。
主要な工夫点として、生成AIのトレーニングとして、超高級な生成AIと安価な生成AIをうまく組み合わせ、低コストで膨大な量の「それっぽいレビュー」を生成できるようにしています。
提案手法の有効性を確かめるため、実際のショッピングサイトのレビューデータを使って、被験者実験を行いました。
その結果、提案手法は
- 検索語をそのまま使う方法
- 従来のクエリ拡張手法
- ベクトル検索を用いた手法
と比べて、検索意図に合ったレビューを、表現のバリエーション豊富に提示できることがわかりました。 特に、「言い方は違うが、同じ観点を述べているレビュー」を多く見つけられる点が評価され、抽象的な検索語からでも、実際の購入判断に役立つ情報を集めやすくなることが分かりました。
生成AIを2種類使い、「多くのその観点のレビューに登場する」、「ほかの観点のレビューには登場しない」、「長い文字列」を発見
文献情報
- タイトル:
- Expanding Aspect Queries into Review Sentence Fragments for Product Comparison via LLM-Generated Synthetic Reviews
- 著者:
- Naito Yoshihara, Takehiro Yamamoto, Yoshiyuki Shoji
- 書誌情報:
- Proc. of The 27th International Conference on Information Integration and Web Intelligence (iiWAS2025), pp. 47 - 62, 2024
- 掲載サイト