レコメンダシステムとは
レコメンダシステムは、情報過多な現代において、ユーザーが興味を持つ可能性の高い情報を効率的に見つけ出すための重要な技術です。これは、情報フィルタリングの一種であり、
映画、
音楽、書籍、
ニュース、
ウェブページなど、多岐にわたるアイテムの中から、個々のユーザーにパーソナライズされた「おすすめ」を提示します。
レコメンダシステムの基
本的な仕組みは、ユーザーのプロファイルを構築し、そのプロファイルとアイテムの情報を照らし合わせることで、ユーザーがアイテムをどのように評価するかを予測することです。
データ収集方法
ユーザーのプロファイルを構築する際には、明示的なデータ収集と暗黙的なデータ収集の2つの方法が用いられます。
明示的なデータ収集:
ユーザーにアイテムの評価をしてもらう(例:5段階評価)
ユーザーにアイテムのランキング付けをしてもらう
2つのアイテムから好きな方を選んでもらう
好きなアイテムの一覧を作成してもらう
暗黙的なデータ収集:
オンラインストアでのアイテム閲覧履歴を分析する
各アイテムの閲覧時間を分析する
オンライン購入履歴を分析する
オンライン視聴履歴を分析する
ソーシャルネットワークでの行動を分析する
これらのデータをもとに、レコメンダシステムはユーザーにおすすめのアイテムを算出します。
レコメンダシステムのアルゴリズム
レコメンダシステムでは、様々なアルゴリズムが用いられています。代表的なものとして、以下のようなものがあります。
最近傍探索: ユーザーの嗜好空間における近傍を特定し、そのユーザーの好みを予測します。ソーシャルネットワークにおいては、特定のユーザーに近い上位N個の近傍との相関関係を計算することで、嗜好が類似するユーザーを発見できます。
機械学習: 大量のデータを用いてモデルを学習させ、ユーザーの行動を予測します。
Netflix Prizeでは、1億件以上の映画評価データを対象に、最も正確な予測を行うアルゴリズムを競うコンテストが開催されました。このコンテストで優勝したアルゴリズムは、107個のアルゴリズムを組み合わせたアンサンブルモデルであり、複数の予測を組み合わせることで精度が大幅に向上することが示されました。
レコメンダシステムの具体例
レコメンダシステムは、様々なサービスで活用されています。以下にその例を挙げます。
Amazon.com: オンラインショッピングにおいて、ユーザーが過去に購入した商品や閲覧した商品に基づいておすすめの商品を提示します。
Last.fm: 音楽ストリーミングサービスにおいて、ユーザーの聴取履歴に基づいておすすめの音楽を提示します。
Netflix: 動画配信サービスにおいて、ユーザーの視聴履歴に基づいておすすめの
映画やドラマを提示します。
Reddit: ニュースアグリゲーションサイトにおいて、ユーザーの興味関心に基づいておすすめの記事を提示します。
TSUTAYA DISCAS: DVD・CDレンタルサービスにおいて、ユーザーのレンタル履歴に基づいておすすめの作品を提示します。
レコメンダシステムの研究動向
レコメンダシステムは、データマイニングや機械学習における主要な研究分野であり、多くの国際会議で論文が発表されています。代表的な会議としては、以下のようなものがあります。
Recsys
Web Search and Data Mining (WSDM)
SIG Information Retrieval (SIGIR)
The Web Conference (TheWebConf 旧称WWW)
Knowledge Discovery and Data Mining (KDD)
Conference on Information and Knowledge Management (CIKM)
レコメンダシステムの関連技術
レコメンダシステムに関連する技術として、以下のようなものが挙げられます。
協調フィルタリング: ユーザーの評価データに基づいておすすめを提示する手法
集団的知性: 多数のユーザーの意見や行動に基づいて情報を収集・分析する手法
ロングテール: 大量の商品の中から、少数の人気商品だけでなく、ニッチな商品も対象とする考え方
まとめ
レコメンダシステムは、情報過多な現代において、ユーザーが求める情報に効率的にアクセスするための不可欠な技術です。今後もその重要性は増していくと考えられ、さらなる発展が期待されます。
参考資料
Hangartner, Rick, "What is the Recommender Industry?", MSearchGroove, December 17, 2007.
Robert M. Bell, Jim Bennett, Yehuda Koren, and Chris Volinsky (May 2009). “The Million Dollar Programming Prize”. IEEE Spectrum. 2009年5月27日閲覧。
有賀 康顕, 中山 心太, 西林 孝、2018年1月15日、『仕事ではじめる機械学習』、オライリー
ISBN 978-4-87311-825-3
外部リンク
Collection of research papers
Content-Boosted Collaborative Filtering for Improved Recommendations Prem Melville, Raymond J. Mooney, and Ramadass Nagarajan
Methods and Metrics for Cold-Start Recommendations(PDF, 126 KiB)
研究グループ
GroupLens
IFI DBIS Next Generation Recommender Systems
IISM
Univ. of Southampton IAM Group
CoFE
Duine Recommender Framework
LIBRA
Intelligent Systems and Business Informatics research group at University Klagenfurt, Austria
Univ. of Fribourg Statistical Physics Group