5章推薦アルゴリズムの詳細
本章では、具体的な推薦システムのアルゴリズムを紹介します。MovieLensという映画のデータセットを利用して、必要に応じて数式やPythonのコードを利用した説明も行います。MovieLensのデータは推薦アルゴリズムを評価するベンチマークとして、研究でも実務でも多用されています。実際にデータを使ってアルゴリズムを構築していくことで、実務で直面する問題点やその対処法についても解説していきます。利用したPythonのコードの最新版はhttps://github.com/oreilly-japan/RecommenderSystemsに公開しています。紙面の都合で掲載できなかったコードや補足も載せていますので、本章を読む際はぜひこちらもご参照ください。本章では、アルゴリズムの数式については概要を述べる程度にとどめていますので、さらに詳しく知りたい方は、『情報推薦システム入門:理論と実践』(共立出版、2012年)、『推薦システム:統計的機械学習の理論と実践』(共立出版、2018年)、『施策デザインのための機械学習入門:データ分析技術のビジネス活用における正しい考え方』(技術評論社、2021年)、神嶌敏弘の「推薦システムのアルゴリズム」†1をご参考ください。
5.1 各アルゴリズムの比較
本章では10種類以上のアルゴリズムを紹介しますが、それら全部を順番に読む必要はありません。表5-1に、各アルゴリズムを簡単に比較したものを載せましたので、興味のあるアルゴリズムをピックアップして読んでもらえればと思います。予測精度や計算速度は、データセットやハイパーパラメータのチューニング度合い、アルゴリズムの実装環境によっても大きく異なってきますので、 ...
Get 推薦システム実践入門 ―仕事で使える導入ガイド now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.