まえがき

本書は、検索システムに機械学習を導入し、ランキング結果の品質を高めることについての書籍です。

全文検索 をひとことでいえば「文書内のすべての単語に索引をつけ、ユーザーから与えられた検索キーワードに応じて文書を引き当て、リストアップする」という分野です。全文検索システムにおいて、 ランキング とは「リストアップの順序を決めること」であり、 ランキング改善 とは「ユーザーの検索意図に合う文書ほど上位に来るようにランキング結果を並べ替えること」です。

より具体的に例を挙げて説明すると、ECサイトのKPIがCTR(Click Through Rate)であるとき、CTRと商品の閲覧数には相関がありそうなので、直近一週間の閲覧数を加味して商品を並べ替えるとKPIを向上させられる可能性があります。また定性的にも、多くの人にとって良さそうなもの、SNSでバズったものなど、「いま」興味をもたれている商品を掲出しやすくなるでしょう。このようなランキングを機械学習を用いて実現します。

ここまでで、機械学習によるランキング改善のひと通りが完了しますが、改善はこれで終わりではありません。本書では次のような理由から、ランキング改善のための機械学習モデル(これを 検索ランキングモデル といいます)の改善・更新を継続的に行うことを推奨します。

  1. 多くの場合、検索ランキングモデルにはKPIから見て改善の余地があるため。
  2. 多くの場合、同じ検索ランキングモデルを使い続けているとランキング結果の品質が経年劣化していくため。

たとえば機械学習手法の変更、特徴量の追加(検索エンジンへのフィールドの追加を含む)、ラベルの変更、データセットのクリーニングや拡張などの方法が考えられます。

本書の想定読者

本書は、以下のような方を対象読者として想定しています。 ...

Get 機械学習による検索ランキング改善ガイド ―技術解説とハンズオンで学ぶ機械学習ランキングモデルの導入と改善 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.