2章検索システム

検索改善プロジェクトの各工程について説明する前に、本章では、本書の解説において前提とするシステムについて紹介します。機械学習を用いて検索ランキングを改善するには、検索システムを構成するさまざまなコンポーネントに対して改修や環境整備を実施します。後続の章で解説する内容への理解を深めるために、それぞれのコンポーネントの役割について、その概要を説明します。

2.1 典型的なシステム構成

本書では 図2-1 のような検索システムを元に検索改善プロジェクトを進めます。あくまで一例ですので、実際のシステムでは各コンポーネントの機能が統合されていたり、分割されていたり、はたまたここで紹介しない役割のコンポーネントを含んだシステムもあるでしょう。

なお、本検索改善プロジェクトにおいて直接機能追加の必要があるコンポーネントは、フロントエンドサーバー、バックエンドサーバー、検索エンジン、フィーダーとなっています。文書マスターDBやデータウェアハウスには、機械学習やデータ分析用のデータを保存、取得するために新規データを追加することがあります。クローラー・入稿ツールはシステム例として載せていますが、本書で説明するプロジェクトでは新しく修正を加えることはありません。

検索システム概要

図2-1 検索システム概要

2.1.1 フロントエンドサーバー

フロントエンドサーバー はサービスの一般的なユーザーが直接アクセスできる唯一のコンポーネントであり、ユーザーの入力はここで行われます。検索が実行された後は、その結果を何かしらの形でユーザーが受け取れるようなインターフェイスになっているはずです。たとえばGoogleのWeb検索であれば、ユーザーが検索するためのページがあり、検索キーワードを入力する検索窓があります。検索をすると、関連する記事のタイトルとリンク、スニペットが10件ほど表示されるでしょう。本書の検索改善では、検索結果を表示するインターフェイスは変更しません。 ...

Get 機械学習による検索ランキング改善ガイド ―技術解説とハンズオンで学ぶ機械学習ランキングモデルの導入と改善 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.