13章検索ランキングモデルの学習とオフライン評価
前章では、検索ランキングモデルを構築するための訓練データセットを準備しました。本章では、XGBoostによって実際に検索ランキングモデルを構築します。続いて、検索ランキングモデルをElasticsearchにデプロイし、検索ランキングモデルによるランキング結果を収集します。最後に、得られたランキング結果を評価し、Elasticsearchのデフォルトのランキング結果の評価と比較します。
13.1 検索ランキングモデルの学習
本ハンズオンでは、勾配ブースティング木ライブラリであるXGBoostを用いたランキング学習により検索ランキングモデルを学習します。次に、XGBoostによる学習コード(workspace/generate_model.py
)を記載します。
#!/usr/bin/env python import json from xgboost import DMatrix, train # featuresetから特徴量名を取得する def get_feature_names_from_featureset(): with open("hands_on_featureset.json") as featureset_fp: featureset = json.load(featureset_fp) feature_names = [e["name"] for e in featureset["featureset"]["features"]] return feature_names feature_names = get_feature_names_from_featureset() # XGBoost学習パラメーター ...
Get 機械学習による検索ランキング改善ガイド ―技術解説とハンズオンで学ぶ機械学習ランキングモデルの導入と改善 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.