10章ElasticsearchにWikipediaデータセットを保存する

Elasticsearchの準備ができたので、次はElasticsearchに検索対象の文書を保存します。

本章の構成は次のようになっています。

  • 検索エンジンとKibanaだけを用いて、Elasticsearchへ文書を保存する基本的な方法について説明します
  • 本ハンズオンにおいて利用するデータセットについて説明します
  • Pythonの elasticsearch クライアントを用いて、データセットの内容をElasticsearchに保存する方法を説明します
  • 実際のコードを実行します

10.1 Elasticsearchへ文書を保存する

まず、Elasticsearchへ文書を保存する基本的な方法を説明します。

10.1.1 KibanaのDev Tools

文書の保存と検索のいずれも、ElasticsearchへのリクエストはJSONをHTTPで送信することで実行します。たとえばJSONファイルを編集して curl で送信できますが、この手順は試行錯誤するには不向きです。ここでは、KibanaのDev Toolsでリクエストを送信する方法を紹介します。これにより、JSONの編集とリクエストの送信を単一のUIで実行でき、また、リクエスト内容の自動補完を効かせられるというメリットがあります。

KibanaのWeb UIのポート番号はデフォルトでは5601です。本ハンズオンでは、KibanaのDockerコンテナの5601番ポートをローカルの5601番ポートにバインドしていますので、Dockerを実行している端末で次のURLにアクセスすればKibanaのWeb UIが表示されるはずです。

http://localhost:5601/ ...

Get 機械学習による検索ランキング改善ガイド ―技術解説とハンズオンで学ぶ機械学習ランキングモデルの導入と改善 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.