
5
埋め込みベクトルの次元数は1536であることがわかります。また、埋め込みベクトルは浮
動小数点数の配列であることがわかります。埋め込みベクトルはテキストの意味を表現するベ
クトルです。似た意味のテキスト同士は、その埋め込みベクトル同士も似たものになります。
埋め込みベクトルはテキスト間の類似度を計算するために使用されます。
5.6.4
ベクトルの保存
前項では分割したテキストを埋め込みベクトルに変換しました。次に、これらの埋め込みベ
クトルと元のテキストをベクトルストアに保存します。ベクトルストアは、埋め込みベクトル
を保存し、それに対して高速な類似検索を実現するためのインデックスを構築したデータベー
スです。LangChainでは、様々なベクトルストアを提供しています。表 5.6.4 に、LangChain
でサポートされている主要なベクトルストアを示します。
表5.6.4
ベクトルストア 概要
Chroma 高速で拡張性の高いオープンソースのベクトルデータベース。自己ホスト型とクラウドホスト型の
両方に対応
Pinecone フルマネージド型のベクトル検索サービス。高い拡張性と可用性を提供
Weaviate オープンソースのベクトル検索エンジン。ベクトル検索に特化したRESTful APIと GraphQLイン
タフェースを提供
FAISS Facebookが開発したオープンソースの類似検索ライブラリ。C ...