ベクター検索とは

完了

ベクトル検索は、検索インデックスからベクトル埋め込みをインデックス作成、格納、取得するために使用される AI 検索で利用できる新機能です。 これを使用すると、検索により強化した文章生成 (RAG) アーキテクチャ、類似性およびマルチモーダル検索、またはレコメンデーション エンジンを実装するアプリケーションを強化できます。

ベクトル検索のインデックス作成とクエリ ワークフローを次に図示します。

Diagram of the indexing and query workflows.

ベクトル クエリは、機械学習モデルによって生成されたコンテンツの数学的表現を提供することで、さまざまな種類のソース データ間で基準を一致させるために使用できます。 これにより、クエリの意図を使用して関連する結果を返すテキスト ベースの検索の制限が解消されます。

次にベクトル検索を使用すべきシナリオを示します。

  • OpenAI またはオープンソース モデルを使用してテキストをエンコードし、ベクトルとしてエンコードされたクエリを使用してドキュメントを取得します。
  • エンコードされた画像、テキスト、ビデオ、オーディオ、またはこれらの組み合わせ (マルチモーダル) で類似性検索を行います。
  • 多言語埋め込みモデルを使用してさまざまな言語でドキュメントを表し、すべての言語でドキュメントを検索できるようにします。
  • ベクトル検索はフィールド レベルで実装されるため、ベクトルおよび検索可能なテキスト フィールドから検索されるハイブリッドを構築します。 結果はマージされ、1 つの応答が返されます。
  • テキストおよび数値フィールドにフィルターを適用し、これをクエリに含めて、ベクトル検索で処理する必要があるデータを減らします。
  • ベクトル データベースを作成して、外部でナレッジ ベースを提供したり、長期メモリとして使用します。

制限事項

ベクトル検索を使用する場合、注意が必要な制限がいくつかあります。

  • Azure AI 検索ではコンテンツに対して埋め込みを生成しないため、Azure OpenAI または同様のオープンソース ソリューションを使用してこれらを提供する必要があります。
  • カスタマーマネージド キー (CMK) はサポートされていません。
  • ストレージには制限があるため、サービス クォータの提供内容を確認する必要があります。

Note

ドキュメントが大きい場合は、チャンクを検討してください。 詳細については、AI 検索でのベクトル検索ソリューション用の大きなドキュメントのチャンクに関するドキュメントを使用してください。