Mosaic AI ベクトル検索

この記事では、モザイク AI ベクター検索の概要と、そのしくみについて説明します。

Mosaic AI ベクトル検索とは

モザイク AI ベクター検索は、Databricks データインテリジェンスプラットフォームに組み込まれており、そのガバナンスおよび生産性ツールと統合されたベクター検索ソリューションです。ベクター検索は、埋め込みを取得するために最適化された検索の一種です。埋め込みとは、データ (通常はテキストまたは画像データ) のセマンティックコンテンツの数学的表現です。埋め込みは大規模な言語モデルによって生成され、互いに似たドキュメントや画像の検索に依存する多くの生成 AI アプリケーションの重要なコンポーネントです。たとえば、RAG システム、レコメンダーシステム、画像および動画認識などがあります。

モザイク AI ベクター検索では、Delta テーブルからベクター検索インデックスを作成します。インデックスには、メタデータを含む埋め込みデータが含まれます。続いて REST API を使用してインデックスでクエリを実行し、最も類似したベクトルを特定して、関連するドキュメントを返すことができます。基になる Delta テーブルが更新されたときに自動的に同期するようにインデックスを構成できます。

Mosaic AI ベクトル検索では、次の機能がサポートされます。

ハイブリッドキーワード類似性検索。
任意のエンドポイントでのフルテキストキーワード検索 (ベータ)、またはストレージ最適化エンドポイントでの専用のフルテキストインデックス (ベータ)。
フィルター処理。
Reranking。
ベクター検索エンドポイントを管理するためのアクセス制御リスト (ACL)。
選択した列のみを同期します。
生成された埋め込みを保存して同期します。

Mosaic AI Vector検索の仕組み

モザイク AI ベクター検索では、近似最近傍 (ANN) 検索と L2 距離メトリックに対して階層ナビゲーション可能なスモールワールド (HNSW) アルゴリズムを使用して、埋め込みベクターの類似性を測定するために使用します。コサイン類似度を使用する場合は、ベクトル検索にフィードする前にデータポイント埋め込みを正規化することが必要です。データポイントが正規化されると、L2 距離が生成するランク付けは、コサイン類似度が生成するランク付けと同じになります。

Mosaic AI ベクトル検索では、ベクトルベースの埋め込み検索と従来のキーワードベースの検索手法を組み合わせたハイブリッドキーワード類似性検索もサポートされています。この手法は、クエリ内の正確な単語と一致させると同時に、ベクトルベースの類似性検索を使用して、クエリのセマンティックリレーションシップとコンテキストをキャプチャします。

ハイブリッドキーワード類似性検索では、これら 2 つの手法を統合することで、正確なキーワードだけでなく、概念的に似ているものも含まれるドキュメントを取得し、より包括的で関連性の高い検索結果を提供します。この方法は、ソースデータに SKU や識別子などの一意のキーワードがあり、純粋な類似性検索に適していない RAG アプリケーションで特に便利です。

API の詳細については、Python SDK リファレンスおよび Query a vector search index を参照してください。

類似性検索の計算

類似性検索の計算では、次の式を使用します。

1 に距離の 2 乗を加えたものの逆数

ここで dist は、クエリ q とインデックスエントリ x間のユークリッド距離です。

ユークリッド距離、二乗差の和の平方根

キーワード検索アルゴリズム

関連性スコアは、Okapi BM25 を使用して計算されます。ソーステキストの埋め込みと、テキストまたは文字列形式のメタデータ列を含め、すべてのテキストまたは文字列列が検索されます。トークン化関数は、単語の境界で分割し、句読点を削除し、すべてのテキストを小文字に変換します。

類似性検索とキーワード検索を組み合わせるには

類似性検索とキーワード検索結果は、Reciprocal Rank Fusion (RRF) 関数を使用して組み合わせることができます。

RRF はまず、各メソッドのスコアを利用して各ドキュメントを再評価します。

ANN の RRF 方程式

キーワード検索の RRF 数式

rrf_param は、上位と下位のドキュメントの相対的な重要度を制御します。文献に基づいて、 rrf_param は60に設定されている。

スコアは、次の正規化係数を使用して、可能な限り最高のスコアが 1 になるように正規化されます。

正常化

各ドキュメントの最終スコアは次のように計算されます。

最終スコア

最終スコアが最も高いドキュメントが返されます。

ベクトル埋め込みを提供するためのオプション

Databricks でベクター検索インデックスを作成するには、まずベクター埋め込みを提供する方法を決定する必要があります。 Databricks では、3 つのオプションがサポートされています。

オプション 1: Databricks によって計算された埋め込みを使ったデルタ同期インデックス

このオプションでは、テキスト形式のデータを含むソース Delta テーブルを指定します。 Databricks は、指定したモデルを使用して埋め込みを計算し、必要に応じて Unity カタログのテーブルに埋め込みを保存します。 Delta テーブルが更新されると、インデックスは Delta テーブルと同期されます。

次の図にこのプロセスを示します。

クエリの埋め込みを計算します。クエリにはメタデータフィルターを含めることができます。
類似性検索を実行して、最も関連性の高いドキュメントを特定します。
最も関連性の高いドキュメントを返し、それをクエリに追加します。

ベクター検索インデックス、Databricks は埋め込みを計算します

オプション 2: 自己管理型埋め込みを使用した差分同期インデックス

このオプションでは、事前計算された埋め込みを含むソース Delta テーブルを指定します。 Delta テーブルが更新されると、インデックスは Delta テーブルと同期されます。

注

自己管理型埋め込みインデックスを Databricks マネージドインデックスに変換することはできません。後でマネージド埋め込みを使用する場合は、新しいインデックスを作成し、埋め込みを再計算する必要があります。

次の図にこのプロセスを示します。

クエリは埋め込みで構成され、メタデータフィルターを含めることができます。
類似性検索を実行して、最も関連性の高いドキュメントを特定します。最も関連性の高いドキュメントを返し、それをクエリに追加します。

ベクター検索インデックス, 事前計算された埋め込み

オプション 3: 直接ベクターアクセスインデックス

このオプションでは、埋め込みテーブルが変更されたときに REST API を使用してインデックスを手動で更新する必要があります。

次の図にこのプロセスを示します。

ベクター検索インデックス、自動同期なしの事前計算済み埋め込み

オプション 4: ストレージ最適化エンドポイントでのフルテキスト検索インデックス (ベータ)

このオプションでは、列を埋め込まずに、ストレージ最適化エンドポイントに差分同期インデックスを作成します。インデックスでは、ベクター埋め込みを必要とせずに、BM25 スコアリングを使用したキーワードベースのフルテキスト検索がサポートされます。これは、テキストデータ内の正確な用語、識別子、またはキーワードを検索する場合に便利です。

注

query_type="FULL_TEXT"を使用して、標準エンドポイントとストレージ最適化エンドポイントの両方で既存のベクター検索インデックスに対してキーワード検索を実行することもできます。このオプションは、埋め込みをまったく含まない専用インデックスを作成するためのオプションです。

専用のフルテキスト検索インデックスは、ストレージ最適化エンドポイントでのみ使用でき、トリガーされた同期モードが必要です。手順については、フルテキスト検索インデックス (ベータ) の作成を参照してください。

エンドポイントオプション

モザイク AI ベクター検索には次のオプションが用意されているため、アプリケーションのニーズを満たすエンドポイント構成を選択できます。

注

ストレージ最適化エンドポイントはパブリックプレビュー段階です。高い QPS はベータ版であり、標準エンドポイントでのみ使用できます。

標準エンドポイントの容量は、ディメンション 768 で 3 億 2,000 万ベクトルです。
- 標準エンドポイントでは、高い QPS を使用して、高い持続的スループットをサポートできます。 QPS (ベータ) が高いエンドポイントのスループットをスケーリングする方法について参照してください。
ストレージ最適化 エンドポイントの容量は大きく (ディメンション 768 で 10 億ベクトルを超えています)、インデックス作成が 10 ~ 20 倍高速化されます。ストレージ最適化エンドポイントに対するクエリの待機時間は、約 250 ミリ秒で若干増加します。このオプションの価格は、ベクターの数が多い場合に最適化されています。価格の詳細については、ベクター検索の価格に関するページを参照してください。ベクター検索コストの管理については、ベクター検索コスト管理ガイドを参照してください。

エンドポイントの種類は、エンドポイントの作成時に指定します。

ストレージ最適化エンドポイントの制限事項も参照してください。

モザイク AI ベクター検索を設定する方法

Mosaic AI ベクトル検索を使用するには、以下のものを作成することが必要です。

ベクトル検索エンドポイント。このエンドポイントは、ベクトル検索インデックスを提供します。 REST API または SDK を使用して、エンドポイントのクエリと更新を行うことができます。手順については、「ベクター検索エンドポイントの作成」を参照してください。

エンドポイントは、インデックスのサイズや同時要求の数をサポートするように、自動的にスケールアップされます。インデックスが削除されると、エンドポイントは自動的にスケールダウンされます。
ベクトル検索インデックス。ベクター検索インデックスは Delta テーブルから作成され、リアルタイムの近似最近隣 (ANN) 検索を提供するように最適化されています。検索の目的は、クエリと類似したドキュメントを特定することです。ベクター検索インデックスは Unity カタログに表示され、管理されます。手順については、ベクター検索インデックスの作成を参照してください。

さらに、Databricks で埋め込みを計算することを選択した場合、事前に構成した Foundation Model API エンドポイントを使用するか、モデル提供エンドポイントを作成して任意の埋め込みモデルとすることができます。手順については、トークンごとの支払い基盤モデル API またはエンドポイントを提供する基盤モデルの作成に関する記事を参照してください。

モデルサービスエンドポイントのクエリを実行するには、REST API または Python SDK を使用します。クエリでは、Delta テーブル内の任意の列に基づいてフィルターを定義できます。詳細については、「クエリのフィルターの使用、API リファレンス、または Python SDK リファレンスを参照してください。

Requirements

Unity Catalog 対応ワークスペース。
サーバーレスコンピューティングが有効になっている。手順については、「サーバーレスコンピューティングに接続する」を参照してください。
標準エンドポイントの場合、ソーステーブルで Change Data Feed が有効になっている必要があります。「Azure Databricks で Delta Lake 変更データフィードを使用するを参照してください。」
ベクター検索インデックスを作成するには、インデックスが作成されるカタログスキーマに対する CREATE TABLE 権限が必要です。

ベクター検索エンドポイントを作成および管理するためのアクセス許可は、アクセス制御リストを使用して構成されます。ベクター検索エンドポイント ACL を参照してください。

データ保護と認証

Databricks では、データを保護するために次のセキュリティ制御が実装されています。

Mosaic AI ベクトル検索に対するすべてのカスタマーリクエストは、論理的に分離、認証、認可されます。
Mosaic AI ベクトル検索では、すべての保存データ (AES-256) と転送中のデータ (TLS 1.2+) が暗号化されます。

Mosaic AI Vector Search では、サービスプリンシパルと個人用アクセストークン (AT) の 2 つの認証モードがサポートされています。運用アプリケーションの場合、Databricks では、個人アクセストークンに対して最大 100 ミリ秒のクエリごとのパフォーマンスを実現できるサービスプリンシパルを使用することをお勧めします。

サービスプリンシパルトークン。管理者はサービスプリンシパルトークンを生成し、それを SDK または API に渡すことができます。「サービスプリンシパルの使用」を参照してください。運用環境のユースケースの場合、Databricks ではサービスプリンシパルトークンの使用が推奨されます。
```
# Pass in a service principal
vsc = VectorSearchClient(workspace_url="...",
        service_principal_client_id="...",
        service_principal_client_secret="..."
        )
```
個人用アクセストークン。個人用アクセストークンを使用して、モザイク AI ベクター検索で認証できます。個人用アクセス認証トークンを参照してください。ノートブック環境で SDK を使用する場合、SDK によって認証用の PAT トークンが自動的に生成されます。
```
# Pass in the PAT token
client = VectorSearchClient(workspace_url="...", personal_access_token="...")
```

カスタマーマネージドキー (CMK) は、2024 年 5 月 8 日以降に作成されたエンドポイントでサポートされます。

使用状況とコストの監視

ベクター検索インデックスとエンドポイントに関連する使用状況とコストの監視については、ベクター検索コスト管理ガイドを参照してください。

予算ポリシーで使用状況を照会することもできます。ベクター検索の予算ポリシーを参照してください。

リソースとデータサイズの制限

次の表は、ベクター検索エンドポイントとインデックスのリソースとデータサイズの制限をまとめたものです。

Resource	粒度	極限
ベクトル検索エンドポイント	ワークスペースごと	500
埋め込み（デルタ同期インデックス）	標準エンドポイント単位	768 埋め込みディメンションでは ~ 320,000,000 1536 埋め込みディメンションでは ~ 160,000,000 埋め込み寸法が 3072 の場合、約 80,000,000 になります (ほぼ直線的に拡大縮小)
埋め込み（ダイレクトベクターアクセス索引）	標準エンドポイント単位	768 埋め込みディメンションでは ~ 2,000,000
埋め込み (ストレージ最適化エンドポイント)	ストレージ最適化エンドポイントごと	768 埋め込みディメンションでは ~ 1,000,000,000
埋め込みディメンション	インデックス単位	4096
Indexes	エンドポイントあたり	50
列	インデックス単位	50
列		サポートされている型: Bytes、short、integer、long、float、double、boolean、string、timestamp、date、array
メタデータフィールド	インデックス単位	50
インデックス名	インデックス単位	128 文字

ベクター検索インデックスの作成と更新には、次の制限が適用されます。

Resource	粒度	極限
差分同期インデックスの行サイズ	インデックス単位	100KB
差分同期インデックスの埋め込みソース列のサイズ	インデックス単位	32764 バイト
Direct Vector インデックスにおける一括アップサート要求のサイズ制限	インデックス単位	10 MB
直接ベクターインデックスの一括削除要求サイズの制限	インデックス単位	10 MB

クエリ API には、次の制限が適用されます。

Resource	粒度	極限
クエリテキストの長さ	クエリ単位	32764 文字
ハイブリッド検索を使用する場合のトークン	クエリ単位	1024 文字または 2 バイト文字
フィルター条件	フィルター条件ごと	1024 個の要素
返される結果の最大数 (近似最近隣検索)	クエリ単位	10,000
返される結果の最大数 (ハイブリッドキーワード類似性検索)	クエリ単位	200
返される結果の最大数 (フルテキスト検索)	クエリ単位	200
応答サイズ	クエリ単位	10 MB

制限事項

列名 _id は予約されています。ソーステーブルに _id という名前の列がある場合は、ベクター検索インデックスを作成する前に名前を変更します。
行レベルと列レベルのアクセス許可はサポートされていません。ただし、フィルター API を使用して独自のアプリケーションレベルの ACL を実装することができます。
別のワークスペースにインデックスを複製することはできません。 Databricks SDK または REST API を使用して、ワークスペース間の要求を行うことができます。
インデックスの容量は、インデックス作成時のソーステーブルのサイズに基づいてプロビジョニングされます。小さいソーステーブルから始めると、インデックスのサイズが制限され、容量不足エラーが発生する可能性があるため、インデックスを作成する前に、予想されるデータボリュームに合わせてソーステーブルのサイズを変更します。

ストレージ最適化エンドポイントの制限事項

このセクションの制限は、ストレージ最適化エンドポイントにのみ適用されます。ストレージ最適化エンドポイントはパブリックプレビュー段階です。

継続的同期モードはサポートされていません。
同期する列はサポートされていません。
埋め込みディメンションは 16 で割り切れる必要があります。
増分更新は部分的にサポートされています。すべての同期では、ベクター検索インデックスの一部を再構築する必要があります。
- マネージドインデックスの場合、ソース行が変更されていない場合、以前に計算された埋め込みはすべて再利用されます。
- 標準エンドポイントと比較して、同期に必要な時間の大幅なエンドツーエンドの短縮を予測する必要があります。 10 億個の埋め込みがあるデータセットは、8 時間以内に同期を完了する必要があります。データセットが小さいほど、同期にかかる時間が短くなります。
FedRAMP 準拠のワークスペースはサポートされていません。
カスタマーマネージドキー (CMK) はサポートされていません。
マネージド差分同期インデックスにカスタム埋め込みモデルを使用するには、カスタムモデルと外部モデルのプレビューに対する AI クエリを有効にする必要があります。プレビューを有効にする方法については、「Manage Azure Databricks previews を参照してください。
ストレージ最適化エンドポイントは、最大 10 億個の 768 次元のベクター埋め込みをサポートします。大規模なユースケースがある場合は、アカウントチームにお問い合わせください。

その他のリソース

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-29

Mosaic AI ベクトル検索