ベクトルデータベース

[アーティクル]
12/03/2024
適用対象:

✅ NoSQL, ✅ MongoDB vCore, ✅ PostgreSQL

ヒント

最新のベクトルデータベースおよび RAG パターンアプリのサンプルについては、新しいサンプルギャラリーのをご覧ください

ベクトルデータベースは、自然言語処理、動画と画像の認識、レコメンデーションシステム、検索など、分析および生成 AI のさまざまな領域や状況で使用されています。

2023 年に注目すべきソフトウェアのトレンドは AI の強化です。これは、多くの場合、既存の技術スタックに専用のスタンドアロンベクトルデータベースを組み込むことで実現します。この記事では、ベクトルデータベースとは何か説明するとともに、特にマルチモーダルデータを処理する場合に、既に使用している NoSQL データベースやリレーショナルデータベースに統合されたベクトルデータベースを使用する、別のアーキテクチャについても説明します。このアプローチにより、コストを削減できるだけでなく、データの整合性、スケーラビリティ、パフォーマンスを向上させることができます。

ヒント

データの整合性、スケーラビリティ、パフォーマンスはデータ集中型アプリケーションにとって非常に重要であるため、OpenAI は Azure Cosmos DB 上に ChatGPT サービスを構築することを選択しました。数ミリ秒 (1 桁台) の応答時間、自動および即時のスケーラビリティがもたらされ、あらゆるスケールで速度が保証されることに加え、統合されたベクトルデータベースも活用できます。実装サンプルを参照して、無料で試してみてください。

ベクトルデータベースとは

ベクトルデータベースは、高ディメンション空間におけるデータの数学的表現であるベクトル埋め込みを格納および管理するように設計されたデータベースです。この空間では、各ディメンションがデータの特徴に対応しており、高度なデータを表現するために数万ディメンションが使われる場合があります。この空間内のベクトルの位置は、その特性を表します。単語、フレーズ、ドキュメント全体、画像、オーディオ、その他の種類のデータはすべてベクトル化できます。これらのベクトル埋め込みは、類似性検索、マルチモーダル検索、レコメンデーションエンジン、大規模言語モデル (LLM) などで使われます。

ベクトルデータベースでは、埋め込みがインデックス化され、ベクトルの距離や類似性に基づいてベクトル検索アルゴリズムを通じてクエリが実行されます。最も関連性の高いデータを識別するには、堅牢なメカニズムが必要です。既知のベクトル検索アルゴリズムには、階層ナビゲーション可能な小さい世界 (HNSW)、反転ファイル (IVF)、DiskANN などがあります。

統合ベクトルデータベースと純粋なベクトルデータベース

ベクトルデータベースの実装には、純粋なベクトルデータベースと、NoSQL またはリレーショナルデータベースの統合ベクトルデータベースという 2 つの一般的な種類があります。

純粋なベクトルデータベースは、ベクトル埋め込みを少量のメタデータと共に効率的に格納して管理できるように設計されています。これは、埋め込みの派生元であるデータソースからは切り離されています。

高パフォーマンスの NoSQL またはリレーショナルデータベースに統合されたベクトルデータベースは、追加の機能を備えています。 NoSQL またはリレーショナルデータベースの統合ベクトルデータベースでは、対応する元のデータと共に埋め込みを保存し、インデックスを付けて、クエリを実行できます。この方法により、データを別の純粋なベクトルデータベースに複製する余分なコストがかかりません。さらに、ベクトル埋め込みと元のデータが一緒に保持されるため、マルチモーダルデータの操作が簡略化され、データの整合性、スケール、パフォーマンスを向上させることができます。スキーマの柔軟性と統合ベクトルデータベースを備えたパフォーマンスの高いデータベースは、AI エージェントにまさに最適です。

ベクトルデータベースのユースケース

ベクトルデータベースは、自然言語処理、動画と画像の認識、レコメンデーションシステム、検索など、分析および生成 AI のさまざまな領域や状況で使用されています。たとえば、ベクトルデータベースを使用して次のことを行うことができます。

コンテンツ、テーマ、センチメント、スタイルに基づく類似の画像、ドキュメント、楽曲の特定
特徴、機能、ユーザーグループに基づく類似製品の特定
個人の好みに基づいたコンテンツ、製品、サービスの推奨
ユーザーグループの類似性に基づいたコンテンツ、製品、サービスの推奨
複雑な要件を満たすための多くの選択肢の中からの最適な潜在オプションの特定
一般的なパターンや通常のパターンとは異なるデータの異常や不正なアクティビティの特定
AI エージェント向けの永続メモリの実装

ヒント

ベクトルデータベースのこれらの一般的なユースケースに加えて、Microsoft の統合ベクトルデータベースは、待ち時間の短縮、高スケーラビリティ、高可用性により、運用レベルの LLM キャッシュにも理想的なソリューションです。

LLM とカスタムデータまたはドメイン固有の情報を活用した取得拡張生成 (RAG) を可能にするために、ベクトルデータベースを使うことが特に一般になっています。このアプローチにより、次のことが可能になります。

AI モデルからユーザープロンプトに対するコンテキストに関連した正確な応答を生成する
LLM のトークン制限の克服
更新されるデータの頻繁な微調整によるコストを削減する

このプロセスには、カスタムデータソースからの関連情報の抽出と、その情報のプロンプトエンジニアリングを通したモデル要求への統合が含まれます。 LLM への要求の送信前に、ユーザーの入力/クエリ/要求も埋め込みに変換され、データベース内で最も類似した埋め込みを見つけるためにベクトル検索手法が適用されます。この手法により、データベース内の最も関連性の高いデータレコードを識別できます。これらの取得されたレコードはその後、プロンプトエンジニアリングを使用して LLM 要求への入力として提供されます。

埋め込み

埋め込みは、機械学習モデルとアルゴリズムで簡単に使用できる特別な形式のデータ表現です。埋め込みは、テキストの意味論的意味の情報密度の高い表現です。各埋め込みは浮動小数点数のベクトルであり、ベクトル空間内の 2 つの埋め込み間の距離は、元の形式の 2 つの入力間のセマンティック類似性と相関します。たとえば、2 つのテキストが似ている場合、それらのベクトル表現も似ているはずです。埋め込みを元のデータと共に格納できるベクトルデータベース拡張機能により、データの整合性、スケール、パフォーマンスが確保されます。 [戻る]

ベクトル検索

ベクトル検索は、プロパティフィールドの完全一致ではなく、データ特性に基づいて類似項目を検索するのに便利な方法です。この手法は、類似したテキストの検索、関連する画像の検索、おすすめ候補の作成、異常の検出などのアプリケーションで役立ちます。これは、Azure OpenAI Embeddings や Hugging Face on Azure などの埋め込み API を使い、機械学習モデルを使って作成したデータのベクトル表現 (数値の一覧) を取得することで機能します。次に、データベクトルとクエリベクトル間の距離を測定します。クエリベクトルに最も近いデータベクトルは、意味的に最も似ていると判明したものです。ネイティブベクトル検索機能を使うと、他のアプリケーションデータと共に高次元ベクトルデータの保存、インデックス付け、検索を直接行うための効率的な方法を実現できます。このアプローチは、データをコストの高い代替ベクトルデータベースに移行する必要をなくし、AI 駆動型アプリケーションのシームレスな統合を実現します。 [戻る]

プロンプトとプロンプトエンジニアリング

プロンプトは、LLM への命令、または LLM が構築できるコンテキストデータとして機能する特定のテキストまたは情報を指します。プロンプトは、質問、ステートメント、コードスニペットなど、さまざまな形式を取る可能性があります。プロンプトは次のように機能します。

命令: LLM に対しディレクティブを提供します
プライマリコンテンツ: 処理のために LLM に情報を提供します
例: 特定のタスクまたはプロセスにモデルを条件付けするのに役立ちます
キュー: LLM の出力を正しい方向に方向付けます
サポートコンテンツ: LLM が出力の生成に使用できる補足情報を表します

シナリオに適したプロンプトを作成するプロセスは、プロンプトエンジニアリングと呼ばれます。プロンプトエンジニアリングのプロンプトとベストプラクティスの詳細については、Azure OpenAI Service のプロンプトエンジニアリング手法に関する記事を参照してください。 [戻る]

トークン

トークンは、入力テキストをより小さなセグメントに分割することによって生成されるテキストの小さなチャンクです。これらのセグメントは、単語、または、1 文字から単語全体までの異なる長さを持つ文字のグループから成ります。たとえば、hamburger という単語は、ham、bur、ger などのトークンに分割され、pear のような短くて一般的な単語は 1 つのトークンと見なされます。 ChatGPT、GPT-3.5、GPT-4 などの LLM は、処理のために単語を複数のトークンに分割します。 [戻る]

取得拡張生成

取得拡張生成 (RAG) は、ベクトルデータベースに格納されているものなど、グラウンディングデータを提供するベクトル検索のような情報取得システムを追加することによって、ChatGPT、GPT-3.5、または GPT-4 などの LLM の機能を拡張するアーキテクチャです。このアプローチにより、LLM は、ベクトル化されたドキュメント、画像、オーディオ、動画などから取得したカスタムデータに基づいて、コンテキストに関連した正確な応答を生成できます。

Azure Cosmos DB for NoSQL を使う単純な RAG パターンは次のようになります。

Azure Cosmos DB for NoSQL ベクトルインデックスプレビューに登録する
コンテナーベクトルポリシーとベクトルインデックスを使って、データベースとコンテナーを設定します。
Azure Cosmos DB for NoSQL データベースとコンテナーにデータを挿入します
Azure OpenAI Embeddings を使ってデータプロパティから埋め込みを作成します
Azure Cosmos DB for NoSQL をリンクします。
埋め込みプロパティに対してベクトルインデックスを作成します
ユーザープロンプトに基づいてベクトル類似性検索を実行する関数を作成します
Azure OpenAI Completions モデルを使用してデータに対する質問の回答を行う

RAG パターンは、プロンプトエンジニアリングを使用して、モデルにより多くのコンテキスト情報を提供することで応答品質を向上させる役割を果たします。 RAG を使用することで、関連する外部ソースを生成プロセスに組み込むことで、モデルがより広範なナレッジベースを適用できるため、より包括的で情報に基づいた応答が得られます。 LLM の "グラウンディング" の詳細については、「LLM のグラウンディング」を参照してください。 [戻る]

統合ベクトルデータベースの機能を使用して、データに RAG を実装する複数の方法を次に示します。

統合ベクトルデータベース機能の実装方法

次の Azure Cosmos DB API に統合ベクトルデータベース機能を実装できます。

NoSQL API

Azure Cosmos DB for NoSQL は、世界初のサーバーレス NoSQL ベクトルデータベースです。統合ベクトルデータベース機能を備えた Azure Cosmos DB for NoSQL に、ベクトルとデータをまとめて格納します。そこでは、Microsoft Research によって開発されたハイパフォーマンスのベクトルインデックス作成アルゴリズムのスイートである DiskANN を基にして、ベクトルインデックスを作成できます。

DiskANN を使うと、99.999% の SLA (HA 対応)、geo レプリケーション、サーバーレスからプロビジョニングされたスループット (RU) へのシームレスな移行など、Azure Cosmos DB for NoSQL のすべてのベネフィットを 1 つのデータストアで活用しながら、規模に関わらず高精度で低遅延のクエリを実行できます。

リンクとサンプル

Azure Cosmos DB for MongoDB

他のアプリケーションデータと共に高次元ベクトルデータの保存、インデックス付け、検索を直接行うための効率的な方法を提供する Azure Cosmos DB for MongoDB (仮想コアアーキテクチャ) にネイティブに統合されたベクトルデータベースを使用します。このアプローチは、データをコストの高い代替ベクトルデータベースに移行する必要をなくし、AI 駆動型アプリケーションのシームレスな統合を実現します。

コードサンプル

Azure Cosmos DB for MongoDB の有効期間 Free レベルを使用する

PostgreSQL 用 API

他のアプリケーションデータと共に高次元ベクトルデータの保存、インデックス付け、検索を直接行うための効率的な方法を提供する Azure Cosmos DB for PostgreSQL にネイティブに統合されたベクトルデータベースを使用します。このアプローチは、データをコストの高い代替ベクトルデータベースに移行する必要をなくし、AI 駆動型アプリケーションのシームレスな統合を実現します。

コードサンプル

Python: Python ノートブックのチュートリアル - 食品レビューチャットボット

ベクトルデータベースソリューション

Azure PostGreSQL サーバー pgvector 拡張機能

次のステップ

Azure Cosmos DB の有効期間無料レベルを使用する

次の方法で共有

ベクトルデータベース

ベクトルデータベースとは

統合ベクトルデータベースと純粋なベクトルデータベース

ベクトルデータベースのユースケース

埋め込み

ベクトル検索

プロンプトとプロンプトエンジニアリング

トークン

取得拡張生成

統合ベクトルデータベース機能の実装方法

NoSQL API

リンクとサンプル

Azure Cosmos DB for MongoDB

コードサンプル

PostgreSQL 用 API

コードサンプル

ベクトルデータベースソリューション

次のステップ

フィードバック

その他のリソース

次の方法で共有

ベクトル データベース

ベクトル データベースとは

統合ベクトル データベースと純粋なベクトル データベース

ベクトル データベースのユース ケース

ベクトル データベース関連の概念

埋め込み

ベクトル検索

プロンプトとプロンプト エンジニアリング

トークン

取得拡張生成

統合ベクトル データベース機能の実装方法

NoSQL API

リンクとサンプル

Azure Cosmos DB for MongoDB

コード サンプル

PostgreSQL 用 API

コード サンプル

ベクトル データベース ソリューション

関連するコンテンツ

次のステップ

フィードバック

その他のリソース

ベクトルデータベース

ベクトルデータベースとは

統合ベクトルデータベースと純粋なベクトルデータベース

ベクトルデータベースのユースケース

ベクトルデータベース関連の概念

プロンプトとプロンプトエンジニアリング

統合ベクトルデータベース機能の実装方法

コードサンプル

コードサンプル

ベクトルデータベースソリューション