チュートリアル: Azure AI 検索で RAG 用の埋め込みとチャットのモデルを選択する

[アーティクル]
12/18/2024

Azure AI 検索上に構築された RAG ソリューションは、ベクトル化のための埋め込みモデルと、データに対する会話型検索のためのチャットモデルに依存します。

このチュートリアルでは、次の作業を行いました。

Azure クラウドのどのモデルが組み込みの統合で機能するかについて学習する
チャットに使用される Azure モデルについて学習する
モデルをデプロイし、コードのモデル情報を収集する
Azure モデルへの検索エンジンのアクセスを構成する
非 Azure モデルをアタッチするためのカスタムスキルとベクタライザーについて学習する

Azure サブスクリプションをお持ちでない場合は、開始する前に無料アカウントを作成してください。

前提条件

Azure portal。モデルをデプロイし、Azure クラウドでロールの割り当てを構成するために使用されます。
Azure サブスクリプションの所有者またはユーザーアクセス管理者のロール。ロールの割り当てを作成するために必要です。このチュートリアルでは、少なくとも 3 つの Azure リソースを使用します。接続は Microsoft Entra ID を使用して認証されます。これには、ロールを作成する機能が必要です。モデルに接続するためのロールの割り当てについては、この記事に説明されています。ロールを作成できない場合は、代わりに API キーを使用できます。
Azure OpenAI、Azure AI サービスマルチサービスリソース経由の Azure AI Vision、Azure AI Foundry などのモデルプロバイダー。

このチュートリアルでは Azure OpenAI を使用します。垂直統合のオプションを理解できるように、他のプロバイダーも紹介します。
Azure AI 検索の Basic レベル以上では、ロールの割り当てに使用されるマネージド ID が用意されています。
共有リージョン。このシリーズのすべてのチュートリアルを完了するには、リージョンが Azure AI 検索とモデルプロバイダーの両方をサポートしている必要があります。以下のサポートされているリージョンを参照してください。
- Azure OpenAI のリージョン
- Azure AI Vision のリージョン
- Azure AI Foundry リージョン。
現在、Azure AI 検索は一部のリージョンで可用性が制限されています。リージョンの状態を確認するには、「Azure AI 検索のリージョン一覧」を参照してください。

ヒント

重複するリージョンの一覧については、こちらの記事を参照してください。

組み込みベクトル化をサポートするモデルを確認する

コンテンツをベクトル化すると、RAG ソリューションのクエリ結果を改良できます。 Azure AI 検索は、インデックス作成パイプラインでの組み込みのベクトル化アクションをサポートしています。また、クエリ時のベクトル化もサポートしており、テキストまたは画像入力をベクトル検索のために埋め込みに変換します。この手順では、コンテンツとクエリに適した埋め込みモデルを特定します。生のベクトルデータと生のベクトルクエリを用意している場合、または RAG ソリューションにベクトルデータが含まれていない場合は、この手順をスキップします。

テキストからベクトルへの変換手順を含むベクトルクエリでは、インデックス作成時に使用したのと同じ埋め込みモデルを使用する必要があります。異なるモデルを使用しても検索エンジンはエラーをスローしませんが、得られる結果は低質になります。

同じモデルという要件を満たすには、インデックス作成時には "スキル" を使用して、クエリ実行時には "ベクタライザー" を使用して参照できる埋め込みモデルを選択します。スキルとベクタライザーのペアを次の表に示します。埋め込みモデルの使用方法を確認するには、インデックスパイプラインの作成に関するページに進み、埋め込みスキルと一致するベクタライザーを呼び出すコードを参照してください。

Azure AI 検索は、Azure クラウド内の次の埋め込みモデルに対応するスキルとベクタライザーをサポートしています。

クライアント	埋め込みモデル	スキル	ベクトライザー
Azure OpenAI	text-embedding-ada-002、 text-embedding-3-large、 text-embedding-3-small	AzureOpenAIEmbedding	AzureOpenAIEmbedding
Azure AI Vision	multimodal 4.0 ¹	AzureAIVision	AzureAIVision
Azure AI Foundry のモデルカタログ	Facebook-DinoV2-Image-Embeddings-ViT-Base、 Facebook-DinoV2-Image-Embeddings-ViT-Giant、 Cohere-embed-v3-english、 Cohere-embed-v3-multilingual	AML²	Azure AI Foundry のモデルカタログ

¹ 画像とテキストのベクトル化をサポートします。

² モデルカタログにデプロイされたモデルには、AML エンドポイント経由でアクセスされます。この接続には、既存の AML スキルを使用します。

ここに記載されていない他のモデルも使用できます。詳細については、この記事の「埋め込みに Azure 以外のモデルを使用する」を参照してください。

Note

通常、埋め込みモデルへの入力はチャンク化されたデータです。 Azure AI 検索の RAG パターンでは、チャンクはインデクサーパイプラインで処理されます。これについては、このシリーズの別のチュートリアルで説明されています。

クエリ時に生成 AI に使用されるモデルを確認する

Azure AI 検索にはチャットモデル用の統合コードがないため、自分が使い慣れていて要件を満たす LLM を選択する必要があります。インデックスをリビルドしたり、インデックス作成パイプラインの一部を再実行したりすることなく、クエリコードを変更してさまざまなモデルを試すことができます。チャットモデルを呼び出すコードについては、「回答の検索と生成」を参照してください。

一般的に、チャット検索エクスペリエンスには次のモデルが使用されます。

クライアント	チャットモデル
Azure OpenAI	GPT-35-Turbo、 GPT-4、 GPT-4o、 GPT-4 Turbo

GPT-35-Turbo および GPT-4 モデルは、会話形式の入力を処理するように最適化されています。

このチュートリアルでは GPT-4o を使用します。テスト時に、所有しているトレーニングデータでは補完できる可能性が低いことがわかりました。たとえば、"地球の表面積の何割が水で覆われていいますか?" という質問に対して、GPT-35-Turbo は、サンプルデータはその事実を提供していないにもかかわらず、組み込みの地球に関する知識を使用して、地球の 71% が水で覆われていると回答しました。対照的に、GPT-4o は "わかりません" と (正しく) 回答しました。

モデルをデプロイして情報を収集する

モデルは、デプロイして、エンドポイント経由でアクセスできるようにする必要があります。埋め込み関連のスキルとベクタライザーの両方に、ディメンション数とモデル名が必要です。

このチュートリアルシリーズでは、次のモデルとモデルプロバイダーを使用します。

埋め込み用には Azure OpenAI 上の Text-embedding-3-large
チャット補完用には Azure OpenAI 上の GPT-4o

Azure OpenAI にモデルをデプロイするには、Cognitive Services OpenAI 共同作成者以上が必要です。

Azure AI Foundry に移動します。
左側のメニューで [デプロイ] を選択します。
[モデルをデプロイします]>[基本モデルのデプロイ] を選択します。
ドロップダウンリストから text-embedding-3-large を選択し、選択を確定します。
デプロイ名を指定します。 "text-embedding-3-large" をお勧めします。
既定値を受け入れます。
[デプロイ] を選択します。
gpt-4o について前の手順を繰り返します。
モデル名とエンドポイントをメモしておきます。完全なエンドポイントは埋め込みスキルとベクタライザーによって内部で組み立てられるため、必要なのはリソース URI だけです。たとえば、https://MY-FAKE-ACCOUNT.openai.azure.com/openai/deployments/text-embedding-3-large/embeddings?api-version=2024-06-01 の場合、スキルとベクタライザーの定義で指定する必要があるエンドポイントは https://MY-FAKE-ACCOUNT.openai.azure.com です。

Azure モデルへの検索エンジンのアクセスを構成する

パイプラインとクエリの実行の場合、このチュートリアルでは、認証には Microsoft Entra ID を、認可にはロールを使用します。

Azure OpenAI 上で自分自身と検索サービス ID のアクセス許可を割り当てます。このチュートリアルのコードはローカルで実行されます。 Azure OpenAI への要求は、お使いのシステムから送信されます。また、検索エンジンからの検索結果は Azure OpenAI に渡されます。このような理由から、ユーザーと検索サービスの両方に Azure OpenAI に対するアクセス許可が必要です。

Azure portal にサインインし、ご利用の検索サービスを探します。
システムマネージド ID を使用するように Azure AI 検索を構成します。
Azure OpenAI リソースを見つけます。
左メニューで [アクセス制御 (IAM)] を選択します。
[ロールの割り当ての追加] を選択します。
[Cognitive Services OpenAI ユーザー] を選択します。
[マネージド ID] を選択し、次に [メンバー] を選択します。ドロップダウンリストで、検索サービスのシステムマネージド ID を見つけます。
次に、[ユーザー、グループ、またはサービスプリンシパル] を選択して、[メンバー] を選択します。ユーザーアカウントを検索し、ドロップダウンリストから選択します。
ロールに 2 つのセキュリティプリンシパルが割り当てられていることを確認します。
[確認と割り当て] を選択して、ロールの割り当てを作成します。

Azure AI Vision のモデルにアクセスするには、Cognitive Services OpenAI ユーザーを割り当てます。 Azure AI Foundry の場合は、Azure AI 開発者を割り当てます。

埋め込みに Azure 以外のモデルを使用する

埋め込みモデルを統合するパターンは、それをカスタムスキルとカスタムベクタライザーでラップすることです。このセクションでは、参照記事のリンクを紹介します。 Azure 以外のモデルを呼び出すコード例については、custom-embeddings デモのページを参照してください。

クライアント	埋め込みモデル	スキル	ベクトライザー
Any	Any	カスタムスキル	カスタムベクタライザー

次のステップ

インデックスを設計する

次の方法で共有