Azure AI 検索は、データを AI に接続する、フル マネージドのクラウドホスト型サービスです。 このサービスでは、企業および Web コンテンツへのアクセスが統合されるため、エージェントと LLM はコンテキスト、チャット履歴、マルチソースシグナルを使用して、信頼性の高い、根拠のある回答を生成できます。
Azure AI 検索は、次の 2 つの価格モデルで利用できます。
専用: 固定価格でプロビジョニングされた容量。 サービス レベルを選択すると、検索ユニット (SU) に基づいて 1 時間あたりに課金されます。 安定した予測可能で使用率の高いワークロードに最適です。
サーバーレス (プレビュー):インデックス付きストレージのコンピューティング ユニット/時間 (CU/時間) および GB/月単位で測定される使用量ベースの価格。 頻度の低い、バースト性の高い、または非常に変動の多いワークロードに最適です。
Important
サーバーレス開発者レベルは現在プレビュー段階です。 このプレビュー版はサービス レベル アグリーメントなしで提供されています。運用環境のワークロードに使用することはお勧めできません。 特定の機能がサポートされていないか、機能が制限されている可能性があります。 詳細については、「 Microsoft Azure プレビューの追加使用条件」を参照してください。
プレビュー期間中、サーバーレス開発者レベルの課金はまだ有効になっていません。 使用量の見積もりコストは、Azure ポータルとテレメトリで利用できますが、この初期期間中、その使用量はAzureの請求書には表示されません。 Microsoftは、請求が開始される少なくとも 30 日前に通知されます。 このプレビュー期間中の課金の延期は一時的なものです。 サーバーレス開発者は有料レベルであり、課金が開始された後に発生した料金に対して責任を負います。
サーバーレス開発者レベルでは、他の価格レベルとの間の移行はサポートされていません。また、他のレベルで使用できる一部の機能は、パブリック プレビュー中はサポートされていません。 サービスの制限、サポートされている機能、および価格の詳細は、一般公開前に変更される可能性があります。
プレビューは現在、米国中西部、スイス北部、東日本でのみ利用できます。
一般的なユース ケースには、エージェント検索を使用した従来の検索と取得拡張生成 (RAG) が含まれます。この場合、サービスはクエリの計画、取得、応答の構築を調整します。 これらの機能は、従来の検索エクスペリエンスから、企業とコンシューマーの両方のシナリオに適した AI を利用したエージェントやチャット アプリケーションまで、さまざまなシナリオをサポートします。
検索サービスを作成すると、次の機能が含まれます。
- 2 つのエンジン: 単一要求の クラシック検索 と、並列、反復的、LLM 支援検索のための エージェント検索 。
- ローカル (インデックス付き) およびリモート コンテンツに対するフルテキスト クエリ、ベクター クエリ、ハイブリッド クエリ、マルチモーダル クエリ。
- チャンク、ベクター化、その他の方法で生コンテンツを検索できるようにする AI エンリッチメント。
- 意図の照合と結果の品質を向上させるための関連性チューニング。
- Azureスケール、セキュリティ、監視、コンプライアンス。
- Azureとの統合には、サポートされているデータプラットフォーム、Azure OpenAI、Microsoft Foundryが含まれます。
Azure AI 検索を使用する理由
コンテキストに対応した正確な応答を得るための、独自、エンタープライズ、または Web データ内の地上エージェントとチャットボット。
Azure Blob Storage、Azure Cosmos DB、Microsoft SharePoint、Microsoft OneLake、およびその他のサポートされているデータ ソースからデータにアクセスします。 鮮度、待機時間、コンプライアンスのニーズに基づいて、インデックス付きアクセスまたはリモート アクセスを選択します。
チャンク、埋め込み、LLM 支援変換を実行するスキルを使用して、インデックス作成またはクエリ時にコンテンツを強化および構造化します。
フルテキスト検索とベクター検索 (ハイブリッド検索) を組み合わせて、精度と再現率のバランスを取ります。
単一のマルチモーダル パイプライン内のテキストと画像の両方を含むコンテンツをクエリします。
関連性チューニング、ファセット ナビゲーション、フィルター (地理空間検索を含む)、シノニム マッピング、オートコンプリートなど、検索関連の機能を簡単に実装できます。
Microsoft Entra、Azure Private Link、ドキュメント レベルのアクセス制御、ロールベースのアクセスを通じて、エンタープライズ セキュリティ、アクセス制御、コンプライアンスを提供します。
Azure信頼性、監視と診断 (ログ、メトリック、アラート)、自動化のための REST API または SDK ツールを使用して、運用環境でスケーリングと運用を行います。
メモ
サーバーレス価格モデルでは、スケーリングはサービスによって自動的に処理されます。 レプリカとパーティションを構成する専用モデルとは異なり、サーバーレスでは使用量ベースのスケーリングとサービス レベルの制限を使用して容量を管理します。 詳細については、「 サーバーレス価格モデルを使用してコストを最適化する」を参照してください。
特定の機能の詳細については、「features of Azure AI 検索」を参照してください。
クラシック検索とは
クラシック検索は、予測可能で待ち時間の短いクエリのインデックス優先取得モデルです。 各クエリは、定義済みの 1 つの検索インデックスを対象とし、1 回の要求応答サイクルでランク付けされたドキュメントを返します。 取得中に LLM 支援の計画、イテレーション、または合成は行われません。
このアーキテクチャでは、検索サービスは、未処理のコンテンツを含むデータ ストアとクライアント アプリの間に配置されます。 アプリは、検索サービスにクエリ要求を送信し、応答を処理する役割を担います。
このアーキテクチャには、次の 2 つの主要なワークロードがあります。
インデックス作成は 、コンテンツをインデックスに読み込み、検索できるようにします。 内部的には、受信テキストはトークン化され、反転インデックスに格納されますが、受信ベクターはベクター インデックスに格納されます。 Azure AI 検索は JSON ドキュメントにのみインデックスを作成できます。 プッシュ メソッドを使用して JSON ドキュメントを直接アップロードするか、プル メソッド (インデクサーまたはロジック アプリ ワークフロー) を使用してデータを取得して JSON にシリアル化できます。
インデックス作成中に、 AI エンリッチメント を使用して、テキストのチャンク、ベクターの生成、構造とコンテンツを作成する他の変換の適用を行うことができます。 Azure AI 検索エンリッチされた出力を JSON ドキュメントにシリアル化し、インデックスに取り込みます。
メモ
この図では、わかりやすくするためにインデックス作成エンジンとクエリ エンジンを分離していますが、Azure AI 検索では、読み取り/書き込みモードと読み取り専用モードで動作するコンポーネントと同じです。
エージェンティック リトリーバルとは
エージェント検索 は、複雑なエージェント間ワークフロー用に設計されたマルチクエリ パイプラインです。 各クエリは、 ナレッジ の完全なドメインを表すナレッジ ベースを対象とします。 エージェントは、何を基にするかについてナレッジ ベースを参照しますが、ナレッジ ベースはグラウンディングの方法を処理します。
ナレッジ ベースは、1 つ以上の ナレッジ ソース、クエリの計画と回答の合成のためのオプションの LLM、および取得動作を制御するパラメーターで構成されます。 各クエリでは、計画、フォーカスされたサブクエリへの分解、ナレッジ ソースからの並列取得、セマンティック再ランク付け、結果のマージが行われます。 3 本柱の応答は、エージェントの使用に最適化されています。
内部的には、エージェント検索は、マルチソースの取得を調整するコンテキスト レイヤー (ナレッジ ベース) を追加することで、従来の検索アーキテクチャに基づいています。 ナレッジ ソースはインデックスを作成することもリモートにすることもできます。インデックス付きソースはクラシック検索と同じインデックス作成エンジンとクエリ エンジンを使用し、リモート ソースはインデックス作成をバイパスし、ライブクエリを実行します。
比較方法
従来の検索とエージェント検索は、情報取得の補完的なモードです。 両方とも 、フルテキスト検索、 ベクター検索、 ハイブリッド検索、 マルチモーダル 検索をサポートします。 ただし、コンテンツの取り込みとクエリの方法は異なります。 次の表は、その主な違いをまとめたものです。
| アスペクト | クラシック検索 | エージェンティック検索 |
|---|---|---|
| コーパスの検索 | 検索インデックス | ナレッジ ソース |
| 検索先 | スキーマによって定義された 1 つのインデックス | 1 つ以上のナレッジ ソースを指すナレッジ ベース |
| クエリ プラン | プランなし、要求のみ | LLM 支援プランまたはユーザー指定プラン |
| クエリ要求 | インデックス内のドキュメントを検索する | ナレッジ ソースから取得する |
| 応答 | スキーマに基づくフラット化された検索結果 | LLM で作成された回答または生のソース データ、アクティビティ ログ、参照 |
| リージョンの制限 | いいえ | はい |
| ステータス | 一般公開 | 一般公開(プレビュー段階の一部の機能あり) |
| 専用価格モデルのサポート | はい | はい |
| サーバーレス価格モデルのサポート | はい | はい |
作業を開始する方法
Azure ポータルからAzure AI 検索にアクセスできます。 REST API、および .NET、Java、JavaScript、および Python のAzure SDK。
ポータルは、ナレッジ ベース、ナレッジ ソース、インデックス、インデクサー、スキルセット、データ ソースをプロトタイプ化するためのツールを使用して、サービス管理とコンテンツ管理に役立ちます。 REST API と SDK は、運用環境の自動化に役立ちます。
パスを選択する
作業を開始する前に、次のチェックリストを使用して重要な決定を行います。
価格モデルを選択する: 専用 または サーバーレス の価格モデルを選択します。 ニーズ に最適なモデルの選択については、「価格モデルとサービス レベル の選択」を参照してください。
データを取得する方法を選択します。 検索インデックスから直接クエリを実行して予測可能で待ち時間の短い結果を取得したり、エージェント検索を使用してナレッジ ベースを介して複数のインデックスに対してクエリを実行したりできます。 エージェントやチャットボットを使用せずに従来のアプリを構築している場合、直接インデックス クエリは、コストと複雑さを抑えてほとんどのニーズを満たすことができます。 複数のナレッジソースをまたいで利用する場合や、より高度なシナリオをサポートする必要がある場合は、最小限の推論の労力で利用できるエージェント型検索を検討してください。
リージョンを選択します。 エージェント検索を使用している場合は、 サポートされているリージョンを選択します。 クラシック検索の場合は、必要な機能と容量を提供するリージョンを選択します。
インデックスバインドコンテンツのインジェスト方法を選択します。コンテンツがサポートされているデータ ソース内にある場合は、pull メソッドを使用してデータを取得し、JSON にシリアル化します。 サポートされているデータ ソースがない場合、またはコンテンツとインデックスをリアルタイムで同期する必要がある場合は、 プッシュメソッド が唯一のオプションです。
ベクトルが必要ですか? LLM とエージェントにはベクターは必要ありません。 類似性検索が必要な場合、またはベクターに均一化できるコンテンツがある場合にのみ使用します。 Azure AI 検索では、このタスクにintegrated vectorization が提供されます。
ユーザーベースのアクセス許可の継承が必要ですか? リモート SharePointは、このシナリオ向けに設計されていますが、Azure Blob Storage または ADLS Gen2 のコンテンツにアタッチされているユーザーのアクセス許可を継承することもできます。 その他のすべてのシナリオでは、 セキュリティ フィルター の回避策を使用できます。
学習リソースを選択する
これらのクイック スタートとサンプルは、作業の開始に役立ちます。
ヒント
複雑なソリューションやカスタム ソリューションに関するヘルプについては、パートナーにAzure AI 検索に関する深い専門知識を持つパートナーに問い合わせてください。