Azure AI Search とは

2025-05-20

Azure AI 検索 (旧称 "Azure Cognitive Search") は、ユーザーが検索インデックスに取り込んだ異種コンテンツのための、エンタープライズ対応の情報取得システムで、ユーザーにはクエリとアプリを介して表示されます。高度な検索テクノロジの総合的なセットを備え、あらゆる規模の高パフォーマンスアプリケーション向けに構築されています。

Azure AI Search は、Azure 上でエージェント間 (A2A) および RAG ベースのアプリケーションを構築するための推奨取得システムであり、Azure AI Foundry Models の Azure OpenAI と Azure Machine Learning の間のネイティブ LLM 統合と、サードパーティとオープンソースのモデルとプロセスを統合するためのメカニズムを備えています。

Azure AI Search は、従来の検索シナリオと生成検索シナリオの両方で使用できます。一般的なユースケースとしては、カタログやドキュメントの検索、情報検出 (データ探索)、会話検索用の検索拡張生成 (RAG) などがあります。

検索サービスを作成するときは、次の機能を使用します。

ベクトル検索および検索インデックスに対するフルテキスト検索とハイブリッド検索のための検索エンジン。
コンテンツ変換機能を備えた豊富なインデックス作成。これには、RAG 用の統合データチャンキングとベクトル化、テキスト用の字句解析、コンテンツの抽出とエンリッチのためのオプションの Applied AI が含まれます。
ベクトルクエリ、テキスト検索、ハイブリッドクエリ、あいまい検索、オートコンプリート、地理空間検索などのための豊富なクエリ構文。
セマンティックランク付け、スコアリングプロファイル、ベクトルクエリの量子化、実行時のクエリ動作を制御するためのパラメーターを使用した、関連性とクエリのパフォーマンスチューニング。
Azure のスケール、セキュリティ、リーチ。
データレイヤー、機械学習レイヤー、Azure AI サービス、Azure OpenAI での Azure 統合。

Search Service の作成

アーキテクチャ上、検索サービスは、インデックスが設定されていないデータを含む外部データストアと、検索インデックスにクエリ要求を送信して応答を処理するクライアントアプリとの間に配置されます。

クライアントアプリでは、検索エクスペリエンスは Azure AI Search の API を使用して定義され、関連性のチューニング、セマンティックランク付け、オートコンプリート、同意語の一致、あいまい一致、パターンマッチング、フィルター、並べ替えを含めることができます。

Azure プラットフォーム全体で、Azure AI Search は、他の Azure サービスと統合できます。その形式は、Azure データソースからのデータのインジェストと取得を自動化するインデクサー、および Azure AI サービスで提供されている消費型 AI (画像や自然言語処理など) や Azure Machine Learning 内で作成したり Azure Functions 内にラップしたりするカスタム AI を組み込んだスキルセットです。

検索サービスの内部

検索サービス自体は、"インデックスの作成" と "クエリの実行" の 2 つが主なワークロードとなります。

インデックス作成は、取り込みのプロセスです。コンテンツを検索サービスに読み込んで検索可能にします。内部では、受信テキストはトークンに処理され、反転インデックスに保存され、受信ベクトルはベクトルインデックスに保存されます。 Azure AI Search でインデックスを付けられるドキュメント形式は JSON です。作成した JSON ドキュメントをアップロードすることや、インデクサーを使用してデータを取得して JSON にシリアル化することができます。

スキルセットによる Applied AI により、画像モデルと言語モデルを使用したインデックス作成が拡張されます。ソースドキュメントに画像や大きな非構造化テキストがある場合は、OCR の実行、画像の分析や説明、構造の推測、テキストの翻訳などを行うスキルをアタッチできます。出力は、JSON にシリアル化でき、検索インデックスに取り込むことができるテキストです。

また、スキルセットは、インデックス作成時のデータのチャンキングとベクトル化を実行することもできます。 Azure OpenAI にアタッチするスキル、 Azure AI Foundry ポータルのモデルカタログ、または外部チャンクと埋め込みモデルにアタッチするカスタムスキルは、インデックス作成中にベクターデータを作成するために使用できます。出力は、検索インデックスに取り込むことができるチャンクベクトルコンテンツです。
クエリの実行は、検索可能なテキストがインデックスに取り込まれると、クライアントアプリが検索サービスにクエリ要求を送信して応答を処理するときに発生することがあります。すべてのクエリは、ユーザーが制御する検索インデックスを介して実行されます。

セマンティックランク付けは、クエリ実行の拡張機能です。言語理解を使用して結果セットを再評価して、二次ランク付けが追加され、セマンティック的に最も関連性の高い結果が先頭にレベル上げされます。

垂直統合は、クエリ実行の拡張機能でもあります。検索インデックスにベクトルフィールドがある場合は、クエリ時に生のベクトルクエリまたはベクトル化されたテキストを送信できます。

Azure AI Search を使用する理由

Azure AI Search は、次のアプリケーションシナリオに適しています。

従来のフルテキスト検索や次世代型のベクトル類似性検索に使用できます。キーワード検索と類似性検索の両方の強みを活用した情報取得で生成 AI アプリを支援します。両方のモダリティを使用して、最も関連性の高い結果を取得します。
異種コンテンツを、ベクトルとテキストで構成されるユーザーが定義および設定した検索インデックスに統合します。検索可能なコンテンツの所有権とコントロールを保持します。
生成 AI および RAG アプリ用にデータチャンクとベクトル化を統合する。
ドキュメントレベルで細分性の高いアクセス制御を適用します。
インデックス作成とクエリワークロードを専用の検索サービスにオフロードします。
関連性のチューニング、ファセットナビゲーション、フィルター (地理空間検索)、同意語マッピング、オートコンプリートなど、検索に関連した機能を容易に実装。
Azure Blob Storage や Azure Cosmos DB に格納されている未区分の大きなテキストファイル、画像ファイル、またはアプリケーションファイルを検索可能なチャンクに変換。これは、Azure AI から外部処理を追加する AI スキルを使ってインデックスを作成するときに行われます。
言語分析またはカスタムテキスト分析を追加。英語以外のコンテンツがある場合、Azure AI Search では Lucene アナライザーと Microsoft の自然言語プロセッサの両方がサポートされます。また、生コンテンツの特殊な処理 (分音記号のフィルター処理や、文字列内のパターンの認識と保持など) を実行するようにアナライザーを構成することもできます。

特定の機能の詳細については、「Azure AI Search の機能」を参照してください。

ファーストステップ

機能は、Azure portal、シンプルな REST API、または Azure SDK for .NET などの Azure SDK を使用して公開されます。 Azure portal は、インデックスとスキルセットのプロトタイプ作成やクエリを実行するためのツールによるサービスの管理とコンテンツの管理をサポートしています。

Azure portal を使用する

次の 4 つのステップにより、主要な検索機能をエンドツーエンドで試すことができます。

レベルとリージョンを決定します。サブスクリプションごとに 1 つだけ無料 Search サービスが許可されます。すべてのクイックスタートは、Free レベルで完了できます。さらに容量と機能が必要な場合は、有料のレベルが必要です。
Azure portal ポータルで Search サービスを作成します。
[データのインポート] ウィザードから開始します。組み込みのサンプルまたはサポートされているデータソースを選ぶと、インデックスの作成、ロード、クエリを数分で実行できます。
ポータルクライアントを使って作成した検索インデックスのクエリを実行して、Search エクスプローラーで終了します。

API の利用

また、検索インデックスの作成、読み込み、クエリをアトミックな手順で行うこともできます。

Azure portal、REST API、.NET SDK、または他の SDK を使って、検索インデックスを作成します。検索可能なコンテンツの構造は、インデックススキーマによって定義されます。
"プッシュ" モデルを使用して任意のソースから JSON ドキュメントをプッシュしてコンテンツをアップロードします。または、ソースデータがサポートされる型である場合は "プル" モデル (インデクサー) を使用します。
Azure portal の検索エクスプローラー、REST API、.NET SDK、または他の SDK を使って、インデックスのクエリを実行します。

アクセラレータを使用する

または、ソリューションアクセラレータを試してみてください。

データとのチャット ソリューションアクセラレータコンテンツに対するカスタム RAG ソリューションを作成するのに役立ちます。
会話型ナレッジマイニング ソリューションアクセラレータは、対話形式のソリューションを作成し、連絡後のセンターのトランスクリプトから実践的な分析情報を抽出するのに役立ちます。
ドキュメントナレッジマイニングアクセラレータは、非構造化マルチモーダルドキュメントから要約、エンティティ、メタデータを処理および抽出するのに役立ちます。
独自の副操縦ソリューションアクセラレータを構築し、Azure OpenAI、Azure AI Search、Microsoft Fabric を活用してカスタムの副操縦ソリューションを作成します。
- 汎用コパイロットを使用すると、独自のコパイロットを構築して関連するドキュメントを特定し、構造化されていない情報を要約し、独自のデータを使用して Word ドキュメントテンプレートを生成できます。
- Client Advisor では、オールインワンのカスタムコパイロットにより、構造化データと非構造化データの両方で生成 AI の能力を活用できます。お客様が毎日のタスクを最適化し、より多くのクライアントとより良いやり取りを行えるよう支援します。
- Research Assistant により、独自の AI アシスタントを構築して、関連するドキュメントを特定し、膨大な量の非構造化情報を集計して分類し、ドキュメントの全体的なレビューとコンテンツの生成を高速化できます。

ヒント

複雑なソリューションやカスタムソリューションについては、Azure AI Search テクノロジにおける深い専門知識を持つパートナーにお問い合わせください。

次の方法で共有