次の方法で共有


Azure AI Search の機能

Azure AI 検索は情報取得機能を提供し、オプションの AI 統合を使用してテキストおよびベクトル コンテンツからより多くの価値を引き出します。

次の表は、カテゴリ別の機能をまとめたものです。 すべての Azure パブリック クラウド、プライベート クラウド、ソブリン クラウドには機能パリティがありますが、一部の機能は 特定のリージョン または 特定のレベルではサポートされていません。

Note

プレビュー機能をお探しですか? 「プレビュー機能リスト」を参照してください。

インデックス作成とデータ抽出

Category Features
データ ソース 検索インデックスは、JSON ドキュメントとして送信されていれば、すべてのソースからのテキストを受け入れることができます。

インデクサー は、サポートされているデータ ソースからのデータインポートを自動化して、プライマリ データ ストア内の検索可能なコンテンツを抽出する機能です。 インデクサーによって JSON のシリアル化は自動的に処理されます。また、ほとんどの場合、何らかの形の変更と削除の検出がサポートされます。 Microsoft OneLakeAzure SQL Database、AzureCosmos DBAzure Blob Storage など、さまざまなデータ ソースに接続できます。

Logic Apps コネクタ (プレビュー) を使用すると、他のクラウド プラットフォーム上のデータなど、幅広いデータ ソースにアクセスできます。 このインデックス作成とエンリッチメント パイプラインは、Azure AI Search で作成されますが、Azure Logic Apps で管理されます。
階層データ構造と入れ子になったデータ構造 複合型とコレクションでは、検索インデックス内の事実上すべての種類の JSON 構造をモデル化できます。 一対多と多対多のカーディナリティは、コレクション、複合型、および複合型のコレクションを通じてネイティブに表現できます。
Linguistic Analysis アナライザーは、インデックス作成および検索操作中のテキスト処理に使用するコンポーネントです。 既定では、汎用の標準 Lucene アナライザーを使用するか、言語アナライザー、ユーザーが構成したカスタム アナライザー、または必要な形式でトークンを生成する別の定義済みアナライザーで既定をオーバーライドすることができます。

Lucene または Microsoft の言語アナライザーは、動詞の時差、性別、不規則な複数形の名詞 ("マウス" や "マウス" など)、単語の逆コンパイル、単語区切り (スペースのない言語の場合) など、言語固有の言語をインテリジェントに処理するために使用されます。

カスタム字句アナライザー は、ふりがなの照合や正規表現などの複雑なクエリ 形式に使用されます。

チャット モデルとエージェントの統合

Category Features
インデックス作成中に使用されるチャット補完モデル GenAI プロンプト スキル (プレビュー) は、インデックス作成中に大規模な言語モデルを呼び出し、タスクを決定するプロンプトを提供するスキルです。 タスクの内容を決定します。 画像の記述、コンテンツの要約または操作、またはモデルが実行できる任意のタスクを記述できます。 出力は、検索可能なインデックスの新しいフィールドとして追加されます。
クエリ時に使用されるチャット完了モデル エージェント検索 (プレビュー) では、大規模な言語モデルを使用して、クエリの計画、複雑なクエリの分解、および言い換えによって、インデックスに対するクエリ カバレッジを向上します。 エージェント検索からの応答は、エージェント間ワークフロー用に設計されています。 検索結果を 1 つの大きな文字列として渡すことができます。これにより、独自のコンテンツのエージェントの使用が簡略化されます。 応答には、引用文献とクエリ実行情報も含まれます。

RAG パターンは 、既存の機能を使用して実装できます。 関連性を調整し、ハイブリッド クエリを構築する機能により、応答生成のためにチャット ボットに送信されるコンテンツの品質が向上します。

適用された AI と AI によって強化されたコンテンツ

Category Features
インデックス作成中の AI 処理 AI エンリッチメントとは、本来であれば全文検索用にインデックスを作成できないコンテンツからテキストや情報を抽出する、インデクサー パイプラインの埋め込み画像や自然言語処理です。 AI 処理は、後でインデクサーにアタッチするスキルセットに、スキルを追加して組み合わせることによって実現されます。 AI には、テキスト翻訳や光学式文字認識 (OCR) などの Microsoft の組み込みスキルと、お客様が提供するカスタム スキルがあります。

統合されたデータ チャンクとベクター化 により、ベクター化できる小さなチャンクに大きな通路が分割され、ベクターとハイブリッド検索のインデックス内の専用フィールドにベクターがルーティングされます。
クエリの実行中の AI 処理 Vectorizer は 、ベクター検索用のベクターにユーザー クエリ文字列をエンコードするために使用されます。 インデックス作成に使用したのと同じ埋め込みモデルをクエリに使用できます。

検索以外のシナリオでの分析と使用のためのエンリッチされたコンテンツの格納 ナレッジ ストア は、ナレッジ マイニングやデータ サイエンスワークロードなどの検索以外のシナリオを対象とした、AI エンリッチドコンテンツまたは AI 生成コンテンツの永続的なストレージです。 ナレッジ ストアは、スキルセットで定義されますが、Azure Storage ではオブジェクトまたは表形式の行セットとして作成されます。
キャッシュされたエンリッチメント エンリッチメント キャッシュ (プレビュー) とは、スキルセットの実行中に再利用できるキャッシュされたエンリッチメントを指します。 キャッシュは、OCR や画像分析を含むスキルセットでは価値があり、処理にコストがかかります。

ベクターとハイブリッドの取得

Category Features
ベクトル インデックス作成 検索インデックス内にベクトル フィールドを追加することで、ベクトル検索のシナリオをサポートできるようになります。 ベクトル フィールドは、同じ検索ドキュメント内の非ベクトル フィールドと共存できます。
ベクトル クエリ 単一および複数のベクトル クエリを作成します
ベクトル検索のアルゴリズム Hierarchical Navigable Small World (HNSW) または完全な K 近傍法 (KNN) を使用して、検索インデックス内の同様のベクトルを検索します。
ベクトル フィルター 情報を取得する際にクエリの実行前または実行後にフィルターを適用して、精度を高めます。
ハイブリッド情報の取得 1 つのハイブリッド クエリ要求にある概念とキーワードを検索します。

ハイブリッド検索にはベクトル検索とテキスト検索が統合されており、またオプションのセマンティック ランク付けと関連性のチューニングを行うことで最適な結果が得られるようになっています。
統合されたデータ チャンキングとベクトル化 テキスト分割スキルを使用したネイティブ データ チャンク処理。 Azure AI Foundry モデル カタログ内のエンドポイントへの接続に使用できる埋め込みスキル (AzureOpenAIEmbeddingModelAzure AI Vision マルチモーダルAML スキルなど) とベクトライザーを使用したネイティブ ベクター化。

垂直統合は、ソース ファイルからクエリに繋がるエンドツーエンドのインデックス作成パイプラインを提供します。
統合されたベクター圧縮と量子化 組み込みのスカラーおよびバイナリ量子化を使用することで、メモリ内とディスク上のベクトル インデックス サイズを削減します。 また、不要なベクターの格納を省略したり、narrow データ型をベクター フィールドに割り当ててストレージ要件を減らすこともできます。

フルテキストおよびその他のクエリ フォーム

Category Features
自由形式のテキスト検索 フルテキスト検索は、大部分の検索ベース アプリの主な用途です。 クエリは、サポートされている構文を使用して作成できます。

単純なクエリ構文 では、論理演算子、語句検索演算子、サフィックス演算子、優先順位演算子が提供されます。

完全な Lucene クエリ構文 には、あいまい検索、近接検索、用語ブースト、正規表現の拡張機能を含む、単純な構文のすべての操作が含まれています。
Relevance 簡単なスコアリングは Azure AI Search の主な利点です。 スコアリング プロファイルを使用して、ドキュメント自体の値の関数として、関連性をモデル化できます。 たとえば、新しい製品や割り引き製品を検索結果の上位に表示することが望ましい場合があります。 あるいは、追跡記録し、個別に保存しておいた顧客の検索傾向に基づいてパーソナライズされたスコアリングのタグを利用し、スコアリング プロファイルを作成できます。

セマンティック ランカー は、クエリに対するセマンティック関連性に基づいて結果を再ランク付けするプレミアム機能です。 コンテンツとシナリオによっては、ほぼ最小限の構成または労力で検索の関連性を大幅に向上させることができます。
地理空間検索 地理空間関数は、地理座標をフィルター処理して照合します。 距離で一致させることも、多角形に含めて一致させることもできます。
フィルターとファセット 1 つのクエリ パラメーターでファセット ナビゲーションを有効にできます。 Azure AI Search は、ファセット ナビゲーション構造を返します。これをカテゴリ一覧の背後のコードとして使用すると、自律フィルター処理 (たとえば、価格帯やブランド別のカタログ品目のフィルター処理) を実現できます。

フィルター を使用して、ファセット ナビゲーションをアプリケーションの UI に組み込み、クエリの定式化を強化し、ユーザーまたは開発者が指定した条件に基づいてフィルター処理できます。 フィルターを作成するには、OData 構文を使用します。
ユーザー エクスペリエンス 検索バーでの先行入力クエリで、オートコンプリートを有効にすることができます。

検索候補は、検索 バーの部分的なテキスト入力でも機能しますが、結果はクエリ用語ではなく、インデックス内の実際のドキュメントです。

シノニムは、 ユーザーが代替用語を指定しなくても、クエリのスコープを暗黙的に拡張する同等の用語を関連付けます。

ヒット強調表示では、 検索結果の一致するキーワードにテキストの書式設定が適用されます。 強調表示されたスニペットを返すフィールドを選択できます。

並べ替えは、インデックス スキーマを使用して複数のフィールドに対して提供され、クエリ時に 1 つの検索パラメーターで切り替えられます。

Azure AI Search が検索結果に対して提供する細かく調整された制御により、検索結果のページングと調整は簡単です。

セキュリティ機能

Category Features
ネットワークのセキュリティ 受信ファイアウォールサポートの IP 規則 を使用すると、検索サービスが要求を受け入れる IP 範囲を設定できます。

Azure Private Link を使用してプライベート エンドポイントを作成し、仮想ネットワーク経由ですべての要求を強制します。

ネットワーク セキュリティ境界 のサポートを使用すると、Azure AI Search を他の Azure リソースを含むネットワーク セキュリティ境界に参加できるため、ネットワーク アクセスを包括的に管理できます。
データの暗号化 Microsoft によって管理される保存中の暗号化は内部ストレージ レイヤーに組み込まれており、取り消しはできません。

Azure Key Vault で作成および管理するカスタマー マネージド暗号化キー (CMK) は、インデックスとシノニム マップの補足的な暗号化に使用できます。 インデックス付きコンテンツを完全に二重に暗号化する CMK での暗号化は、2020 年 8 月 1 日以降に作成されたサービスでは、一時ディスク上のデータにも拡張されています。
受信アクセス ロールベースのアクセス制御では、検索コンテンツと操作へのアクセスを制御するため、Microsoft Entra ID のユーザーとグループにロールが割り当てられます。 ロール割り当てを使用したくない場合は、キーベース認証を使用することもできます。

ドキュメント レベルのアクセス制御 (プレビュー) では、ユーザーが表示を許可されていない検索結果が除外されます。 複数のデータ ソースについて、データ ソースがアクセス制御モデルを提供する場合は、ユーザーアクセス許可メタデータを継承するようにインデックスを構成できます。
アウトバウンド セキュリティ (インデクサー) プライベート エンドポイントを介したデータ接続 により、インデクサーは Azure Private Link を介して保護されている Azure リソースに接続できます。

マネージド ID を介したデータ接続 は、Microsoft Entra セキュリティ プリンシパルを使用して Azure リソースへの接続を認証します。これにより、ハードコーディングされた API キーのストレージと受け渡しが不要になります

信頼できる ID を使用したデータ アクセスは、 外部データ ソースへの接続文字列がユーザー名とパスワードを省略できることを意味します。 インデクサーがデータ ソースに接続すると、検索サービスが以前に信頼されたサービスとして登録されていた場合に、リソースによって接続が許可されます (Azure Storage にのみ適用されます)。

ポータルの機能

Category Features
プロトタイピングと検査のためのツール インデックスの追加は、Azure portal のインデックス デザイナーであり、属性付きのフィールドと他のいくつかの設定で構成される基本スキーマを作成するために使用できます。 インデックスを保存したら、SDK または REST API を使用して情報を移入し、データを提供できます。

データのインポート ウィザード では、インデックス、インデクサー、スキルセット、およびデータ ソース定義が作成されます。 データが Azure に存在する場合、このウィザードを使用すると、特に概念実証の調査や探究で時間と労力を大幅に節約できます。

データのインポート (新しい) ウィザード では、データ チャンクとベクター化を含む完全なインデックス作成パイプラインが作成されます。 ウィザードでは、すべてのオブジェクトと構成設定を作成できます。

検索エクスプローラー は、クエリをテストし、スコアリング プロファイルを絞り込むために使用されます。

デモ アプリの作成 は、検索エクスペリエンスのテストに使用できる HTML ページを生成するために使用されます。

デバッグ セッション は、スキルセットを対話形式でデバッグできるビジュアル エディターです。 依存関係、出力、変換が表示されます。
監視と診断 監視機能を有効にして、Azure portal に常に表示される、一目で確認できるメトリックの先に進みます。 1 秒あたりのクエリ数、待ち時間、スロットルに関するメトリックが取得され、ポータル ページで報告されます。追加の構成は必要ありません。

Programmability

Category Features
REST サービス REST API は、データ プレーン操作で使用します (インデックス作成、クエリ、および AI エンリッチメントに関連するすべての操作を含む)。 また、このクライアント ライブラリを使用して、システム情報と統計を取得することもできます。

管理 REST API は、Azure Resource Manager を使用したサービスの作成とプロビジョニング用です。 また、この API を使用して、キーや容量を管理することもできます。
Azure SDK for .NET Azure.Search.Documents は、データ プレーン操作で使用します (インデックス作成、クエリ、および AI エンリッチメントに関連するすべての操作を含む)。 また、このクライアント ライブラリを使用して、システム情報と統計を取得することもできます。

Microsoft.Azure.Management.Search は、Azure Resource Manager を使用したサービスの作成とプロビジョニング用です。 また、この API を使用して、キーや容量を管理することもできます。
Azure SDK for Java com.azure.search.documents は、データ プレーン操作で使用します (インデックス作成、クエリ、および AI エンリッチメントに関連するすべての操作を含む)。 また、このクライアント ライブラリを使用して、システム情報と統計を取得することもできます。

com.microsoft.azure.management.search は、Azure Resource Manager を使用したサービスの作成とプロビジョニング用です。 また、この API を使用して、キーや容量を管理することもできます。
Azure SDK for Python azure-search-documents は、データ プレーン操作で使用します (インデックス作成、クエリ、および AI エンリッチメントに関連するすべての操作を含む)。 また、このクライアント ライブラリを使用して、システム情報と統計を取得することもできます。

azure-mgmt-search は、Azure Resource Manager を使用したサービスの作成とプロビジョニング用です。 また、この API を使用して、キーや容量を管理することもできます。
Azure SDK for JavaScript/TypeScript azure/search-documents は、データ プレーン操作で使用します (インデックス作成、クエリ、および AI エンリッチメントに関連するすべての操作を含む)。 また、このクライアント ライブラリを使用して、システム情報と統計を取得することもできます。

azure/arm-search は、Azure Resource Manager を使用したサービスの作成とプロビジョニング用です。 また、この API を使用して、キーや容量を管理することもできます。