Azure AI Search でハイブリッドクエリを作成する

[アーティクル]
06/19/2024

ハイブリッド検索では、1 つ以上のテキスト (キーワード) クエリと 1 つ以上のベクトルクエリが単一の検索要求に結合されます。クエリは並列で実行されます。結果は Reciprocal Rank Fusion (RRF) を使ってマージされ、新しい検索スコアによって並べ替えられて、統合された結果セットが返されます。

多くの場合、ベンチマークテストに従い、セマンティックランク付けを使用したハイブリッドクエリからは最も関連性の高い結果が返されます。

前提条件

searchable ベクトルと非ベクトルフィールドを含む検索インデックス。インデックスの作成に関するページと「検索インデックスにベクトルフィールドを追加する」を参照してください。
(省略可能) セマンティックランク付けが必要な場合、検索サービスは Basic レベル以上で、セマンティックランク付けが有効になっている必要があります。
(省略可能) クエリ文字列のテキストからベクトルへの変換 (現在、プレビュー段階) が必要な場合は、ベクトル化を作成して検索インデックス内のベクトルフィールドに割り当てます。

API またはツールを選択する

2023-11-01: 安定バージョン
2023-10-01-preview: ハイブリッドクエリのベクトル側に垂直統合が追加されます
2024-03-01-preview: ハイブリッドクエリのベクトル側に、狭いデータ型とスカラー量子化が追加されます
2024-05-01-preview: 特にハイブリッド検索用に maxTextRecallSize と countAndFacetMode が追加されます
Azure portal の検索エクスプローラー (2024-05-01-preview の動作が対象です)
Azure SDK の新しい安定版またはベータ版パッケージ (SDK 機能サポートの変更ログを参照)

Search Explorer でハイブリッドクエリを実行する

Search Explorer で、API バージョンが 2023-10-01-preview 以降であることを確認します。
[ビュー] で、[JSON ビュー] を選択します。
既定のクエリテンプレートをハイブリッドクエリに置き換えます。たとえば、ベクトルクイックスタートの例の 539 行目から始まるものです。簡潔にするために、この記事ではベクトルは切り詰められています。

ハイブリッドクエリには、search で指定されたテキストクエリと、vectorQueries.vector で指定されたベクトルクエリがあります。

テキストクエリとベクトルクエリは、同等であるか、少なくとも競合しないようにする必要があります。クエリが異なる場合、ハイブリッドの利点は得られません。
```
{
    "count": true,
    "search": "historic hotel walk to restaurants and shopping",
    "select": "HotelId, HotelName, Category, Tags, Description",
    "top": 7,
    "vectorQueries": [
        {
            "vector": [0.01944167, 0.0040178085, -0.007816401 ... <remaining values omitted> ], 
            "k": 7,
            "fields": "DescriptionVector",
            "kind": "vector",
            "exhaustive": true
        }
    ]
}
```
[Search] を選択します。

ハイブリッドクエリ要求 (REST API)

ハイブリッドクエリは、テキスト検索とベクトル検索を組み合わせたものであり、search パラメータはクエリ文字列を、vectorQueries.vector パラメータはベクトルクエリを受け取ります。検索エンジンは、フルテキストとベクトルクエリを同時に実行します。すべての一致の和集合は、Reciprocal Rank Fusion (RRF) を使用して関連性が評価され、応答で単一の結果セットが返されます。

結果は、retrievable とマークされたフィールドのベクトルを含む、プレーンテキストで返されます。数値ベクトルは検索結果では役に立たないため、インデックス内の他のフィールドをベクトル一致のプロキシとして選択します。たとえば、インデックスに "descriptionVector" フィールドと "descriptionText" フィールドがある場合、クエリは "descriptionVector" で一致しますが、検索結果には "descriptionText" と表示されます。この select パラメータを使用して、結果に人間が判読できるフィールドのみを指定します。

次の例は、ハイブリッドクエリ構成を示しています。

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/search?api-version=2023-11-01
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "vectorQueries": [
        {
            "vector": [
                -0.009154141,
                0.018708462,
                . . . 
                -0.02178128,
                -0.00086512347
            ],
            "fields": "DescriptionVector",
            "kind": "vector",
            "exhaustive": true,
            "k": 10
        },
        {
            "vector": [
                -0.009154141,
                0.018708462,
                . . . 
                -0.02178128,
                -0.00086512347
            ],
            "fields": "DescriptionVector",
            "kind": "vector",
            "exhaustive": true,
            "k": 10
        }
    ],
    "search": "historic hotel walk to restaurants and shopping",
    "select": "HotelName, Description, Address/City",
    "top": 10
}

重要なポイント:

ベクトルクエリ文字列は、vectorQueries.vector プロパティを使用して指定されます。クエリは "DescriptionVector" フィールドに対して実行されます。クエリの種類を示すには、kind を "vector" に設定します。必要に応じて、exhaustive を true に設定し、ベクトルフィールドのすべての内容に対してクエリを実行します。
キーワード検索は、search プロパティを使用して指定されます。ベクトルクエリと並行して実行されます。
k は、ベクトルクエリから返され、RRF ランカーに提供される最も近い近隣の一致の数を決定します。
top は、応答全体で返される一致の数を決定します。この例では、マージされた結果に少なくとも 10 個の一致があると仮定して、応答に 10 個の結果が含まれています。

フィルターを使用したハイブリッド検索

この例では、検索インデックスの非ベクトルフィールド filterable に適用されるフィルターを追加します。

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/search?api-version=2023-11-01
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "vectorQueries": [
        {
            "vector": [
                -0.009154141,
                0.018708462,
                . . . 
                -0.02178128,
                -0.00086512347
            ],
            "fields": "DescriptionVector",
            "kind": "vector",
            "k": 10
        }
    ],
    "search": "historic hotel walk to restaurants and shopping",
    "vectorFilterMode": "postFilter",
    "filter": "ParkingIncluded",
    "top": "10"
}

重要なポイント:

フィルターは、フィルター可能なフィールドの内容に適用されます。この例では、ParkingIncluded フィールドはブール値であり、インデックススキーマで filterable としてマークされています。
ハイブリッドクエリでは、クエリサーフェスを減らすためにクエリの実行前に、または結果をトリミングするためにクエリの実行後にフィルターを適用することができます。 "preFilter" は既定値です。 postFilter を使用するには、この例に示すように、フィルター処理モードを設定します。
クエリ結果を事後フィルター処理すると、結果の数が上位 N 未満になる可能性があります。

セマンティックハイブリッド検索

セマンティックランク付けを有効にし、インデックス定義にセマンティック構成が含まれていると仮定すると、ベクトル検索とキーワード検索 (マージされた結果セットに対するセマンティックランク付けを使用) を含むクエリを作成できます。必要に応じて、キャプションと回答を追加できます。

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/search?api-version=2023-11-01
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "vectorQueries": [
        {
            "vector": [
                -0.009154141,
                0.018708462,
                . . . 
                -0.02178128,
                -0.00086512347
            ],
            "fields": "DescriptionVector",
            "kind": "vector",
            "k": 50
        }
    ],
    "search": "historic hotel walk to restaurants and shopping",
    "select": "HotelName, Description, Tags",
    "queryType": "semantic",
    "semanticConfiguration": "my-semantic-config",
    "captions": "extractive",
    "answers": "extractive",
    "top": "50"
}

重要なポイント:

セマンティックランク付けでは、マージされた応答から最大 50 個の結果が受け入れられます。
"queryType" と "semanticConfiguration" は必須です。
"captions" と "answers" は省略可能です。値は、結果内の逐語的なテキストから抽出されます。回答は、クエリに対する回答の特性を持つ内容が結果に含まれている場合にのみ返されます。

フィルターを使用したセマンティックハイブリッド検索

ここでは、コレクションでの最後のクエリを示します。これは、前の例と同じセマンティックハイブリッドクエリですが、フィルターを使用します。

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/search?api-version=2023-11-01
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "vectorQueries": [
        {
            "vector": [
                -0.009154141,
                0.018708462,
                . . . 
                -0.02178128,
                -0.00086512347
            ],
            "fields": "DescriptionVector",
            "kind": "vector",
            "k": 50
        }
    ],
    "search": "historic hotel walk to restaurants and shopping",
    "select": "HotelName, Description, Tags",
    "queryType": "semantic",
    "semanticConfiguration": "my-semantic-config",
    "captions": "extractive",
    "answers": "extractive",
    "filter": "ParkingIsIncluded'",
    "vectorFilterMode": "postFilter",
    "top": "50"
}

重要なポイント:

フィルターモードは、セマンティックリランカーで使用できる結果の数に影響を与える可能性があります。ベストプラクティスとして、セマンティックランカーにドキュメントの最大数 (50) を指定するのが賢明です。事前フィルターまたは事後フィルターの選択性が高すぎる場合、操作するドキュメントを 50 未満にすることでセマンティックランカーを過小評価している可能性があります。
事前フィルターは、クエリの実行前に適用されます。事前フィルターによって検索領域が 100 ドキュメントに縮小された場合、ベクトルクエリはこれらの 100 ドキュメントの "DescriptionVector" フィールドに対して実行され、k=50 の最適な一致が返されます。その後、これらの一致する 50 ドキュメントが RRF に渡されてマージされた結果が得られ、セマンティックランカーに渡されます。
事後フィルターは、クエリの実行後に適用されます。 k=50 でベクトルクエリ側の 50 の一致が返された場合、事後フィルターはその 50 の一致に適用され、フィルター条件を満たす結果が減り、セマンティックランカーに渡すドキュメントは 50 未満になります。

maxTextRecallSize と countAndFacetMode を設定する (プレビュー)

このセクションでは、ハイブリッドランク付けモデルに送られる BM25 ランク付け結果の量を制御して、ハイブリッドクエリへの入力を調整する方法について説明します。 BM25 ランク付け入力を制御すると、ハイブリッドシナリオでの関連性チューニングのオプションが増えます。

ヒント

考慮すべきもう 1 つのオプションは、補助または代替の手法のベクトル重み付けであり、要求でのベクトルクエリの重要性が高くなります。

これらのパラメーターを指定するには、2024-05-01-preview で Search - POST または Search - GET を使います。
ハイブリッドクエリの BM25 ランク付け結果によって呼び戻されるドキュメントの最大数を設定するには、hybridSearch クエリパラメーターオブジェクトを追加します。 2 つのプロパティがあります。
- maxTextRecallSize は、ハイブリッドクエリで使われる Reciprocal Rank Fusion (RRF) ランカーに提供する BM25 ランク付け結果の数を指定します。既定値は 1,000 です。最大値は 10,000 です。
- countAndFacetMode は、BM25 ランク付け結果 (およびファセットを使用している場合はファセット) の数を報告します。既定値は、クエリに一致するすべてのドキュメントです。必要に応じて、"カウント" のスコープを maxTextRecallSize に設定できます。
ベクトル類似性検索のパフォーマンスが一般にハイブリッドクエリのテキスト側より高い場合は、maxTextRecallSize を減らします。
大きなインデックスがあり、既定値で十分な数の結果がキャプチャされない場合は、maxTextRecallSize を増やします。 BM25 ランク付け結果セットが大きいときは、top、skip、next を設定して、それらの結果の一部を取得することもできます。

次の REST の例では、maxTextRecallSize の設定に関する 2 つのユースケースを示します。

最初の例では、maxTextRecallSize を 100 に減らして、ハイブリッドクエリのテキスト側を 100 ドキュメントのみに制限しています。また、maxTextRecallSize からの結果のみを含むように、countAndFacetMode を設定しています。

POST https://[service-name].search.windows.net/indexes/[index-name]/docs/search?api-version=2024-05-01-Preview 

    { 
      "vectorQueries": [ 
        { 
          "kind": "vector", 
          "vector": [1.0, 2.0, 3.0], 
          "fields": "my_vector_field", 
          "k": 10 
        } 
      ], 
      "search": "hello world", 
      "hybridSearch": { 
        "maxTextRecallSize": 100, 
        "countAndFacetMode": "countRetrievableResults" 
      } 
    }

2 番目の例では、maxTextRecallSize を 5,000 に増やしています。また、top、skip、next を使って、大きな結果セットから結果をプルしています。この場合の要求では、RRF 複合結果セットへのテキストクエリの寄与として、位置 1,500 から始まって 2,000 までの BM25 ランク付け結果がプルされます。

POST https://[service-name].search.windows.net/indexes/[index-name]/docs/search?api-version=2024-05-01-Preview 

    { 
      "vectorQueries": [ 
        { 
          "kind": "vector", 
          "vector": [1.0, 2.0, 3.0], 
          "fields": "my_vector_field", 
          "k": 10 
        } 
      ], 
      "search": "hello world",
      "top": 500,
      "skip": 1500,
      "next": 500,
      "hybridSearch": { 
        "maxTextRecallSize": 5000, 
        "countAndFacetMode": "countRetrievableResults" 
      } 
    }

クエリ応答を構成する

ハイブリッドクエリを設定するときは、応答構造について考えてください。応答はフラット化行セットです。クエリのパラメータによって、各行に含まれるフィールドと、応答内の行数が決まります。検索エンジンは、一致するドキュメントをランク付けし、最も関連性の高い結果を返します。

応答のフィールド

検索結果は、検索インデックスの retrievable フィールドで構成されます。結果は次のいずれかになります:

すべての retrievable フィールド (REST API の既定値)。
クエリの "select" パラメータに明示的に一覧表示されているフィールド。

この記事の例では、"select" ステートメントを使用して、応答のテキスト (非ベクトル) フィールドを指定しました。

Note

ベクトルは人間が判読できるテキストにリバースエンジニアリングされないため、応答で返されないようにします。代わりに、検索ドキュメントを代表する非ベクトルフィールドを選択します。たとえば、クエリが "DescriptionVector" フィールドを対象とする場合、応答に 1 つの ("Description") がある場合は、同等のテキストフィールドを返します。

結果の件数

検索条件が弱い場合は、クエリが任意の数のドキュメントと一致する場合があります (たとえば、null クエリの場合は "search=*")。無制限の結果を返すことが実用的であることは滅多にないので、"応答全体" の最大値を指定する必要があります:

"top": n キーワードのみのクエリの結果 (ベクターなし)
ベクトルのみのクエリの結果として "k": n
"top": n "search" パラメーターを含むハイブリッドクエリ (セマンティックあり、または、なし) の結果

"k" と "top" はどちらも省略可能です。指定しない場合、応答の結果の既定の数は 50 です。 "top" と "skip" を設定して、より多くの結果をページングしたり、既定値を変更したりできます。

Note

2024-05-01-preview API でハイブリッド検索を使用する場合は、maxTextRecallSize を使用してキーワードクエリから返される結果の数を制御できます。これを "k" の設定と組み合わせれば、各検索サブシステムからの表現 (キーワードとベクター) を制御できます。

セマンティックランカーの結果

Note

セマンティックランカーでは最大 50 件の結果を受け取ることができます。

2024-05-01-preview API でセマンティックランク付けを使用する場合は、"k" と "maxTextRecallSize" の合計が少なくとも 50 になるように設定することがベストプラクティスです。次に、"top" パラメーターを使用することで、ユーザーに返される結果を制限できます。

前の API でセマンティックランカーを使用する場合は、次の操作を行います。

キーワードのみの検索 (ベクトルなし) を実行する場合は、"top" を 50 に設定します
ハイブリッド検索を実行する場合は、セマンティックランカーに少なくとも 50 件の結果が確実に返されるように、"k" を 50 に設定します。

ランク付け

オプションのセマンティック再ランク付けの有無にかかわらず、ハイブリッドクエリでは複数のセットが作成されます。結果のランク付けは、Reciprocal Rank Fusion (RRF) によって計算されます。

このセクションでは、単一ベクトル検索と単純ハイブリッド検索の応答を比較して、上位の結果を確認します。異なるランク付けアルゴリズムである HNSW の類似性メトリックと RRF の場合では、異なる大きさのスコアが生成されます。この動作は仕様によるものです。 RRF スコアは、類似性の一致が高い場合でも、非常に低くなる場合があります。スコアの低さは、RRF アルゴリズムの特性です。 RRF を使用するハイブリッドクエリの場合、純粋なベクトル検索とは対照的に、RRF でランク付けされたドキュメントのスコアは比較的小さいため、ランク付けされたドキュメントの逆数がより多く結果に含まれます。

単一ベクトル検索: コサイン類似度で並べ替えられた結果の @search.score (既定のベクトル類似距離関数)。

{
    "@search.score": 0.8399121,
    "HotelId": "49",
    "HotelName": "Old Carrabelle Hotel",
    "Description": "Spacious rooms, glamorous suites and residences, rooftop pool, walking access to shopping, dining, entertainment and the city center.",
    "Category": "Luxury",
    "Address": {
    "City": "Arlington"
    }
}

ハイブリッド検索: Reciprocal Rank Fusion を使用してランク付けされたハイブリッド結果の @search.score。

{
    "@search.score": 0.032786883413791656,
    "HotelId": "49",
    "HotelName": "Old Carrabelle Hotel",
    "Description": "Spacious rooms, glamorous suites and residences, rooftop pool, walking access to shopping, dining, entertainment and the city center.",
    "Category": "Luxury",
    "Address": {
    "City": "Arlington"
    }
}

次のステップ

次のステップとして、Python、C#、または JavaScript のデモコードを確認することをお勧めします。

次の方法で共有

Azure AI Search でハイブリッドクエリを作成する

前提条件

API またはツールを選択する

Search Explorer でハイブリッドクエリを実行する

ハイブリッドクエリ要求 (REST API)

フィルターを使用したハイブリッド検索

セマンティックハイブリッド検索

フィルターを使用したセマンティックハイブリッド検索

maxTextRecallSize と countAndFacetMode を設定する (プレビュー)

クエリ応答を構成する

応答のフィールド

結果の件数

セマンティックランカーの結果

ランク付け

次のステップ

フィードバック

フィードバック

その他のリソース

次の方法で共有

Azure AI Search でハイブリッド クエリを作成する

前提条件

API またはツールを選択する

Search Explorer でハイブリッド クエリを実行する

ハイブリッド クエリ要求 (REST API)

フィルターを使用したハイブリッド検索

セマンティック ハイブリッド検索

フィルターを使用したセマンティック ハイブリッド検索

maxTextRecallSize と countAndFacetMode を設定する (プレビュー)

クエリ応答を構成する

応答のフィールド

結果の件数

セマンティック ランカーの結果

ランク付け

次のステップ

フィードバック

フィードバック

その他のリソース

Azure AI Search でハイブリッドクエリを作成する

Search Explorer でハイブリッドクエリを実行する

ハイブリッドクエリ要求 (REST API)

セマンティックハイブリッド検索

フィルターを使用したセマンティックハイブリッド検索

セマンティックランカーの結果