クエリにファセットを追加する - Azure AI Search

2025-04-22

ファセットナビゲーションは、検索アプリのクエリ結果に対するセルフダイレクトフィルター処理に使用されます。アプリケーションでは、ドキュメントのグループ (カテゴリやブランドなど) に検索範囲を設定するためのフォームコントロールが提供され、Azure AI Search はエクスペリエンスをサポートするデータ構造とフィルターを提供します。

この記事では、Azure AI Search でファセットナビゲーション構造を返す手順について説明します。基本的な概念とクライアントを理解したら、基本的なファセットや個別のカウントなど、さまざまなユースケースに関する構文のファセットの例に進んでください。

プレビュー API を使用して、その他のファセット機能を利用できます。

階層ファセット構造
ファセットフィルタリング
ファセット集計

ファセットナビゲーションの例では、プレビュー機能の構文と使用方法を示します。

ファセットは、各特定のクエリ結果セットに基づいているため、動的です。検索応答には、結果内のドキュメント内を移動するために使用されるすべてのファセットバケットが含まれます。まずクエリが実行され、次に現在の結果からファセットが取得され、ファセットナビゲーション構造に構築されます。

Azure AI Search では、ファセットは 1 層深く、プレビュー API を使用しない限り階層的にすることはできません。ファセットナビゲーション構造になじみがない場合は、次の例の左側にそれが示されています。カウントは、ファセットごとの一致の数を示しています。同じドキュメントを複数のファセットで表現できます。

ファセットを使用すると、探しているものが見つけやすくなり、検索結果がゼロ件になることはありません。開発者は、ファセットを使用することで検索インデックスのナビゲーションに最も役立つ検索条件を公開できます。

ファセットは、インデックス内のサポートされているフィールドで有効になり、クエリで指定されます。ファセットナビゲーション構造は、応答の先頭に返され、その後に結果が返されます。

次の REST の例は、インデックス全体を対象とする空のクエリ ("search": "*") です ( 組み込みのホテルサンプルを参照)。 facetsパラメーターは、"Category" フィールドを指定します。

POST https://{{service_name}}.search.windows.net/indexes/hotels/docs/search?api-version={{api_version}}
{
    "search": "*",
    "queryType": "simple",
    "select": "",
    "searchFields": "",
    "filter": "",
    "facets": [ "Category"], 
    "orderby": "",
    "count": true
}

この例の応答は、ファセットナビゲーション構造から始まります。この構造は、"Category" 値と、それぞれに対するホテルの数で構成されています。その後、残りの検索結果が表示され、簡潔にするために 1 つのドキュメントだけにトリミングされます。この例は、いくつかの理由で適切に機能します。このフィールドのファセットの数は制限 (既定値は 10) に収まるため、そのすべてが表示され、50 軒のホテルのインデックス内のすべてのホテルが、これらのカテゴリのうちの正確に 1 つで表されます。

{
    "@odata.context": "https://demo-search-svc.search.windows.net/indexes('hotels')/$metadata#docs(*)",
    "@odata.count": 50,
    "@search.facets": {
        "Category": [
            {
                "count": 13,
                "value": "Budget"
            },
            {
                "count": 12,
                "value": "Resort and Spa"
            },
            {
                "count": 9,
                "value": "Luxury"
            },
            {
                "count": 7,
                "value": "Boutique"
            },
            {
                "count": 5,
                "value": "Suite"
            },
            {
                "count": 4,
                "value": "Extended-Stay"
            }
        ]
    },
    "value": [
        {
            "@search.score": 1.0,
            "HotelId": "1",
            "HotelName": "Stay-Kay City Hotel",
            "Description": "The hotel is ideally located on the main commercial artery of the city in the heart of New York. A few minutes away is Time's Square and the historic centre of the city, as well as other places of interest that make New York one of America's most attractive and cosmopolitan cities.",
            "Category": "Boutique",
            "Tags": [
                "pool",
                "air conditioning",
                "concierge"
            ],
            "ParkingIncluded": false,
        },
        . . . 
    ]
}

プレーンテキストまたは数値コンテンツを含む新しいフィールドにファセットを追加できます。サポートされているデータ型には、文字列、日付、ブール型フィールド、数値フィールド (ベクトルは含まれません) が含まれます。

Azure portal、REST API、Azure SDK、または Azure AI Search でのインデックススキーマの作成または更新をサポートする任意の方法を使用できます。最初の手順として、ファセットに使用するフィールドを特定します。

属性を設定するフィールドを選択する

ファセットは、単一値フィールドとコレクションに対して計算できます。ファセットナビゲーションで最適に機能するフィールドには、次の特性があります。

人間が判読できる (非ベクトル) コンテンツ。
カーディナリティが低い (検索コーパス内のドキュメント全体で繰り返されるいくつかの個別の値)。
ナビゲーションツリーで適切にレンダリングされる短い説明値 (1 つまたは 2 つの単語)。

ファセットナビゲーション構造でファセットが生成されるのは、フィールド名自体ではなく、フィールド内の値によるものです。ファセットが Color という名前の文字列フィールドである場合、ファセットは青色、緑色、またはそのフィールドの他の任意の値になります。フィールド値を確認して、入力ミス、null 値、大文字と小文字の違いがないことを確認します。フィルター可能でファセット可能なフィールドにノーマライザーを割り当てて、テキストの小さなバリエーションを滑らかにすることを検討してください。たとえば、「Canada」、「CANADA」、「canada」はすべて 1 つのバケットに正規化されます。

サポートされていないフィールドを回避する

既存のフィールド、ベクターフィールド、 Edm.GeographyPoint 型または Collection(Edm.GeographyPoint)型のフィールドにファセットを設定することはできません。

複合フィールドコレクションでは、"facetable" は null にする必要があります。

新しいフィールド定義から始める

フィールドのインデックス付け方法に影響する属性は、フィールドの作成時にのみ設定できます。この制限は、ファセットとフィルターに適用されます。

インデックスが既に存在する場合は、ファセットを提供する新しいフィールド定義を追加できます。インデックス内の既存のドキュメントは、新しいフィールドの null 値を取得します。この null 値は、次回インデックスを更新するときに置き換えられます。

インデックススキーマを定義すると、インデックスに追加する新しいフィールドに "facetable": true を設定すると、ファセットが有効になります。厳密には必須ではありませんが、検索アプリケーションでファセットナビゲーションエクスペリエンスをサポートする必要なフィルターを作成できるように、"フィルター可能" 属性も設定することをお勧めします。

Create または Update Index 要求から始めて、fields コレクションを指定します。

次に示すのは、1 つの値または短い語句を含むカーディナリティの低いフィールドに対する "ファセット可能" と "フィルター可能" を示す、ホテルサンプルインデックスの JSON の例です。"Category"、"Tags"、"Rating" です。

{
  "name": "hotels",  
  "fields": [
    { "name": "hotelId", "type": "Edm.String", "key": true, "searchable": false, "sortable": false, "facetable": false },
    { "name": "Description", "type": "Edm.String", "filterable": false, "sortable": false, "facetable": false },
    { "name": "HotelName", "type": "Edm.String", "facetable": false },
    { "name": "Category", "type": "Edm.String", "filterable": true, "facetable": true },
    { "name": "Tags", "type": "Collection(Edm.String)", "filterable": true, "facetable": true },
    { "name": "Rating", "type": "Edm.Int32", "filterable": true, "facetable": true },
    { "name": "Location", "type": "Edm.GeographyPoint" }
  ]
}

REST の既定値

Azure portal と REST API の両方に、データ型に基づくフィールド属性の既定値があります。次のデータ型は、既定では "filterable" かつ "facetable" です。

Edm.String と Collection(Edm.String)
Edm.DateTimeOffset と Collection(Edm.DateTimeOffset)
Edm.Boolean とCollection(Edm.Boolean)
Edm.Int32、 Edm.Int64、 Edm.Double、および同等のコレクション

ファセットはクエリ応答の結果から動的に計算されることを思い出してください。現在のクエリで見つかったドキュメントのファセットのみが取得されます。

Azure Portal
REST

ファセットはクエリ時に構成されます。ファセットを指定するには、 SEARCH POST または Search GET 要求、または同等の Azure SDK API を使用します。

要求でファセットクエリパラメーターを設定します。 Search POST では、 facets は検索クエリに適用するファセット式の配列です。各ファセット式にはフィールド名が含まれ、オプションで名前と値のペアのコンマ区切りリストが続く場合があります。有効なファセットパラメーターは、 count、 sort、 values、 interval、および timeoffsetです。

ファセットパラメーター	説明と使用方法
`count`	構造体あたりのファセット用語の最大数。既定値は 10 です。たとえば `Tags,count:5` です。用語の数に上限はありませんが、値を大きくすると、特にファセットフィールドに多数の一意の用語が含まれている場合、パフォーマンスが低下します。これは、ファセットクエリがシャード間に分散される方法のためです。カウントを 0 に設定するか、"ファセット可能" フィールドの一意の値の数以上の値に設定すると、すべてのシャードで正確なカウントを取得できます。トレードオフは待機時間の増加です。
`sort`	`count`、`-count`、`value`、`-value`に設定します。 `count`を使用して、count で降順に並べ替えます。 `-count`を使用して、count で昇順に並べ替えます。 `value`を使用して、値で昇順に並べ替えます。値の降順で並べ替えるには、`-value` を使用します (たとえば、`"facet=category,count:3,sort:count"` は、各カテゴリ名を持つドキュメントの数の降順でファセット結果の上位 3 つのカテゴリを取得します)。上位 3 つのカテゴリが Budget、Motel、Luxury で、Budget が 5 ヒット、Motel が 6、Luxury が 4 の場合、バケットは Motel、Budget、Luxury の順になります。 `-value`の場合、`"facet=rating,sort:-value"`では、可能なすべての評価のバケットが値順に降順で生成されます (たとえば、評価が 1 から 5 の場合、各評価に一致するドキュメントの数に関係なく、バケットは 5、4、3、2、1 に並べ替えられます)。
`values`	ファセットエントリ値の動的なセットを指定するために、パイプで区切られた数値または `Edm.DateTimeOffset` 値を設定します。例: `"facet=baseRate,values:10 \| 20"` では、基本料金 0 以上 10 未満、10 以上 20 未満、20 以上の、3 つのバケットが生成されます。文字列 `"facet=lastRenovationDate,values:2010-02-01T00:00:00Z"` では、2010 年 2 月より前に改装されたホテル用と、2010 年 2 月 1 日以降に改装されたホテル用の 2 つのバケットが生成されます。期待される結果を得るには、値を昇順で連続してリストする必要があります。
`interval`	数値の場合は 0 より大きい整数の間隔、日付時刻値の場合は分、時、日、週、月、四半期、年。たとえば、 `"facet=baseRate,interval:100"` では、サイズ 100 の基本レート範囲に基づいてバケットが生成されます。基本レートがすべて $60 から $600 の間にある場合、0 から 100、100-200、200-300、300-400、400-500、500 から 600 のバケットがあります。文字列 `"facet=lastRenovationDate,interval:year"` は、ホテルが改装された年ごとに 1 つのバケットを生成します。
`timeoffset`	(`[+-]hh:mm, [+-]hhmm, or [+-]hh`) に設定できます。 `timeoffset` パラメーターを使用する場合は、`Edm.DateTimeOffset` タイプのフィールドに適用する場合にのみ、interval オプションと組み合わせる必要があります。この値は、時間境界を設定する際に考慮される UTC 時間オフセットを指定します。たとえば、 `"facet=lastRenovationDate,interval:day,timeoffset:-01:00"` では、01:00:00 UTC (ターゲットタイムゾーンの午前 0 時) から始まる日の境界が使用されます。

countsortは同じファセット仕様で結合できますが、intervalまたはvaluesと組み合わせることはできません。また、intervalとvaluesを組み合わせることはできません。

日付時刻の間隔ファセットは、 timeoffset が指定されていない場合、UTC 時刻に基づいて計算されます。たとえば、 "facet=lastRenovationDate,interval:day"の場合、日の境界は UTC の 00:00:00 から始まります。

このセクションは、アプリケーション開発に役立つヒントと回避策のコレクションです。

C#: プレゼンテーションレイヤーのコードを含むファセットナビゲーションの例については、 Web アプリに検索を追加することをお勧めします。サンプルには、フィルター、提案、オートコンプリートも含まれています。プレゼンテーションレイヤーには JavaScript と React が使用されます。

ファセットナビゲーション構造を完全に埋めるために、開いているクエリ ("search": "*") を使用して検索ページを初期化すると便利です。クエリ用語を要求で渡すと、ファセットナビゲーション構造はインデックス全体ではなく、結果内の一致に限定されます。この方法は、テスト中にファセットとフィルターの動作を確認する場合に役立ちます。クエリに一致条件を含める場合、応答では一致しないドキュメントが除外され、ファセットを除外するダウンストリーム効果が生じる可能性があります。

ユーザーエクスペリエンスを設計するときは、ファセットをクリアするためのメカニズムを必ず追加してください。ファセットをクリアするための一般的な方法は、開いているクエリを発行してページをリセットすることです。

ファセットを無効にしてストレージを節約し、パフォーマンスを向上させる

パフォーマンスとストレージの最適化のために、ファセットとして使用してはならないフィールドの "facetable": false を設定します。たとえば、ID や製品名などの一意の値の文字列フィールドを使用して、ファセットナビゲーションでの誤った (および効果のない) 使用を防ぎます。このベストプラクティスは、既定で文字列フィールドのフィルターとファセットを有効にする REST API にとって特に重要です。

ファセットナビゲーションでは Edm.GeographyPoint または Collection(Edm.GeographyPoint) フィールドを使用できないことに注意してください。ファセットはカーディナリティの低いフィールドで最適に機能することを思い出してください。 geo 座標の解決方法により、特定のデータセットで 2 つの座標セットが等しいことはまれです。そのため、ファセットは地理座標ではサポートされていません。場所ごとにファセットするには、市区町村または地域フィールドを使用する必要があります。

不適切なデータを確認する

インデックス作成用のデータを準備する際は、フィールド内のnull値、スペルミス、大文字小文字の不一致、および同じ単語の単数形と複数形を確認してください。既定では、フィルターやファセットでは字句解析やスペルチェックは実行されません。つまり、単語が 1 文字だけ異なる場合でも、"facetable" フィールドのすべての値が潜在的なファセットになります。

ノーマライザーは、データの不一致を軽減し、大文字小文字や文字の違いを修正できます。それ以外の場合は、データを検査するために、ソースのフィールドを確認したり、インデックスから値を返すクエリを実行したりできます。

インデックスは、null または無効な値を修正するのに最適な場所ではありません。ソースのデータの問題は、データベースまたは永続ストレージ、またはインデックス作成の前に実行するデータクレンジング手順で修正する必要があります。

バケット内で並べ替えることができますが、ナビゲーション構造全体のファセットバケットの順序を制御するためのパラメーターはありません。ファセットバケットを特定の順序で指定する場合は、アプリケーションコードで指定する必要があります。

特定の状況では、シャーディングアーキテクチャのために、ファセット数が十分に正確でない場合があります。すべての検索インデックスが複数のシャードに展開され、それぞれのシャードがドキュメント数によって上位 N 個のファセットを報告すると、単一の結果に結合されます。これは、各シャードの上位 N 個のファセットに過ぎないため、ファセット応答で一致するドキュメントが欠落または不足する可能性があります。

正確性を保証するために、数: <number> を大きい数に人為的に膨らませて、各シャードから完全なレポートを強制的に実行できます。ファセットを無制限にするために、"count": "0" を指定できます。または、"count" を、ファセットフィールドの一意の値の数以上の値に設定できます。たとえば、一意の値が 5 つある "size" フィールドでファセットを実行する場合、すべての一致がファセット応答で表されるように "count:5" を設定できます。

この対処法のトレードオフは、クエリ待機時間が増加することです。そのため、この方法は必要な場合にのみ使用してください。

Azure AI Search では、ファセットは現在の結果にのみ存在します。一般的なアプリケーションの要件として、ユーザーが元のルートをたどり直し、検索コンテンツを通じて代替パスを探索できるようにするために、静的なファセットのセットを保持することがあります。

動的ドリルダウンエクスペリエンスと共にファセットの静的セットが必要な場合は、2 つのフィルター処理されたクエリを使用して実装できます。1 つは結果にスコープを設定し、もう 1 つはナビゲーション目的でファセットの静的リストを作成するために使用します。

検索結果とファセットの結果が大きすぎる場合は、フィルターを追加することでトリミングできます。次の例では、 クラウドコンピューティングのクエリでは、254 項目がコンテンツタイプとして 内部仕様 を持っています。結果が大きすぎる場合、フィルターを追加すると、ユーザーは条件を追加してクエリを絞り込むことができます。

項目は相互に排他的ではありません。 1 つの項目が両方のフィルターの条件を満たしている場合、その項目はそれぞれにカウントされます。この重複は、ドキュメントのタグ付けを実装するために使用されることの多い Collection(Edm.String) フィールドのファセット処理で発生する可能性があります。

Search term: "cloud computing"
Content type
   Internal specification (254)
   Video (10)

次のステップ

ファセットナビゲーションの例

次の方法で共有

検索結果にファセット ナビゲーションを追加する

検索ページでのファセット ナビゲーション

コード内の絞り込みナビゲーション

フィールドでファセットを有効にする

属性を設定するフィールドを選択する

サポートされていないフィールドを回避する

新しいフィールド定義から始める

クエリでファセットを返す

ファセットを操作するためのベスト プラクティス

修飾されていない、または空の検索文字列を使用してファセット ナビゲーション構造を初期化します

ファセットをクリアする

ファセットを無効にしてストレージを節約し、パフォーマンスを向上させる

不適切なデータを確認する

ファセット バケットの順序付け

ファセット数の不一致

フィルター処理された結果のファセット ナビゲーション構造を非同期に保持する

フィルターを使用して大きなファセット数をオフセットする

次のステップ

フィードバック

その他のリソース

検索結果にファセットナビゲーションを追加する

検索ページでのファセットナビゲーション

ファセットを操作するためのベストプラクティス

修飾されていない、または空の検索文字列を使用してファセットナビゲーション構造を初期化します

ファセットバケットの順序付け

フィルター処理された結果のファセットナビゲーション構造を非同期に保持する