向查询添加分面 - Azure AI Search

你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

2025-04-21

分面导航用于在搜索应用中对查询结果进行自我定向筛选，其中应用程序提供表单控件，用于将搜索范围限定为文档组（例如类别或品牌），Azure AI 搜索提供了支持体验的数据结构和筛选器。

本文介绍在 Azure AI 搜索中返回分面导航结构的步骤。熟悉基本概念和客户端后，请继续阅读分面示例了解各种用例的语法，包括基本分面和唯一计数。

可通过预览 API 获取更多分面功能：

分层分面结构
分面筛选
分面聚合

分面导航示例提供预览功能的语法和用法。

分面是动态的，因为它们基于每个特定的查询结果集。搜索响应包含用于在结果中导航文档的所有分面存储桶。首先执行查询，然后从当前结果拉取分面，并组合成分面导航结构。

在 Azure AI 搜索中，分面深度为一层，除非使用预览 API，否则无法分层。如果你不熟悉分面导航结构，以下示例左侧显示的就是一个分面导航。计数指示每个分面的匹配项数。同一文档可以以不同方面表示。

分面可帮助你查找所需的内容，同时确保获取相关结果。作为开发人员，分面允许公开用于导航搜索索引的最有用的搜索条件。

在索引中支持的字段上启用分面，然后在查询上指定。响应的开头返回分面导航结构，然后是结果。

以下 REST 示例是一个空查询（"search": "*"），该查询的范围限定为整个索引（请参阅内置酒店示例）。参数 facets 指定“Category”字段。

POST https://{{service_name}}.search.windows.net/indexes/hotels/docs/search?api-version={{api_version}}
{
    "search": "*",
    "queryType": "simple",
    "select": "",
    "searchFields": "",
    "filter": "",
    "facets": [ "Category"], 
    "orderby": "",
    "count": true
}

示例的响应以分面导航结构开头。该结构由“Category”值和每个值的 hotel 计数组成。接下来是其余的搜索结果，为了简洁起见，这里将其精简为仅一个文档。此示例运行效果良好有多种原因。此字段的分面数未超过限制（默认值为 10），因此所有分面都得以显示，并且 50 个 hotel 索引中的每个 hotel 都只以其中一个类别表示。

{
    "@odata.context": "https://demo-search-svc.search.windows.net/indexes('hotels')/$metadata#docs(*)",
    "@odata.count": 50,
    "@search.facets": {
        "Category": [
            {
                "count": 13,
                "value": "Budget"
            },
            {
                "count": 12,
                "value": "Resort and Spa"
            },
            {
                "count": 9,
                "value": "Luxury"
            },
            {
                "count": 7,
                "value": "Boutique"
            },
            {
                "count": 5,
                "value": "Suite"
            },
            {
                "count": 4,
                "value": "Extended-Stay"
            }
        ]
    },
    "value": [
        {
            "@search.score": 1.0,
            "HotelId": "1",
            "HotelName": "Stay-Kay City Hotel",
            "Description": "The hotel is ideally located on the main commercial artery of the city in the heart of New York. A few minutes away is Time's Square and the historic centre of the city, as well as other places of interest that make New York one of America's most attractive and cosmopolitan cities.",
            "Category": "Boutique",
            "Tags": [
                "pool",
                "air conditioning",
                "concierge"
            ],
            "ParkingIncluded": false,
        },
        . . . 
    ]
}

可以向包含纯文本或数字内容的新字段添加分面。支持的数据类型包括字符串、日期、布尔字段和数值字段（但不包括向量）。

可以使用 Azure 门户、REST API、Azure SDK 或任何支持在 Azure AI 搜索中创建或更新索引架构的方法。第一步，确定用于分面的字段。

选择要分配属性的字段

可通过单值字段和集合计算分面。最适用于分面导航的字段具有以下特征：

人类可读（非矢量）内容。
低基数（在搜索语料库的整个文档中重复的少量不同值）。
简短的描述性值（一两个单词），可以在导航树中清晰显示。

字段中的值（而非字段名称本身）将生成分面导航结构中的分面。如果该分面是一个名为“Color”的字符串字段，则分面是“blue”、“green”和该字段的其他任何值。查看字段值以确保没有拼写错误、null 或大小写差异。请考虑为“filterable”和“facetable”字段分配规范器，以消除文本中的细小变化。例如，“Canada”、“CANADA”和“canada”将全部规范化为一个存储桶。

避免不受支持的字段

不能在现有字段、矢量字段或类型为Edm.GeographyPoint或Collection(Edm.GeographyPoint)的字段上设置分面。

在复杂字段集合上，“facetable”必须为空值。

从新的字段定义开始

仅当创建字段时，才能设置影响字段索引方式的属性。此限制适用于分面和筛选器。

如果索引已存在，可以添加提供分面的新字段定义。索引中的现有文档在新字段中获得空值。下次刷新索引时，将替换此 null 值。

如果定义了索引架构，则在添加到索引的新字段上设置 "facetable": true 时，会启用分面。尽管这不是严格要求，但最佳实践是设置“可筛选”属性，以便可以构建支持搜索应用程序中分面导航体验的必要筛选器。

从创建或更新索引请求开始，并指定字段集合。

以下是 hotels 示例索引的 JSON 示例，显示了包含单个值或短语的低基数字段“Category”、“Tags”和“Rating”的“facetable”和“filterable”属性。

{
  "name": "hotels",  
  "fields": [
    { "name": "hotelId", "type": "Edm.String", "key": true, "searchable": false, "sortable": false, "facetable": false },
    { "name": "Description", "type": "Edm.String", "filterable": false, "sortable": false, "facetable": false },
    { "name": "HotelName", "type": "Edm.String", "facetable": false },
    { "name": "Category", "type": "Edm.String", "filterable": true, "facetable": true },
    { "name": "Tags", "type": "Collection(Edm.String)", "filterable": true, "facetable": true },
    { "name": "Rating", "type": "Edm.Int32", "filterable": true, "facetable": true },
    { "name": "Location", "type": "Edm.GeographyPoint" }
  ]
}

REST 中的默认值

Azure 门户和 REST API 都具有基于数据类型的字段属性的默认值。默认情况下，以下数据类型具有“filterable”和“facetable”属性：

Edm.String 和 Collection(Edm.String)
Edm.DateTimeOffset 和 Collection(Edm.DateTimeOffset)
Edm.Boolean 和 Collection(Edm.Boolean)
Edm.Int32、 Edm.Int64、 Edm.Double及其集合等效项

回想一下，分面是从查询响应中的结果动态计算出来的。仅将获取当前查询找到的文档的分面。

Azure 门户
REST

分面配置是在查询时进行的。使用搜索 POST 或搜索 GET 请求或等效的 Azure SDK API 来指定属性。

在请求中设置分面查询参数。在 Search POST 中， facets 是应用于搜索查询的分面表达式数组。每个分面表达式都包含一个字段名称，可以选择后跟逗号分隔的名称值对列表。有效的分面参数包括count、sort、values和intervaltimeoffset。

分面参数	说明和用法
`count`	每个结构的最大分面术语数;默认值为 10。示例为 `Tags,count:5`。术语数没有上限，但较高的值会降低性能，尤其是在分面字段包含大量唯一术语时。这由分面查询分布在各个分片上的方式所导致。可以将计数设置为零或者设置为大于或等于“facetable”字段中唯一值的数量，以获取所有分面的准确计数。权衡会增加延迟。
`sort`	设置为 `count`，，`-count`，`value`。 `-value` 使用 `count` 按计数降序排序。使用 `-count` 按计数执行升序排序。用于 `value` 按值升序排序。用 `-value` 按值降序排序（例如，`"facet=category,count:3,sort:count"` 在分面结果中按类别名称的文档数降序排列，获取前三个类别）。如果前三个类别是 Budget、Motel 和Luxury，Budget 有 5 个命中，Motel 有 6 个，Luxury 有 4 个，存储桶将以 Motel、 Budget、Luxury 的顺序排序。对于 `-value`，`"facet=rating,sort:-value"` 按值降序生成所有可能的评分的分组（例如，如果评分从 1 到 5，则分组排序为 5、4、3、2、1，而不考虑每个评分匹配的文档数）。
`values`	设置为竖线分隔数字或 `Edm.DateTimeOffset` 值，用于指定分面项值的动态组。例如，`"facet=baseRate,values:10 \| 20"` 生成三个区间：一个用于基速率0到不包括10，一个用于10到不包括20，一个用于20及以上。字符串 `"facet=lastRenovationDate,values:2010-02-01T00:00:00Z"` 生成两个类别：一个用于在 2010 年 2 月之前装修的酒店，一个用于在 2010 年 2 月 1 日或之后装修的酒店。这些值必须按顺序按升序列出才能获取预期结果。
`interval`	数字或分钟、小时、日、周、月、季度、年等日期时间值的整数间隔大于零。例如，`"facet=baseRate,interval:100"` 基于大小 100 的基准费率排名生成存储桶。如果基本费率都在 60 到 600 美元之间，则有 0-100、100-200、200-300、300-400、400-500 和 500-600 的区间。字符串 `"facet=lastRenovationDate,interval:year"` 为酒店翻新的每一年生成一个存储桶。
`timeoffset`	可以设置为（`[+-]hh:mm, [+-]hhmm, or [+-]hh`）。如果使用 `timeoffset` 参数，则必须将其与间隔选项组合在一起，并且仅当应用于 `Edm.DateTimeOffset` 类型的字段时。该值指定在设置时间边界时要考虑的 UTC 时间偏移量。例如： `"facet=lastRenovationDate,interval:day,timeoffset:-01:00"` 使用从 01：00：00 UTC（目标时区午夜）开始的日边界。

count和sort可以在同一方面规范中组合，但不能与interval或values组合，并且interval和values不能组合在一起。

未指定 timeoffset 时，日期时间的间隔分面将基于 UTC 时间计算。例如， "facet=lastRenovationDate,interval:day"日边界从 00：00：00 UTC 开始。

本部分是有助于应用程序开发的提示和解决方法的集合。

建议 C#: 向 Web 应用添加搜索功能，这是一种包括表示层代码的分面导航示例。此示例还包括筛选器、建议和自动完成。它对呈现层使用 JavaScript 和 React。

使用开放查询 ("search": "*") 初始化搜索页以完全填充分面导航结构，这一方法非常有用。在请求中传递查询词后，分面导航结构的范围仅限定为结果中的匹配项，而不是整个索引。这种做法有助于在测试流程中验证分面和筛选行为。如果在查询中包含匹配条件，响应将排除不匹配的文档，这可能会对后续步骤产生排除分面的潜在影响。

设计该用户体验时，请记住添加用于清除分面的机制。清除分面的常见方法是发起一个开放查询以重置页面。

禁用分面功能以节省存储空间，并提高性能。

对于性能和存储优化，请为不应用作分面的字段设置 "facetable": false。示例包括用于唯一值的字符串字段（如 ID 或产品名称），以防止其在分面导航中被意外（且无效）使用。此最佳做法对于 REST API 尤其重要，该 API 默认启用字符串字段上的筛选器和分面。

请记住，无法在分面导航中使用 Edm.GeographyPoint 或 Collection(Edm.GeographyPoint) 字段。回想一下，分面最适合用于基数较小的字段。由于地理坐标的解析方式，在给定的数据集中，任何两组坐标相等的情况都很少见。因此，地理坐标不支持分面。应使用城市或区域字段来按位置进行分面。

检查错误数据

准备用于编制索引的数据时，请检查空值、拼写错误或大小写差异的字段，以及同一单词的单个和复数版本。默认情况下，筛选器和分面不进行词法分析或拼写检查，这意味着“facetable”字段的所有值都可能生成分面，即使这些单词只相差一个字符。

规范化器可以缓解数据差异，纠正大小写和字符差异。否则，若要检查数据，可以在其源处检查字段，或运行从索引返回值的查询。

索引不是修复 null 值或无效值的最佳位置。应修复源中的数据问题，假设它是数据库或持久性存储，或在编制索引之前执行的数据清理步骤中。

虽然可以在一个存储桶内进行排序，但在整体导航结构中，没有用于控制分面存储桶顺序的参数。如果希望分面桶按特定顺序排列，则必须在应用程序代码中实现。

在某些情况下，你可能会发现由于分片体系结构，分面计数并不完全准确。每个搜索索引都分布在多个分片上，每个分片报告文档数量最多的前 N 个分面，然后将这些分面合并为一个结果。因为这只是每个分片的前 N 个分面，所以可能会在分面响应中遗漏或少计匹配的文档。

为保证准确性，可以人为地将 count:<number> 增加到一个较大的数字，用于强制从每个分片进行完整报告。可以为无限分面指定 "count": "0"。或者，可以将“count”设置为大于或等于分面字段的唯一值数的值。例如，如果按具有五个唯一值的“size”字段进行分面，则可以设置 "count:5" 以确保分面响应表示所有匹配项。

此解决方法的缺点会增加查询延迟，因此仅在必要时才使用这种方法。

在 Azure AI 搜索中，只有当前结果存在分面。但是，一项常见的应用程序要求是保留一组静态分面，便于用户按相反顺序进行导航，回顾步骤以通过搜索内容了解可选路径。

如果您希望在动态钻取体验的同时拥有一组静态分面，可以通过使用两个筛选查询来实现：一个查询针对结果进行限定，另一个则用于创建一个静态的分面列表，以便于导航。

太大的搜索结果和分面结果可以通过添加筛选器来精简。在以下示例中，在 云计算的查询中，254 个项目具有 内部规范 作为内容类型。如果结果太大，添加筛选器可帮助用户通过添加更多条件来优化查询。

项目之间并不相互排斥。如果某个项满足这两个筛选条件，它将分别计入每一个。针对通常用于实现记录标记的 Collection(Edm.String) 字段进行分面时，可能会出现这种重复。

Search term: "cloud computing"
Content type
   Internal specification (254)
   Video (10)

后续步骤

分面导航示例

通过

将分面导航添加到搜索结果

搜索页面中的分面导航

代码中的分面导航

在字段上启用分面

选择要分配属性的字段

避免不受支持的字段

从新的字段定义开始

返回查询中的分面

使用分面的最佳做法

使用非限定或空搜索字符串初始化分面导航结构

清除分面

禁用分面功能以节省存储空间，并提高性能。

检查错误数据

对分面存储桶进行排序

分面计数中的差异

以异步方式保留筛选结果的分面导航结构

通过筛选器偏移较大的分面计数

后续步骤

反馈

其他资源