在 SharePoint 中管理搜索架构

搜索架构控制用户可以搜索的内容、用户如何搜索,以及如何在搜索网站上显示结果。 通过更改搜索架构,可以在 Microsoft 365 中的 SharePoint 中自定义搜索体验。

有关特定于 SharePoint Online 的已爬网属性和托管属性的列表,请参阅 SharePoint Online 中 已爬网和托管属性的概述。

有关 SharePoint 中现有已爬网属性和托管属性的列表,请参阅 SharePoint Server 中的 已爬网属性和托管属性概述。

关于搜索架构

当用户在 SharePoint 网站上搜索内容时,搜索只会找到 搜索索引中的内容,并且仅显示用户有权查看的结果。

搜索通过爬网网站上的项目来发现信息。 发现的内容和元数据称为项 的属性搜索架构包含已爬网属性列表,可帮助爬网程序确定要提取的内容和元数据。

并非所有已爬网内容或元数据都可用于搜索索引,因此搜索架构具有一系列有用的内容和元数据,称为 托管属性。 索引仅包含托管属性中的内容和元数据。 索引的有用元数据示例包括文档的作者和标题。

搜索附带映射到托管属性的相关已爬网属性。 例如,与作者相关的已爬网属性映射到与作者相关的托管属性。 如果添加托管属性,则必须将其映射到已爬网属性,才能将内容添加到索引中。 对网站、库或列表进行爬网后,用户可以搜索新或已更改的托管属性的内容和元数据。 有关详细信息,请参阅 SharePoint 搜索架构简介

注意

Microsoft Excel 文件中的数值数据不会编制索引。 例如,不会为数字“123456789”编制索引,但对字符串“PO123456789”编制索引。

每个托管属性都具有确定用户如何搜索该托管属性的内容以及如何在搜索结果中显示内容的设置。

可以创建新的 自定义 托管属性,但这些属性只能包含文本或“是/否”。 如果需要自定义托管属性中的其他内容类型,请使用搜索附带的未使用的 内置 托管属性之一。 这些托管属性可以包含整数、小数、日期和时间、双精度浮点数或二进制格式的信息。 可以使用别名设置“重命名”这些未使用的托管属性。

对于内置托管属性,可以将其映射更改为已爬网属性,但唯一可以更改的设置是别名。

重要

如果将别名添加到托管属性,请确保与别名同名的托管属性不存在。 在搜索期间,别名托管属性优先,依赖于特定属性和值的 Microsoft 365 体验可能会因此中断。

不建议为现有托管属性更改已爬网属性的映射或映射顺序,这些属性超出了为重复使用 提供的默认未使用托管属性 ,或手动创建的托管属性。 更改已爬网属性映射可能会破坏依赖于特定属性和值的 Microsoft 365 体验。

定义用户可以搜索和获取结果的内容

如果将托管属性设置为 可搜索,则会将内容添加到索引中。 这意味着,对“Smith”的简单查询将返回包含单词“Smith”的项,以及其“author”属性包含“Smith”的项。 如果希望用户能够“仅搜索具有此特定作者的项目”,请将 author 属性设置为 可查询。 然后,若要仅查找具有名为 Smith 的作者的项目,用户可以查询“author:Smith”。

如果要防止托管属性中的内容显示为搜索结果,可以禁用托管属性的 可检索 设置。

如果不希望匿名用户看到托管属性中的信息(例如谁创作了项),请禁用托管属性的“匿名安全”设置。

当你具有多语言内容和元数据时,使用特殊字符获取更好的搜索结果

当搜索为内容编制索引或处理查询时,它会将文本流分解为较小的部分,例如单词、短语、符号或其他有意义的元素。 这些部分称为令牌。 当用户输入查询时,搜索会尝试在索引中查找与查询标记匹配的标记。

对于大多数语言,搜索会将文本更改为小写,删除音调符号,将特殊字符(如标点符号)替换为空格,然后中断空格。

对于英语等语言,中断空格效果很好,但对于东亚语言则不太好。 假设你有一个文档库,其中包含英文和中文产品数据表。 每个数据表都有一个产品标识符,其中包含非字母数字字符,例如“11.132-84-115#4”。 当搜索处理数据表时,它会 检测 其语言,并根据该语言标记其中的所有内容。 因此,中文数据表中的产品标识符被标记为中文文本,在英文数据表中,产品标识符被标记为英文文本。 当用户搜索产品标识符时,搜索会根据其所在 SharePoint 网站的语言设置对其查询进行标记化。 如果网站设置为英语,并且用户搜索标记为中文文本的产品标识符,则令牌可能不匹配,并且用户不会获得任何结果。

下面介绍了如何更好地为用户提供结果:搜索对数据表进行爬网时,它会提取产品标识符。 将产品标识符的已爬网属性映射到新的托管属性“ProductID”。 为“ProductID”托管属性启用非特定语言标记化,并指示用户针对“ProductID”托管属性搜索产品标识符,如下所示:ProductID:“11.132-8”。 由于你为“ProductID”启用了非特定语言标记化,因此搜索对查询使用非特定语言标记化,并且可以查找查询的匹配结果。

具有具有特殊字符的元数据时,获取更好的搜索结果

为了帮助用户在包含具有非字母数字字符的元数据的托管属性中搜索时获得更好的搜索结果,可以为托管属性启用 更精细的标记化 设置。

让我们再次查看产品数据表库的示例。

希望快速输入查询,然后浏览结果以查找要查找的数据表的用户,通常输入类似于 ProductID:“132-884”的查询。 由于搜索将 搜索索引 的内容划分为比 查询更小的部分,因此搜索可能找不到这些查询的匹配项。 当查询标记化得更精细时,搜索索引和查询中的标记之间更有可能存在匹配项。 用户还可以查询产品标识符的中间或最后一部分。

搜索数据表并且只希望获取与完整产品标识符匹配的结果的用户,通常会编写 类似于 ProductID:“11.132-884-115#4” 的查询。 精细的查询标记化不会对此类查询产生影响。

确定结果中显示的标题

单个已爬网属性可以映射到多个托管属性。 或者,多个已爬网属性可以映射到单个托管属性,例如,“Writer”和“Author”爬网属性都可以映射到“Author”托管属性。

例如,库中的文档可以具有 SharePoint 标题、文件元数据中的标题,并且内容可以具有格式为“Title”的标题。 所有这些都映射到“Title”托管属性。 它是映射列表中最高的已爬网属性的标题,并且具有包含在索引中的值。

自动生成的托管属性

某些托管属性是自动生成的。 例如,向 SharePoint 库或列表添加网站栏。 当对列表进行搜索爬网时,它将自动生成网站栏的已爬网属性和托管属性,以及它们之间的映射。 另一个示例是爬网在已上传到 SharePoint 的文档中查找元数据。 如果尚未映射到该元数据的托管属性,例如“Title”,则搜索会自动生成托管属性。 已爬网属性的类型决定了自动生成的托管属性的设置。

搜索架构在搜索架构中以灰色显示自动生成的托管属性的名称及其到已爬网属性的映射。 搜索架构不保存托管自动生成的托管属性的设置。 设置存在,但它们在搜索架构中隐藏。 可以为已爬网属性添加到其他托管属性的映射,但如果更改任何其他设置,则替代其他隐藏) 设置 (,自动生成的托管属性将转换为常规托管属性。 如果决定 更改 自动生成的托管属性 ,请仔细 查看所有设置,就像手动创建新属性一样。

重要

自动生成的托管属性区分大小写。 访问自动生成的托管属性(例如通过 REST 查询)时,请验证大小写是否正确。 如果大小写不正确,则不会返回任何值。

优化托管属性

如果要在搜索结果页上使用托管属性作为精简条件,请使用可 精简设置。 此设置仅适用于内置托管属性,并且仅 影响经典搜索体验。 如果需要使用新的托管属性或自动生成的托管属性作为精简条件,请使用别名将现有未使用的托管属性重命名为可精简 () 。 有相当多的托管属性可用于此目的。 它们的名称为“RefinableString00”和“RefinableDate19”。

例如,创建名为“NewColors”的新网站栏,并且希望用户在优化搜索结果时能够使用“NewColors”作为选项。 在搜索架构中,选择未使用的托管属性(例如“RefinableString00”),并使用别名设置将该属性重命名为“NewColors”。 然后,将此新的托管属性映射到相关的已爬网属性。

更改租户级别或网站集级别的搜索架构

通常,除非想要创建更高级或自定义的搜索体验,否则不必更改租户的默认搜索架构。

可以更改整个租户或特定网站集的搜索架构。 网站集的搜索架构基于租户的搜索架构,因此通常首先在租户级别进行更改,然后在网站集级别进行更改。 对网站集所做的任何更改仅应用于该网站集。

爬网和重新编制索引

更改托管属性或添加新属性时,更改仅在重新爬网内容后生效。 在 Microsoft 365 中的 SharePoint 中,根据定义的爬网计划自动进行爬网。

向列表或库添加新属性时,或者更改了列表或库中使用的属性时,搜索必须重新爬网内容,然后所做的更改才会反映在搜索索引中。 由于更改是在搜索架构中进行的,而不是对实际网站所做的更改,因此搜索不会自动重新爬网列表或库。 若要确保对更改进行爬网,可以专门请求重新编制列表或库的索引。 执行此操作时,将重新爬网列表或库内容,以便可以在查询、查询规则和显示模板中使用新的托管属性。

托管属性和 Delve

Delve 使用托管属性来查询 Office 图形并在 Delve 中显示内容卡。 例如,可以在 Delve 内容卡上看到 Author、Filename、ModifiedBy 和 LastModifiedTime 等托管属性。

用户可以在 Microsoft 365 中查看或编辑的任何文档也可以显示在 Delve 中。 Delve 不会更改任何权限,用户只会看到他们已有权访问的文档。 不过,有时你可能希望阻止文档显示在 Delve 中。

可以使用 HideFromDelve 托管属性从 Delve 隐藏文档。 你可以继续将文档存储在Office 365中,用户仍然可以通过搜索找到它 - 它不会再显示在 Delve 中。 请参阅 从 Delve 隐藏文档

有关 Delve 的详细信息,请参阅 Office Delve for Office 365 管理员

创建新的托管属性

注意

并非所有选项在 Microsoft 365 中的 SharePoint 中都可用。 无法创建可精简托管属性。 请改用现有的 Refinable 托管属性,例如 RefinableString00 或 RefinableInt00。 搜索“可精简”将显示所有可用的精简托管属性。

在 Microsoft 365 中的 SharePoint 中,创建新的托管属性时,它将有一些限制。 例如,属性类型只能是" Text "或" Yes/No ",而且无法精简搜索结果或进行排序。

重要

请考虑在托管属性名称中仅使用字母和数字。 尽管可以使用特殊字符(如连字符、点和下划线) ) (创建自定义托管属性,但其中许多字符在查询语法中充当运算符字符。 例如,连字符表示求反。 在查询中使用时,此类属性名称必须用双引号引起来。 许多创建查询的工具和应用程序未正确处理此问题,因此最好在托管属性名称中仅使用字母和数字。

如果需要不同类型的属性,或者具有不同于可用属性的特征的属性,请按照 通过重命名现有托管属性创建托管属性下的步骤操作。

转到租户的“搜索架构”页

  1. 转到 sharePoint 管理中心更多功能,并使用对组织管理员权限的帐户登录。

注意

如果使用的是由世纪互联(中国)运营的 Office 365,请登录 Microsoft 365 管理中心,然后浏览到 SharePoint 管理中心并打开“更多功能”页面。

  1. “搜索”下,选择“ 打开”。

  2. 在搜索管理页上,选择“ 管理搜索架构”。

转到网站集的“搜索架构”页

  1. 在网站上,选择 设置设置”图标,然后选择“ 网站设置”。 如果未看到 “网站设置”,请选择“ 网站信息”,然后选择“ 查看所有网站设置”。

  2. “网站集管理”下,选择“ 搜索架构”。

  3. 选择“托管属性”。

  4. “托管属性” 页上,选择“ 新建托管属性”。

  5. “名称和说明 ”部分的“ 属性名称 ”框中,输入新托管属性的名称。 (可选)输入说明。

  6. “类型” 部分中,选择属性的可用选项之一:

  • 是/否。

  • 文本。

  1. 在"主特征"部分,请选择一个或多个可用选项。

  2. “映射到已爬网属性” 部分中,选择“ 添加映射”。

  3. “已爬网属性选择 ”对话框中,选择要映射到托管属性的已爬网属性,然后选择“ 确定”。 如果要将更多已爬网属性映射到同一托管属性,请重复此步骤。

  4. “映射到已爬网属性” 部分中,指定是否要包括:

  • 映射到此托管属性的所有已爬网属性的所有内容。

  • 第一个包含值的已爬网属性中的内容及其顺序(可选)。

  1. 选择“确定”。

通过重命名现有托管属性来创建托管属性

转到租户的“搜索架构”页

  1. 转到 sharePoint 管理中心更多功能,并使用对组织管理员权限的帐户登录。

注意

如果使用的是由世纪互联(中国)运营的 Office 365,请登录 Microsoft 365 管理中心,然后浏览到 SharePoint 管理中心并打开“更多功能”页面。

  1. “搜索”下,选择“ 打开”。

  2. 在搜索管理页上,选择“ 管理搜索架构”。

转到网站集的“搜索架构”页

  1. 在网站上,选择 设置设置”图标,然后选择“ 网站设置”。 如果未看到 “网站设置”,请选择“ 网站信息”,然后选择“ 查看所有网站设置”。

  2. “网站集管理”下,选择“ 搜索架构”。

  3. “托管属性” 页上,找到未使用的托管属性。 By unused, we mean that the property is not mapped to a crawled property: the Mapped Crawled Properties column is empty. See the Default unused managed properties table for more details.

    重要

    为了能够在以后使用 属性作为精简条件,请选择一个用 Refine 标记的托管属性。

  4. 指向托管属性,选择箭头,然后选择 “编辑/映射属性”。

  5. “编辑托管属性” 页的“ 主要特征”下的 “别名” 部分的“ 别名 ”框中,输入属性的新名称。

  6. “映射到已爬网属性” 部分中,选择“ 添加映射”。

  7. 在“ 已爬网属性选择 ”页上,选择要映射到托管属性的已爬网属性,然后选择“ 确定”。 Repeat this step to map more crawled properties to this managed property.

  8. 选择“确定”。

    重要

    以这种方式创建新的托管属性后,必须先对将使用精简条件的库或列表进行重新爬网并重新编制索引,然后属性才会在精简配置中显示为选项。 请参阅 请求重新编制文档库或列表的索引

查看已爬网属性和托管属性

转到租户的“搜索架构”页

  1. 转到 sharePoint 管理中心更多功能,并使用对组织管理员权限的帐户登录。

注意

如果使用的是由世纪互联(中国)运营的 Office 365,请登录 Microsoft 365 管理中心,然后浏览到 SharePoint 管理中心并打开“更多功能”页面。

  1. “搜索”下,选择“ 打开”。

  2. 在搜索管理页上,选择“ 管理搜索架构”。

转到网站集的“搜索架构”页

  1. 在网站上,选择 设置设置”图标,然后选择“ 网站设置”。 如果未看到 “网站设置”,请选择“ 网站信息”,然后选择“ 查看所有网站设置”。

  2. “网站集管理”下,选择“ 搜索架构”。

  3. 在“ 托管属性” 选项卡上,可以看到所有托管属性、托管属性上的设置,以及它们映射到的已爬网属性。

  4. 若要查看已爬网属性及其映射到的托管属性,请选择“ 已爬网属性”。

  5. 若要查看已爬网属性类别,请选择“ 类别”。

编辑托管属性

注意

并非所有选项在 SharePoint 中都可用。

转到租户的“搜索架构”页

  1. 转到 sharePoint 管理中心更多功能,并使用对组织管理员权限的帐户登录。

注意

如果使用的是由世纪互联(中国)运营的 Office 365,请登录 Microsoft 365 管理中心,然后浏览到 SharePoint 管理中心并打开“更多功能”页面。

  1. “搜索”下,选择“ 打开”。

  2. 在搜索管理页上,选择“ 管理搜索架构”。

转到网站集的“搜索架构”页

  1. 在网站上,选择 设置设置”图标,然后选择“ 网站设置”。 如果未看到 “网站设置”,请选择“ 网站信息”,然后选择“ 查看所有网站设置”。

  2. “网站集管理”下,选择“ 搜索架构”。

  3. 在“ 托管属性” 选项卡上的“ 属性名称” 列中,找到要编辑的托管属性,或在“ 筛选器 ”框中输入名称。

  4. 指向列表中的托管属性,选择箭头,然后选择 “编辑/映射属性”。

  5. “编辑托管属性” 页上,编辑设置,然后选择“ 确定”。

删除托管属性

转到租户的“搜索架构”页

  1. 转到 sharePoint 管理中心更多功能,并使用对组织管理员权限的帐户登录。

注意

如果使用的是由世纪互联(中国)运营的 Office 365,请登录 Microsoft 365 管理中心,然后浏览到 SharePoint 管理中心并打开“更多功能”页面。

  1. “搜索”下,选择“ 打开”。

  2. 在搜索管理页上,选择“ 管理搜索架构”。

转到网站集的“搜索架构”页

  1. 在网站上,选择 设置设置”图标,然后选择“ 网站设置”。 如果未看到 “网站设置”,请选择“ 网站信息”,然后选择“ 查看所有网站设置”。

  2. “网站集管理”下,选择“ 搜索架构”。

  3. 在“ 托管属性” 选项卡上,找到要删除的托管属性,或在 “筛选器 ”框中输入其名称。

  4. 指向要删除的托管属性,选择箭头,然后选择 “删除”。

  5. 选择“确定”。

    重要

    如果删除托管属性: > 用户无法搜索该属性。 > 使用 属性的查询规则不再有效。 > 使用 属性的自定义 Web 部件不再有效。

将已爬网属性映射到托管属性

转到租户的“搜索架构”页

  1. 转到 sharePoint 管理中心更多功能,并使用对组织管理员权限的帐户登录。

注意

如果使用的是由世纪互联(中国)运营的 Office 365,请登录 Microsoft 365 管理中心,然后浏览到 SharePoint 管理中心并打开“更多功能”页面。

  1. “搜索”下,选择“ 打开”。

  2. 在搜索管理页上,选择“ 管理搜索架构”。

转到网站集的“搜索架构”页

  1. 在网站上,选择 设置设置”图标,然后选择“ 网站设置”。 如果未看到 “网站设置”,请选择“ 网站信息”,然后选择“ 查看所有网站设置”。

  2. “网站集管理”下,选择“ 搜索架构”。

  3. 选择 “已爬网属性”。

  4. 在“ 已爬网属性” 页上,找到要映射到托管属性的已爬网属性,或者在 “筛选器”下,在“ 已爬网属性 ”框中输入其名称。

  5. 指向要映射的已爬网属性,选择箭头,然后选择 “编辑/映射属性”。

  6. “编辑已爬网属性” 页上的“ 映射到托管属性” 部分中,选择“ 添加映射”。

  7. “托管属性选择 ”对话框中,选择要映射到已爬网属性的托管属性,然后选择“ 确定”。 Repeat this step to map more managed properties to this crawled property.

  8. 在“ 在全文索引中包括 ”部分,如果要将此已爬网属性的内容包含在全文索引中,请选中该框。

  9. 选择“确定”。

查看或编辑已爬网属性类别

转到租户的“搜索架构”页

  1. 转到 sharePoint 管理中心更多功能,并使用对组织管理员权限的帐户登录。

注意

如果使用的是由世纪互联(中国)运营的 Office 365,请登录 Microsoft 365 管理中心,然后浏览到 SharePoint 管理中心并打开“更多功能”页面。

  1. “搜索”下,选择“ 打开”。

  2. 在搜索管理页上,选择“ 管理搜索架构”。

转到网站集的“搜索架构”页

  1. 在网站上,选择 设置设置”图标,然后选择“ 网站设置”。 如果未看到 “网站设置”,请选择“ 网站信息”,然后选择“ 查看所有网站设置”。

  2. “网站集管理”下,选择“ 搜索架构”。

  3. 选择 “类别”。

  4. 在“类别”页上,查找要查看或编辑的已爬网属性类别。

  5. 执行下列操作之一:

    • 若要 查看 哪些已爬网属性属于某类别,以及它们映射到哪些托管属性,请单击"类别"页中的已爬网属性类别。

    • 若要编辑类别,请指向要编辑的已爬网属性类别,单击箭头,然后单击 “编辑类别”。

默认未使用托管属性

下表提供了可以重用和使用别名进行重命名的默认未使用托管属性的概述。

托管属性类型 Count Query 搜索 检索 完善 Sort 托管属性名称范围 注意
日期 10 - 查询 - - - - Date00 到 Date09
日期 20 查询 - 检索 完善 Sort RefinableDate00 到 RefinableDate19
日期 2 - 查询 - 检索 完善 Sort RefinableDateInvariant00 到 RefinableDateInvariant01 *
日期 5 - 查询 - 检索 完善 Sort RefinableDateSingle00 到 RefinableDateSingle04
小数 10 - 查询 - - - - Decimal00 到 Decimal09
小数 10 查询 - 检索 完善 Sort RefinableDecimal00 到 RefinableDecimal09
双精度数 10 - 查询 - - - - Double00 到 Double09
双精度数 10 查询 - 检索 完善 Sort RefinableDouble00 到 RefinableDouble09
整数 50 - 查询 - - - - Int00 到 Int49
整数 50 查询 - 检索 完善 Sort RefinableInt00 到 RefinableInt49
String 200 查询 - 检索 完善 Sort RefinableString00 到 RefinableString199
String 40 查询 - 检索 完善 Sort RefinableStringFirst00 到 RefinableStringFirst39 *
字符串 10 查询 - 检索 完善 Sort RefinableStringLn00 到 RefinableStringLn09 **
String 50 - 查询 - 检索 完善 Sort RefinableStringWbOff00 到 RefinableStringWbOff49 ***
字符串 50 查询 - 检索 完善 Sort RefinableStringWbOffFirst00 到 RefinableStringWbOffFirst49 *, ***

* 映射到已爬网属性 - 根据指定顺序包括第一个已爬网属性中不为空的内容。

** 语言中性断字符

完成匹配

从 Delve 隐藏文档

如果不希望文档显示在 Delve 中,可以创建类型为 “是/否”的 HideFromDelve 网站栏。 此网站栏创建一个新的已爬网属性ows_HideFromDelve,该属性会自动映射到 HideFromDelve 托管属性。

将网站栏添加到存储文档的库或列表中

  1. 以网站集管理员身份登录,然后转到要从 Delve 中隐藏的文档所在的网站。

  2. 在功能区上,选择“ 列表 ”或“ ”选项卡。

  3. “管理视图 ”组中,选择“ 创建列”。

  4. “名称和类型”部分的“列名称”框中,输入 HideFromDelve,然后选择“是/否” (检查 框) *

    重要

    “其他列设置” 部分的 “默认值 ”下拉列表中,选择“ ”。 如果选择“ ”,则所有新文档将从 Delve 中隐藏。

  5. 执行下列操作之一:

  • 对于 SharePoint 2016 或 Microsoft 365 中的 SharePoint,请清除“添加到所有内容类型检查框。

  • 对于 SharePoint 2013,请清除“添加到默认视图检查框。

  1. 选择“确定”。

标记要从 Delve 中隐藏的文档

  1. 转到要从 Delve 中隐藏的文档的存储位置。

  2. 找到要在库或列表中隐藏的文档,选择“编辑属性”,然后检查 HideFromDelve

  3. 选择“确定”。

在下一次计划爬网之后,或者 请求重新编制文档库或列表的索引后,文档将从 Delve 中隐藏。 如果希望文档再次显示在 Delve 中,请取消选中隐藏文档的 HideFromDelve 列。

请求重新编制文档库或列表的索引

  1. 在您的网站上,转到已在其中添加新属性的列表或库,然后选择标题。 将显示“ ”或“ 列表 ”选项卡。

  2. 在功能区上,选择“ ”选项卡或“ 列表 ”选项卡。

  3. “设置” 部分下,选择“ 库设置” 或“ 列出设置”。

  4. “设置” 页上的 “常规设置”下,选择“ 高级设置”。

  5. 向下滚动到 “重新编制文档库索引 ”或“ 重新编制索引列表”,然后选择按钮。 在下一次计划爬网期间,将重新为文档库或列表中的所有内容编制索引。

    注意

    这可能会导致搜索系统承受大量负载,因此请务必仅在完成要重新编制索引的所有更改后才重新编制索引。

SharePoint Online 中的已爬网属性和托管属性概述

已爬网和托管属性在 SharePoint Server 中的概述

SharePoint Server 中的搜索架构概述

手动请求对网站进行爬网和重新编制索引