改进相关性

对于在企业级搜索结果的分级计算中使用的设置,本主题介绍调整这些设置所能采用的一些方式,此外还介绍为改进相关性可以尝试的其他技巧。

调整相关性设置时的注意事项

在修改相关性设置之前,务必要建立一个测试系统以比较做出更改前后的结果,这样可以验证在您的环境中更改对搜索结果相关性有负面影响、正面影响还是没有影响。

搜索管理员任务

搜索管理员可以执行多项在共享服务提供程序 (SSP) 管理级别和网站管理级别影响相关性的任务。

权威页面

权威页面 是由搜索管理员标为链接到最相关信息的页面,无论查询是什么。可以使用权威页面提高为一组内容计算的级别,前提是确保权威页面与内容之间的单击距离较低。

管理“权威页面”列表可以使用 SSP 管理用户界面,也可以使用搜索管理对象模型。有关使用该对象模型的信息,请参阅开发人员任务。

降级的网站

降级的网站 所含内容的相关性在任何查询中都低于其他内容;例如含有仍必须纳入内容索引的陈旧内容的网站。如果将网站添加到 SSP 的“降级的网站”列表,则该网站中所有内容的级别都将低于其他内容。

管理“降级的网站”列表可以使用 SSP 管理用户界面,也可以使用搜索管理对象模型。有关使用该对象模型的信息,请参阅开发人员任务。

编辑结果

关键字是组织认定为重要的词或短语。可以在网站管理级别添加关键字,然后使用它们在初始结果页面上显示其他信息和推荐链接(否则这些内容就不会显示在包含该关键字的查询得到的搜索结果中)。对一个关键字可以显示两条信息:词的定义和最佳匹配,后者是认定为与这个词非常相关的链接的列表。

关键字列表可以通过“网站设置”管理用户界面来管理,也可以使用搜索管理对象模型来管理。有关使用该对象模型的信息,请参阅开发人员任务。

开发人员任务

Microsoft Office SharePoint Server 2007 企业级搜索包括一个新的搜索管理对象模型,用于管理企业级搜索。本部分所述对象是管理对象模型的一部分。有关这个新对象模型的信息,请参阅企业级搜索管理对象模型入门

相关性对象模型

企业级搜索提供一个新的相关性对象模型,用于修改对搜索结果相关性进行级别计算时所使用的参数。

用于修改企业级搜索相关性参数的入口点是 Ranking 类。初始化 Ranking 类的实例时,要传递 SearchContext 对象作为构造函数中的参数。

权威页面

Ranking 类的 AuthorityPages 属性返回代表 SSP 所有权威页面的集合的 AuthorityPageCollection 对象。AuthorityPage 类代表单个权威页面。

降级的网站

Ranking 类的 DemotedSites 属性返回代表 SSP 所有降级网站的集合的 DemotedSiteCollection 对象。DemotedSite 类代表单个降级的网站。

分级参数

Ranking 类的 RankingParameters 属性返回代表 SSP 所有分级参数的集合的 RankParamCollection 对象。RankingParameter 类代表单个分级参数。

可以更新为分级参数指定的值,但不能对分级参数进行添加、删除或重命名。

下表介绍了企业级搜索分级参数。

参数

说明

k1

词频的饱和度常数。

Kqir

单击距离的饱和度常数。

wqir

用于计算相关性的单击距离的权重。

Kud

URL 深度的饱和度常数。

wud

用于计算相关性的 URL 深度的权重。

languageprior

应用于所用语言与用户语言不符的内容的分级的权重。

filetypepriorhtml

用于计算相关性的 HTML 内容类型的权重。

filetypepriordoc

用于计算相关性的 Microsoft Office Word 内容类型的权重。

filetypepriorppt

用于计算相关性的 Microsoft Office PowerPoint 内容类型的权重。

filetypepriorxls

用于计算相关性的 Microsoft Office Excel 内容类型的权重。

filetypepriorxml

用于计算相关性的 XML 内容类型的权重。

filetypepriortxt

用于计算相关性的纯文本内容类型的权重。

filetypepriorlistitems

用于计算相关性的列表项内容类型的权重。

Filetypepriormessage

用于计算相关性的 Microsoft Outlook 电子邮件内容类型的权重。

架构对象模型

更改属性权重

可以修改企业级搜索中任何托管属性的权重设置。有关演示如何完成此操作的代码示例,请参阅如何:更改托管属性的权重设置

备注

SQL 搜索语法的 Microsoft Office SharePoint Portal Server 2003 版本支持在查询时对列加权。而 SQL 搜索语法的Microsoft Office SharePoint Server 2007 企业级搜索版本则不支持对列加权。如果在迁移到 Office SharePoint Server 2007 的搜索查询中对列进行了加权,则搜索查询仍可运行,但对列加权的值将被忽略。

属性权重值在 ManagedProperty 类的 Weight 属性中进行设置。

更改属性的长度正则化

可以修改企业级搜索中任何托管属性的长度正则化设置。

属性长度正则化值在 ManagedProperty 类的 LengthNormalization 属性中进行设置。有关托管属性的信息,请参阅管理元数据

关键字对象模型

企业级搜索提供一个关键字对象模型,用于处理关键字、最佳匹配和定义。可以提升在其他情况下对特定搜索词或短语的搜索结果中不会加入的网站和信息。

关键字对象模型的入口点是 Keywords 类。使用 Keywords 类的 AllKeywords 属性检索与特定网站相关联的关键字的集合。若要检索该网站的最佳匹配集合,请使用 GetAllBestBets 方法。此方法返回 BestBetCollection,其中包含代表该网站最佳匹配集合的 BestBet 对象。

本节内容

如何:更改托管属性的权重设置

See Also

参考

Microsoft.Office.Server.Search.Administration.Ranking

Microsoft.Office.Server.Search.Administration.Schema

Microsoft.Office.Server.Search.Administration.Keywords

概念

企业级搜索相关性体系结构概述

企业级搜索体系结构

企业级搜索管理对象模型入门

其他资源

以编程方式管理企业级搜索