查找相似 (FAST Search Server 2010 for SharePoint)

查找相似 功能允许您搜索与已检索到的查询结果相似的文档。

上次修改时间: 2011年9月1日

相似性计算基于统计度量值。FAST Search Server 2010 for SharePoint 自动创建要添加到查询中的相似性组件。

本文内容
查找相似查询的类型
项相似性矢量引用
查找相似查询的结果排序

适用范围: SharePoint Server 2010

查找相似查询的类型

此属性表示要执行的查找相似查询的类型。

每一项的按递减权重排序的文档矢量可用于针对项 d 生成三种类型的相似性搜索,前提给定原始查询为 Q。使用下面的查询重写方法(用符号表示形式而非准确的查询语言显示),将这些相似性搜索请求转换为新的唯一查询:

  • FindSimilar:Query = Q OR <s1,w1> [OR <sm,wm>]* 使用 OR 运算符将相似性矢量添加到查询中。这意味着原始查询包括在重写的查询中,但新查询可以匹配相似的项,即使原始查询不满足。

  • RefineSimilar:Query = Q AND (<s1,w1> [OR <sm,wm>]*) 如果原始查询条件和相似性矢量条件得到满足,查询将匹配。例如,优化原始查询以包含与 <SimilarTo> 中指示的项类似的项。

  • ExcludeSimilar:Query = Q ANDNOT (<s1,w1> [OR <sm,wm>]*) 如果原始查询条件得到满足,但相似性条件不满足,查询将匹配。

    <s,w> 指示在处理项过程中计算出的项的相似性矢量。

默认: FindSimilar

备注

添加到查询 (<s1,w1> [OR <sm,wm>]*) 中的相似性组件查询的是默认全文索引。

项相似性矢量引用

此属性表示搜索相似项时的相似性引用。这是在 docvector 托管属性的查询结果中为每一项返回的相似性矢量表示形式。

此值是根据以下格式设置格式的字符串:

[string1,weight1][string2,weight2]...[stringN,weightN]

当执行查找相似查询时,SimilarTo 元素应包含一个 string 参数,并且该参数具有将用作相似性引用的项的 docvector 托管属性值。相似性矢量包含一组"字词,权重"表示形式,指示项中最重要的字词或概念,以及对应的感知重要性(权重)。字词可以是单个单词或短语。

权重是介于 0 与 1 之间的浮点值,其中 1 表示最高的相关性。

相似性矢量是在项处理过程中创建的,它指示项中最重要的字词或概念以及对应的权重。

查找相似查询的结果排序

FindSimilar 属性指定基于相似性的查询结果是按相似性还是按排名排序。

当执行查找相似查询时,可按两种方法对结果进行排序:

  • 按相关性分数(排名)。这是用于正常查询的排序方法,对应于 SortSimilar="False"。

  • 按相似性。这是用于相似性查询的默认排序方法,其中首先列出最相似的项。这对应于 SortSimilar="True"。

**默认值:**True