查找相似 (FAST Search Server 2010 for SharePoint)
查找相似 功能允许您搜索与已检索到的查询结果相似的文档。
上次修改时间: 2011年9月1日
相似性计算基于统计度量值。FAST Search Server 2010 for SharePoint 自动创建要添加到查询中的相似性组件。
本文内容
查找相似查询的类型
项相似性矢量引用
查找相似查询的结果排序
适用范围: SharePoint Server 2010
查找相似查询的类型
此属性表示要执行的查找相似查询的类型。
每一项的按递减权重排序的文档矢量可用于针对项 d 生成三种类型的相似性搜索,前提给定原始查询为 Q。使用下面的查询重写方法(用符号表示形式而非准确的查询语言显示),将这些相似性搜索请求转换为新的唯一查询:
FindSimilar:Query = Q OR <s1,w1> [OR <sm,wm>]* 使用 OR 运算符将相似性矢量添加到查询中。这意味着原始查询包括在重写的查询中,但新查询可以匹配相似的项,即使原始查询不满足。
RefineSimilar:Query = Q AND (<s1,w1> [OR <sm,wm>]*) 如果原始查询条件和相似性矢量条件得到满足,查询将匹配。例如,优化原始查询以包含与 <SimilarTo> 中指示的项类似的项。
ExcludeSimilar:Query = Q ANDNOT (<s1,w1> [OR <sm,wm>]*) 如果原始查询条件得到满足,但相似性条件不满足,查询将匹配。
<s,w> 指示在处理项过程中计算出的项的相似性矢量。
默认: FindSimilar
备注
添加到查询 (<s1,w1> [OR <sm,wm>]*) 中的相似性组件查询的是默认全文索引。
项相似性矢量引用
此属性表示搜索相似项时的相似性引用。这是在 docvector 托管属性的查询结果中为每一项返回的相似性矢量表示形式。
此值是根据以下格式设置格式的字符串:
[string1,weight1][string2,weight2]...[stringN,weightN]
当执行查找相似查询时,SimilarTo 元素应包含一个 string 参数,并且该参数具有将用作相似性引用的项的 docvector 托管属性值。相似性矢量包含一组"字词,权重"表示形式,指示项中最重要的字词或概念,以及对应的感知重要性(权重)。字词可以是单个单词或短语。
权重是介于 0 与 1 之间的浮点值,其中 1 表示最高的相关性。
相似性矢量是在项处理过程中创建的,它指示项中最重要的字词或概念以及对应的权重。
查找相似查询的结果排序
FindSimilar 属性指定基于相似性的查询结果是按相似性还是按排名排序。
当执行查找相似查询时,可按两种方法对结果进行排序:
按相关性分数(排名)。这是用于正常查询的排序方法,对应于 SortSimilar="False"。
按相似性。这是用于相似性查询的默认排序方法,其中首先列出最相似的项。这对应于 SortSimilar="True"。
**默认值:**True