FREETEXT (Transact-SQL)
在 WHERE 子句中使用的一个谓词,用于搜索含有基于字符的数据类型的列,以查找含义与搜索条件中的单词相同但不完全匹配的值。如果使用 FREETEXT,则全文查询引擎将在内部对 freetext_string 执行以下操作,并为每个字词分配权重,再查找匹配项。
基于单词边界(单词界限)将字符串分隔成单独的单词。
生成单词的词形变化形式(词干处理)。
基于同义词库中的匹配项标识字词的扩展或替换的列表。
语法
FREETEXT ( { column_name | (column_list) | * }
, 'freetext_string' [ , LANGUAGE language_term ] )
参数
column_name
FROM 子句中指定表的一个或多个全文索引列的名称。这些列可为 char、varchar、nchar、nvarchar、text、ntext、image、xml、varbinary 或 varbinary(max) 类型。column_list
指示可以指定多个列(以逗号分隔)。column_list 必须用括号括起来。除非指定 language_term,否则 column_list 中所有列的语言必须相同。*
指定所有注册全文搜索的列均应用于搜索给定的 freetext_string。如果 FROM 子句中有多个表,那么 * 必须由表名限定。除非指定 language_term,否则表的所有列的语言都必须相同。freetext_string
要在 column_name 中搜索的文本。可以输入任何文本,包括单词、短语或句子。只要在全文索引中找到任何术语或术语格式,就会生成匹配项。与 AND 作为关键字的 CONTAINS 和 CONTAINSTABLE 搜索条件不同,当在 freetext_string 中使用单词“and”时,会将它视为干扰词或非索引字,因此会丢弃它。
不允许使用 WEIGHT、FORMSOF、通配符、NEAR 和其他语法。系统将通过同义词库对 freetext_string 字符串进行断字处理、词干分析,然后执行同义词库查询。如果使用双引号将 freetext_string 引起来,将执行短语匹配;而不执行词干分析和同义词库查询处理。
freetext_string 的数据类型为 nvarchar。将另一个字符数据类型用作输入时,将发生隐式转换。在下面的示例中,@SearchWord 变量(被定义为 varchar(30))导致 FREETEXT 谓词中发生隐式转换。
USE AdventureWorks; GO DECLARE @SearchWord varchar(30) SET @SearchWord ='performance' SELECT Description FROM Production.ProductDescription WHERE FREETEXT(Description, @SearchWord);
由于“参数截取”跨转换无效,因此请使用 nvarchar 以获得更好性能。在该示例中,请将 @SearchWord 声明为 nvarchar(30)。
USE AdventureWorks; GO DECLARE @SearchWord nvarchar(30) SET @SearchWord = N'performance' SELECT Description FROM Production.ProductDescription WHERE FREETEXT(Description, @SearchWord);
对于生成非最佳计划的情况,还可以使用 OPTIMIZE FOR 查询提示。
LANGUAGE language_term
特定的语言,查询时,其资源将用于断字、词干分析、同义词库查询以及非索引字删除。此参数是可选的,可以将其指定为与语言区域设置标识符 (LCID) 对应的字符串、整数或十六进制值。如果指定了 language_term,则它表示的语言将应用于搜索条件的所有元素。如果未指定值,则使用该列的全文语言。如果将不同语言的文档一起作为二进制大型对象 (BLOB) 存储在单个列中,则指定文档的区域设置标识符 (LCID) 将决定对其内容编制索引时使用哪种语言。查询这种列时,指定 LANGUAGElanguage_term 可增大找到有效匹配项的可能性。
如果指定为字符串,language_term 将对应于 sys.syslanguages (Transact-SQL) 兼容性视图中的 alias 列值。字符串必须用单引号引起来,如 'language_term'。如果指定为整数,则 language_term 就是标识该语言的实际 LCID。如果指定为十六进制值,则 language_term 将以 0x 开头,后面跟有 LCID 的十六进制值。十六进制值不能超过八位(包括前导零在内)。
如果该值是双字节字符集 (DBCS) 格式,则 MicrosoftSQL Server 会将其转换为 Unicode 格式。
如果指定的语言无效,或者没有安装对应于该语言的资源,MicrosoftSQL Server 将返回错误。若要使用非特定语言资源,请将 language_term 指定为 0x0。
注释
全文谓词和函数作用于 FROM 谓词所示的单个表。若要对多个表进行搜索,请在 FROM 子句中使用联接表,以搜索由两个或更多个表的乘积构成的结果集。
使用 FREETEXT 的全文查询没有使用 CONTAINS 的全文查询精度高。SQL Server 全文搜索引擎识别重要的字词和短语。保留关键字或通配符字符都不具有特殊含义,而它们指定在 CONTAINS 谓词的 <contains_search_condition> 参数中时则通常具有含义。
如果兼容级别小于 70,则不会将 FREETEXT 视为关键字。有关详细信息,请参阅 sp_dbcmptlevel (Transact-SQL)。
当数据库兼容级别设置为 100 时,不允许在 OUTPUT 子句中使用全文谓词。
示例
A. 使用 FREETEXT 搜索包含指定字符值的单词
以下示例搜索包含与 vital、safety、components 相关的单词的所有文档。
USE AdventureWorks;
GO
SELECT Title
FROM Production.Document
WHERE FREETEXT (Document, 'vital safety components' );
GO
B. 通过变量使用 FREETEXT
以下示例使用了变量来取代具体的搜索项。
USE AdventureWorks;
GO
DECLARE @SearchWord nvarchar(30);
SET @SearchWord = N'high-performance';
SELECT Description
FROM Production.ProductDescription
WHERE FREETEXT(Description, @SearchWord);
GO
请参阅