CONTAINS (Transact-SQL)
搜索单个词和短语的精确或模糊(不太精确的)匹配项、在一定差别范围内的相近词或加权匹配项。 CONTAINS 是一个谓词,用于在 Transact-SQL SELECT 语句的 WHERE 子句中对包含基于字符的数据类型的全文索引列执行 SQL Server 全文搜索。
CONTAINS 谓词可以搜索:
词或短语。
词或短语的前缀。
与另一个词相邻的词。
由另一个词的词形变化而生成的词(例如,drive 一词是 drives、drove、driving 和 driven 词形变化的词干)。
使用同义词库确定的另一个词的同义词(例如,“metal”一词可能有“aluminum”和“steel”等同义词)。
注意 |
---|
有关 SQL Server 支持的全文搜索形式的信息,请参阅使用全文搜索查询。 |
语法
CONTAINS (
{
column_name | ( column_list )
| *
| PROPERTY ( { column_name }, 'property_name' )
}
, '<contains_search_condition>'
[ , LANGUAGE language_term ]
)
<contains_search_condition> ::=
{
<simple_term>
| <prefix_term>
| <generation_term>
| <generic_proximity_term>
| <custom_proximity_term>
| <weighted_term>
}
|
{ ( <contains_search_condition> )
[ { <AND> | <AND NOT> | <OR> } ]
<contains_search_condition> [ ...n ]
}
<simple_term> ::=
{ word | "phrase" }
<prefix term> ::=
{ "word*" | "phrase*" }
<generation_term> ::=
FORMSOF ( { INFLECTIONAL | THESAURUS } , <simple_term> [ ,...n ] )
<generic_proximity_term> ::=
{ <simple_term> | <prefix_term> } { { { NEAR | ~ }
{ <simple_term> | <prefix_term> } } [ ...n ] }
<custom_proximity_term> ::=
NEAR (
{
{ <simple_term> | <prefix_term> } [ ,…n ]
|
( { <simple_term> | <prefix_term> } [ ,…n ] )
[, <maximum_distance> [, <match_order> ] ]
}
)
<maximum_distance> ::= { integer | MAX }
<match_order> ::= { TRUE | FALSE }
<weighted_term> ::=
ISABOUT
( {
{
<simple_term>
| <prefix_term>
| <generation_term>
| <proximity_term>
}
[ WEIGHT ( weight_value ) ]
} [ ,...n ]
)
<AND> ::=
{ AND | & }
<AND NOT> ::=
{ AND NOT | &! }
<OR> ::=
{ OR | | }
参数
column_name
FROM 子句中所指定的表的全文索引列的名称。 这些列可为 char、varchar、nchar、nvarchar、text、ntext、image、xml、varbinary 或 varbinary(max) 类型。column_list
指定以逗号分隔的两个或更多个列。 column_list 必须用括号括起来。 除非指定 language_term,否则 column_list 中所有列的语言必须相同。*
指定查询将按给定的搜索条件在 FROM 子句中指定的表中搜索所有全文索引列。 CONTAINS 子句中的列必须来自包含全文索引的单个表。 除非指定 language_term,否则表的所有列的语言都必须相同。PROPERTY ( column_name , 'property_name')
指定在其中搜索指定搜索条件的文档属性。重要提示 要使查询返回任何行,必须在全文索引的搜索属性列表中指定 property_name,并且全文索引必须包含 property_name 的属性特定条目。 有关详细信息,请参阅使用搜索属性列表搜索文档属性。
LANGUAGE language_term
查询中用于断字、词干分析、同义词库扩展和替换,以及干扰词(或非索引字)删除的语言。 此参数可选。如果将采用不同语言的文档一起作为二进制大型对象 (BLOB) 存储在单个列中,则给定文档的区域设置标识符 (LCID) 将决定为其内容编制索引时使用的语言。 在对这种列进行查询时,指定 LANGUAGE language_term 可增大找到有效匹配项的可能性。
language_term 可指定为与语言的 LCID 相对应的字符串、整数或十六进制值。 如果指定了 language_term,则它表示的语言将应用于搜索条件的所有元素。 如果未指定值,则使用该列的全文语言。
如果指定为字符串,language_term 将对应于 sys.syslanguages (Transact-SQL) 兼容性视图中的 alias 列值。 字符串必须用单引号引起来,例如,'language_term'。 如果指定为整数,则 language_term 就是标识该语言的实际 LCID。 如果指定为十六进制值,则 language_term 将以 0x 开头,后面跟有 LCID 的十六进制值。 十六进制值不能超过八位(包括前导零在内)。
如果该值是双字节字符集 (DBCS) 格式,则 SQL Server 会将其转换为 Unicode 格式。
如果指定的语言无效,或者未安装对应于该语言的资源,SQL Server 将返回错误。 若要使用非特定语言资源,请将 language_term 指定为 0x0。
<contains_search_condition>
指定要在 column_name 中搜索的文本和匹配条件。<contains_search_condition> 的数据类型为 nvarchar。 将另一个字符数据类型用作输入时,将发生隐式转换。 在下面的示例中,@SearchWord 变量(被定义为 varchar(30))导致 CONTAINS 谓词中发生隐式转换。
USE AdventureWorks2012; GO DECLARE @SearchWord varchar(30) SET @SearchWord ='performance' SELECT Description FROM Production.ProductDescription WHERE CONTAINS(Description, @SearchWord);
由于“参数截取”跨转换无效,因此请使用 nvarchar 以获得更好性能。 本示例将 @SearchWord 声明为 nvarchar(30)。
USE AdventureWorks2012; GO DECLARE @SearchWord nvarchar(30) SET @SearchWord = N'performance' SELECT Description FROM Production.ProductDescription WHERE CONTAINS(Description, @SearchWord);
对于生成非最佳计划的情况,还可以使用 OPTIMIZE FOR 查询提示。
word
不带空格或标点符号的字符串。phrase
在每个词之间有空格的一个或多个词。注意 某些语言(如亚洲一些地区的书面语言)的短语可以由彼此之间没有空格的一个或多个词组成。
<simple_term>
指定词或短语的完全匹配项。 有效的简单字词示例有 "blue berry"、blueberry 和 "Microsoft SQL Server"。 应该使用双引号 ("") 将短语引起来。 短语中的词在数据库列中出现的顺序必须与 <contains_search_condition> 中指定的顺序相同。 搜索词或短语中的字符时不区分大小写。 在全文索引中,不会存储全文索引列中的干扰词(或非索引字),例如 a、and 或 the。 如果在单个词搜索中使用了干扰词,SQL Server 将返回错误消息,指出查询仅包含干扰词。 SQL Server 在每个 SQL Server 实例的 \Mssql\Binn\FTERef 目录下有一个标准的干扰词列表。标点将被忽略。 因此,CONTAINS(testing, "computer failure") 将匹配包含 "Where is my computer? Failure to find it would be expensive" 这个值的行。有关断字符行为的详细信息,请参阅配置和管理断字符和词干分析器以便搜索。
<prefix_term>
指定以指定文本开始的词或短语的匹配项。 将前缀字词用英文双引号 ("") 引起来,并在右引号前添加一个星号 (*),这样一来,以星号前指定的简单字词开头的所有文本都将被匹配。 该子句应按以下方式指定:CONTAINS (column, '"text*"')。 星号可匹配词或短语所含根词的 0 个、1 个或多个字符。 如果文本和星号不用英文双引号分隔,则谓词将读取 CONTAINS (column, 'text*'),全文搜索会将星号看作字符,搜索 text* 的完全匹配项。 由于断字符通常忽略 (*) 这样的字符,因此全文引擎将不会查找带此类字符的词。如果 <prefix_term> 是一个短语,则该短语中包含的每个词都将被看成一个单独的前缀。 因此,指定了一个 "local wine*" 前缀字词的查询,将匹配所有包含 "local winery"、"locally wined and dined" 等文本的行。
<generation_term>
包含的简单字词包括要搜索的原始词的变体时,指定词的匹配项。INFLECTIONAL
指定要对指定的简单字词使用与语言相关的词干分析器。 词干分析器的行为是根据每种具体语言的词干确定规则定义的。 非特定语言没有关联的词干分析器。 使用被查询的列的列语言来引用所需的词干分析器。 如果指定了 language_term,则使用与该语言对应的词干分析器。<generation_term> 中给定的 <simple_term> 不会同时匹配名词和动词。
THESAURUS
指定使用对应于列全文语言或指定的查询语言的同义词库。 最长模式或来自 <simple_term> 的模式将与同义词库匹配,并生成其他字词以扩展或替换原始模式。 如果找不到与 <simple_term> 完全或部分匹配的匹配项,不匹配部分将被视为 simple_term。 有关全文搜索同义词库的详细信息,请参阅为全文搜索配置和管理同义词库文件。<generic_proximity_term>
指定词或短语的匹配项必须处于所搜索的文档中。重要提示 后续版本的 Microsoft SQL Server 将删除该功能。请避免在新的开发工作中使用该功能,并着手修改当前还在使用该功能的应用程序。 我们建议您使用 <custom_proximity_term>。
NEAR | ~
指示 NEAR 或 ~ 运算符两侧的词或短语必须存在于某个文档中,才能返回匹配项。 您必须指定两个搜索词。 给定的搜索词可以是由双引号 ("phrase") 分隔的单个词或短语。可将多个邻近词链接起来,例如 a NEAR b NEAR c 或 a ~ b ~ c。 链接在一起的邻近词必须均存在于文档中才能返回匹配项。
例如,CONTAINS(column_name, 'fox NEAR chicken') 和 CONTAINSTABLE(table_name、column_name, 'fox ~ chicken') 均将返回指定列中同时包含“fox”和“chicken”的所有文档。 此外,CONTAINSTABLE 还会按照 "fox" 和 "chicken" 的邻近程度返回每个文档的排名。 例如,如果文档包含句子“The fox ate the chicken”,该文档的排名将很高,因为这两个词比其他文档近。
有关通用邻近词的详细信息,请参阅使用 NEAR 搜索与另一个词邻近的词。
<custom_proximity_term>
指定词或短语的匹配项,并且可以选择指定搜索词之间允许的最大距离。 您还可以指定必须按指定的确切顺序查找搜索词 (<match_order>)。给定的搜索词可以是由双引号 ("phrase") 分隔的单个词或短语。 文档中必须包含每个指定的词才能返回匹配项。 您必须至少指定两个搜索词。 最大的搜索词数为 64 个。
默认情况下,自定义近似词返回包含指定词的行,而不考虑间隔的距离及其顺序。 例如,若要匹配下面的查询,文档只需包含 term1 和 "term3 term4",它们可以处于任意位置以及采用任意顺序:
CONTAINS(column_name, 'NEAR(term1,"term3 term4")')
可选的参数如下:
<maximum_distance>
指定要使字符串作为匹配项,字符串开头和结尾处的搜索词之间允许的最大距离。integer
指定 0 到 4294967295 之间的正整数。 该值控制第一个和最后一个搜索词之间可以包含多少个非搜索词,不包括任何其他指定的搜索词。例如,以下查询按两种顺序搜索“AA”和“BB”(最大距离为 5)。
CONTAINS(column_name, 'NEAR((AA,BB),5)')
字符串“AA one two three four five BB”就是一个匹配项。 在以下示例中,查询指定了三个搜索词“AA”、“BB”和“CC”(最大距离为 5):
CONTAINS(column_name, 'NEAR((AA,BB,CC),5)')
此查询将匹配以下字符串(总距离为 5):
BB one two CC three four five AA
请注意,内部搜索词“CC”不计算在内。
MAX
返回所有包含指定词的行,而不考虑它们之间距离。 这是默认设置。
<match_order>
指定词是否必须按指定顺序出现,搜索查询才会返回这些词。 若要指定 <match_order>,还必须指定 <maximum_distance>。<match_order> 采用下列值之一:
TRUE
强制在词中使用指定的顺序。 例如,NEAR(A,B) 仅匹配 A … B。FALSE
忽略指定的顺序。 例如,NEAR(A,B) 匹配 A … B 和 B … A。这是默认设置。
例如,以下邻近词按指定顺序搜索“Monday”、“Tuesday”和“Wednesday”词,而不考虑它们之间的距离:
CONTAINS(column_name, 'NEAR ((Monday, Tuesday, Wednesday), MAX, TRUE)')
有关自定义邻近词的详细信息,请参阅使用 NEAR 搜索与另一个词邻近的词。
<weighted_term>
指定(由查询返回的)匹配行与一组词和短语匹配,每个词和短语有一个可选的加权值。ISABOUT
指定 <weighted_term> 关键字。WEIGHT(weight_value)
指定介于 0.0 和 1.0 之间的加权值。 <weighted_term> 中的每个组件都可能包含一个 weight_value。 使用 weight_value 可更改查询的各个部分如何影响赋予与该查询匹配的每行的排名值。 WEIGHT 不影响 CONTAINS 查询的结果,但 WEIGHT 会影响 CONTAINSTABLE 查询中的排名。注意 不管操作系统的区域设置如何,小数点分隔符始终为句点。
{ AND | & } | { AND NOT | &! } | { OR | | }
指定两个包含搜索条件之间的逻辑运算。{ AND | & }
指示匹配项必须满足这两个包含搜索条件。 可以使用 And 符 (&) 代替关键字 AND 来表示 AND 运算符。{ AND NOT | &! }
指示匹配项中不能出现第二个搜索条件。 可以使用 And 符后跟感叹号 (&!) 代替关键字 AND NOT 来表示 AND NOT 运算符。{ OR | | }
指示匹配项必须满足这两个包含搜索条件之一。 可以使用竖线符号 (|) 代替关键字 OR 来表示 OR 运算符。如果 <contains_search_condition> 包含带括号的组,则首先计算这些带括号的组。 计算了带括号的组之后,将这些逻辑运算符用于包含搜索条件时,适用以下规则:
NOT 用在 AND 之前。
NOT 只能出现在 AND 之后,如在 AND NOT 中。 不允许使用 OR NOT 运算符。 不能在首个字词前指定 NOT。 例如,CONTAINS (mycolumn, 'NOT "phrase_to_search_for" ' ) 就是无效的。
AND 用在 OR 之前。
相同类型的 Boolean 运算符(AND、OR)可以结合使用,因此可以按任意顺序应用。
- n
一个占位符,指示可在其中指定多个 CONTAINS 搜索条件和搜索词。
一般备注
全文谓词和函数作用于 FROM 谓词所示的单个表。 若要对多个表进行搜索,请在 FROM 子句中使用联接表,以搜索由两个或更多个表的乘积构成的结果集。
当数据库兼容级别设置为 100 时,不允许在 OUTPUT 子句中使用全文谓词。
查询远程服务器
可以在 CONTAINS 或 FREETEXT 谓词中使用由四部分组成的名称对链接服务器上的目标表的全文索引列进行查询。 若要准备远程服务器以接收全文查询,请在远程服务器上的目标表和列上创建全文索引,然后将该远程服务器添加为链接服务器。
LIKE 与全文搜索的比较
与全文搜索不同,LIKE Transact-SQL 谓词仅对字符模式有效。 另外,不能使用 LIKE 谓词来查询格式化的二进制数据。 此外,对大量非结构化的文本数据执行 LIKE 查询要比对相同数据执行同样的全文查询慢得多。 对数百万行文本数据进行的 LIKE 查询可能需要几分钟的时间才能返回结果;而对于同样的数据,全文查询只需要几秒甚至更少的时间,具体取决于返回的行数及其大小。 另一个考虑因素是 LIKE 仅对整个表执行简单模式扫描。 相反,全文查询可识别语言,它在索引和查询时应用特定的转换,例如,筛选非索引字并进行同义词库和变形扩展。 这些转换可帮助全文查询改进其撤回以及结果的最终排名。
查询多个列(全文搜索)
可通过指定一组要搜索的列来查询多个列。 这些列必须来自同一个表。
例如,以下 CONTAINS 查询在 AdventureWorks2012 示例数据库的 Production.Product 表的 Name 和 Color 列中搜索“Red”词。
Use AdventureWorks2012;
GO
SELECT Name, Color FROM Production.Product
WHERE CONTAINS((Name, Color), 'Red');
示例
A.将 CONTAINS 与 <简单词> 一起使用
下面的示例查找包含 "Mountain" 一词且价格为 $80.99 的所有产品。
USE AdventureWorks2012;
GO
SELECT Name, ListPrice
FROM Production.Product
WHERE ListPrice = 80.99
AND CONTAINS(Name, 'Mountain');
GO
B.将 CONTAINS 和短语与 <simple_term> 一起使用
以下示例返回包含短语 "Mountain" 或 "Road" 的所有产品。
USE AdventureWorks2012;
GO
SELECT Name
FROM Production.Product
WHERE CONTAINS(Name, ' Mountain OR Road ')
GO
C.将 CONTAINS 与 <prefix_term> 一起使用
下面的示例返回的所有产品名称中,其 Name 列中至少有一个词以前辍 chain 开头。
USE AdventureWorks2012;
GO
SELECT Name
FROM Production.Product
WHERE CONTAINS(Name, ' "Chain*" ');
GO
D.将 CONTAINS 和 OR 与 <prefix_term> 一起使用
下面的示例将返回包含以 "chain" 或 "full" 为前缀的字符串的所有类别说明。
USE AdventureWorks2012;
GO
SELECT Name
FROM Production.Product
WHERE CONTAINS(Name, '"chain*" OR "full*"');
GO
E.将 CONTAINS 与 <proximity_term> 一起使用
以下示例在 Production.ProductReview 表中搜索包含“bike”词、在“control”词的 10 个词范围内且使用指定顺序(即,“bike”排在“control”前面)的所有注释。
USE AdventureWorks2012;
GO
SELECT Comments
FROM Production.ProductReview
WHERE CONTAINS(Comments , 'NEAR((bike,control), 10, TRUE)');
GO
F.将 CONTAINS 与 <generation_term> 一起使用
以下示例搜索包含以下形式的 ride 词的所有产品:“riding”、“ridden”等。
USE AdventureWorks2012;
GO
SELECT Description
FROM Production.ProductDescription
WHERE CONTAINS(Description, ' FORMSOF (INFLECTIONAL, ride) ');
GO
G.将 CONTAINS 与 <weighted_term> 一起使用
以下示例搜索包含 performance、comfortable 或 smooth 词并为每个词指定不同加权的所有产品名称。
USE AdventureWorks2012;
GO
SELECT Description
FROM Production.ProductDescription
WHERE CONTAINS(Description, 'ISABOUT (performance weight (.8),
comfortable weight (.4), smooth weight (.2) )' );
GO
H.将 CONTAINS 与变量一起使用
以下示例使用变量替代具体的搜索词。
USE AdventureWorks2012;
GO
DECLARE @SearchWord nvarchar(30)
SET @SearchWord = N'Performance'
SELECT Description
FROM Production.ProductDescription
WHERE CONTAINS(Description, @SearchWord);
GO
I.将 CONTAINS 与逻辑运算符 (AND) 一起使用
以下示例使用 AdventureWorks2012 数据库的 ProductDescription 表。 该查询使用 CONTAINS 谓词搜索 ID 不等于 5 并且同时包含 Aluminum 和 spindle 词的说明。 该搜索条件使用 AND 布尔运算符。
USE AdventureWorks2012;
GO
SELECT Description
FROM Production.ProductDescription
WHERE ProductDescriptionID <> 5 AND
CONTAINS(Description, 'Aluminum AND spindle');
GO
J.使用 CONTAINS 验证行插入操作
下面的示例在 SELECT 子查询中使用 CONTAINS。 该查询使用 AdventureWorks2012 数据库获取 ProductReview 表中针对特定循环的所有注释的注释值。 该搜索条件使用 AND 布尔运算符。
USE AdventureWorks2012;
GO
INSERT INTO Production.ProductReview
(ProductID, ReviewerName, EmailAddress, Rating, Comments)
VALUES
(780, 'John Smith', 'john@fourthcoffee.com', 5,
'The Mountain-200 Silver from AdventureWorks2008 Cycles meets and exceeds expectations. I enjoyed the smooth ride down the roads of Redmond');
-- Given the full-text catalog for these tables is Adv_ft_ctlg,
-- with change_tracking on so that the full-text indexes are updated automatically.
WAITFOR DELAY '00:00:30';
-- Wait 30 seconds to make sure that the full-text index gets updated.
SELECT r.Comments, p.Name
FROM Production.ProductReview r
JOIN Production.Product p
ON
r.ProductID = p.ProductID
AND r.ProductID = (SELECT ProductID
FROM Production.ProductReview
WHERE CONTAINS (Comments,
' AdventureWorks2008 AND
Redmond AND
"Mountain-200 Silver" '));
GO
K.查询文档属性
以下查询在 Production.Document 表的 Document 列中搜索索引属性 Title。 该查询仅返回 Title 属性包含字符串 Maintenance Repair 的文档。
注意 |
---|
要使属性搜索返回行,在编制索引过程中分析列的一个或多个筛选器必须提取指定的属性。 另外,必须配置指定表的全文索引以包含该属性。 有关详细信息,请参阅使用搜索属性列表搜索文档属性。 |
Use AdventureWorks2012;
GO
SELECT Document FROM Production.Document
WHERE CONTAINS(PROPERTY(Document,'Title'), 'Maintenance OR Repair');
GO
请参阅
任务
创建全文搜索查询 (Visual Database Tools)
参考
CREATE FULLTEXT CATALOG (Transact-SQL)
CREATE FULLTEXT INDEX (Transact-SQL)