断字符和词干分析器

断字符和词干分析器用于对所有全文索引数据执行语言分析。语言分析将涉及到查找词边界(断字)和组合动词(词干分析)。语言分析规则因语言而异,可以为每个全文索引列指定不同的语言。每种语言的断字符能够使得为该语言生成的词更加准确。如果断字符用于整个语系而不是特定的子语言,将使用该语系中的主要语言。例如,使用法语断字符来处理加拿大法语文本。如果某一特定语言没有可用的断字符,将使用非特定语言断字符。使用非特定语言断字符时,词将在非特定语言字符(如空格和标点符号)处断开。

Microsoft SQL Server 2005 包含 23 种区域设置的断字符。有关全文搜索所支持语言的列表,请参阅 sys.fulltext_languages (Transact-SQL)

所查询的全文索引列的语言决定了对 CONTAINS、FREETEXT、CONTAINSTABLE 和 FREETEXTTABLE 等全文查询函数的参数执行的语言分析。如果未指定列的语言,默认值是配置选项 default full-text language 的值。

对于 SQL Server 的本地化版本,SQL Server 安装程序将把 default full-text language 选项设置为服务器使用的语言(如果存在合适的匹配项)。对于 SQL Server 的非本地化版本,default full-text language 选项为“英语”。

ms142509.note(zh-cn,SQL.90).gif注意:
在单个全文查询函数子句中列出的所有列必须使用同一语言,除非在查询中指定了 LANGUAGE 选项。

请参阅

概念

全文搜索基础

其他资源

default full-text language 选项

帮助和信息

获取 SQL Server 2005 帮助