你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

MicrosoftLanguageStemmingTokenizer interface

使用特定于语言的规则划分文本,并将各字词缩减为其原形。

Extends

属性

isSearchTokenizer

一个指示如何使用 tokenizer 的值。 如果用作搜索 tokenizer,则设置为 true;如果用作索引标记器,则设置为 false。 默认值为 false。

language

要使用的语言。 默认值为英语。

maxTokenLength

最大令牌长度。 超过最大长度的标记将被拆分。 可以使用的最大标记长度为 300 个字符。 长度超过 300 个字符的令牌首先拆分为长度为 300 的令牌,然后根据设置的最大令牌长度拆分每个令牌。 默认值为 255。

odatatype

多态鉴别器,它指定此对象可以是的不同类型

继承属性

name

tokenizer 的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。

属性详细信息

isSearchTokenizer

一个指示如何使用 tokenizer 的值。 如果用作搜索 tokenizer,则设置为 true;如果用作索引标记器,则设置为 false。 默认值为 false。

isSearchTokenizer?: boolean

属性值

boolean

language

要使用的语言。 默认值为英语。

language?: MicrosoftStemmingTokenizerLanguage

属性值

maxTokenLength

最大令牌长度。 超过最大长度的标记将被拆分。 可以使用的最大标记长度为 300 个字符。 长度超过 300 个字符的令牌首先拆分为长度为 300 的令牌,然后根据设置的最大令牌长度拆分每个令牌。 默认值为 255。

maxTokenLength?: number

属性值

number

odatatype

多态鉴别器,它指定此对象可以是的不同类型

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

属性值

"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

继承属性详细信息

name

tokenizer 的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。

name: string

属性值

string

继承自BaseLexicalTokenizer.name