你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

MicrosoftLanguageStemmingTokenizer interface

参考

包:: @azure/search-documents

使用特定于语言的规则划分文本，并将各字词缩减为其原形。

Extends: BaseLexicalTokenizer

属性

isSearchTokenizer	一个指示如何使用 tokenizer 的值。如果用作搜索 tokenizer，则设置为 true;如果用作索引标记器，则设置为 false。默认值为 false。
language	要使用的语言。默认值为英语。
maxTokenLength	最大令牌长度。超过最大长度的标记将被拆分。可以使用的最大标记长度为 300 个字符。长度超过 300 个字符的令牌首先拆分为长度为 300 的令牌，然后根据设置的最大令牌长度拆分每个令牌。默认值为 255。
odatatype	多态鉴别器，它指定此对象可以是的不同类型

继承属性

name	tokenizer 的名称。它必须仅包含字母、数字、空格、短划线或下划线，只能以字母数字字符开头和结尾，且最多包含 128 个字符。

属性详细信息

isSearchTokenizer

一个指示如何使用 tokenizer 的值。如果用作搜索 tokenizer，则设置为 true;如果用作索引标记器，则设置为 false。默认值为 false。

isSearchTokenizer?: boolean

属性值

boolean

language

要使用的语言。默认值为英语。

language?: MicrosoftStemmingTokenizerLanguage

属性值

MicrosoftStemmingTokenizerLanguage

maxTokenLength

最大令牌长度。超过最大长度的标记将被拆分。可以使用的最大标记长度为 300 个字符。长度超过 300 个字符的令牌首先拆分为长度为 300 的令牌，然后根据设置的最大令牌长度拆分每个令牌。默认值为 255。

maxTokenLength?: number

属性值

number

odatatype

多态鉴别器，它指定此对象可以是的不同类型

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

属性值

"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

继承属性详细信息

name

tokenizer 的名称。它必须仅包含字母、数字、空格、短划线或下划线，只能以字母数字字符开头和结尾，且最多包含 128 个字符。

name: string

属性值

string

继承自BaseLexicalTokenizer.name

Share via