你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

NGramTokenizer interface

将输入标记为给定大小的 n 元语法。 此 tokenizer 是使用 Apache Lucene 实现的。

Extends

属性

maxGram

最大 n 克长度。 默认值为 2。 最大值为 300。

minGram

最小 n 克长度。 默认值为 1。 最大值为 300。 必须小于 maxGram 的值。

odatatype

多态鉴别器,它指定此对象可以是的不同类型

tokenChars

要保留在令牌中的字符类。

继承属性

name

tokenizer 的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。

属性详细信息

maxGram

最大 n 克长度。 默认值为 2。 最大值为 300。

maxGram?: number

属性值

number

minGram

最小 n 克长度。 默认值为 1。 最大值为 300。 必须小于 maxGram 的值。

minGram?: number

属性值

number

odatatype

多态鉴别器,它指定此对象可以是的不同类型

odatatype: "#Microsoft.Azure.Search.NGramTokenizer"

属性值

"#Microsoft.Azure.Search.NGramTokenizer"

tokenChars

要保留在令牌中的字符类。

tokenChars?: TokenCharacterKind[]

属性值

继承属性详细信息

name

tokenizer 的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。

name: string

属性值

string

继承自BaseLexicalTokenizer.name