Partilhar via


EdgeNGramTokenizer interface

Tokeniza a entrada de uma borda em n-gramas do(s) tamanho(s) determinado(s). Este tokenizador é implementado usando Apache Lucene.

Extends

Propriedades

maxGram

O comprimento máximo de n-gramas. O padrão é 2. O máximo é de 300.

minGram

O comprimento mínimo de n-gramas. O padrão é 1. O máximo é de 300. Deve ser menor que o valor de maxGram.

odatatype

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

tokenChars

Classes de caracteres para manter nos tokens.

Propriedades Herdadas

name

O nome do tokenizador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.

Detalhes de Propriedade

maxGram

O comprimento máximo de n-gramas. O padrão é 2. O máximo é de 300.

maxGram?: number

Valor de Propriedade

number

minGram

O comprimento mínimo de n-gramas. O padrão é 1. O máximo é de 300. Deve ser menor que o valor de maxGram.

minGram?: number

Valor de Propriedade

number

odatatype

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

odatatype: "#Microsoft.Azure.Search.EdgeNGramTokenizer"

Valor de Propriedade

"#Microsoft.Azure.Search.EdgeNGramTokenizer"

tokenChars

Classes de caracteres para manter nos tokens.

tokenChars?: TokenCharacterKind[]

Valor de Propriedade

Detalhes da Propriedade Herdada

name

O nome do tokenizador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.

name: string

Valor de Propriedade

string

herdada deBaseLexicalTokenizer.name