Partilhar via


MicrosoftLanguageStemmingTokenizer interface

Divide o texto usando regras específicas do idioma e reduz as palavras às suas formas base.

Extends

Propriedades

isSearchTokenizer

Um valor que indica como o tokenizador é usado. Defina como true se usado como o tokenizador de pesquisa, defina como false se usado como o tokenizador de indexação. O padrão é false.

language

A língua a utilizar. O padrão é inglês.

maxTokenLength

O comprimento máximo do token. Tokens maiores que o comprimento máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são primeiro divididos em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255.

odatatype

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

Propriedades Herdadas

name

O nome do tokenizador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.

Detalhes de Propriedade

isSearchTokenizer

Um valor que indica como o tokenizador é usado. Defina como true se usado como o tokenizador de pesquisa, defina como false se usado como o tokenizador de indexação. O padrão é false.

isSearchTokenizer?: boolean

Valor de Propriedade

boolean

language

A língua a utilizar. O padrão é inglês.

language?: MicrosoftStemmingTokenizerLanguage

Valor de Propriedade

maxTokenLength

O comprimento máximo do token. Tokens maiores que o comprimento máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são primeiro divididos em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255.

maxTokenLength?: number

Valor de Propriedade

number

odatatype

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Valor de Propriedade

"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Detalhes da Propriedade Herdada

name

O nome do tokenizador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.

name: string

Valor de Propriedade

string

herdada deBaseLexicalTokenizer.name