MicrosoftLanguageStemmingTokenizer interface

Referência

Pacote:: @azure/search-documents

Divide o texto usando regras específicas do idioma e reduz as palavras às suas formas base.

Extends: BaseLexicalTokenizer

Propriedades

isSearchTokenizer	Um valor que indica como o tokenizador é usado. Defina como true se usado como o tokenizador de pesquisa, defina como false se usado como o tokenizador de indexação. O padrão é false.
language	A língua a utilizar. O padrão é inglês.
maxTokenLength	O comprimento máximo do token. Tokens maiores que o comprimento máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são primeiro divididos em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255.
odatatype	Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

Propriedades Herdadas

name	O nome do tokenizador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.

Detalhes de Propriedade

isSearchTokenizer

Um valor que indica como o tokenizador é usado. Defina como true se usado como o tokenizador de pesquisa, defina como false se usado como o tokenizador de indexação. O padrão é false.

isSearchTokenizer?: boolean

Valor de Propriedade

boolean

language

A língua a utilizar. O padrão é inglês.

language?: MicrosoftStemmingTokenizerLanguage

Valor de Propriedade

MicrosoftStemmingTokenizerLanguage

maxTokenLength

O comprimento máximo do token. Tokens maiores que o comprimento máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são primeiro divididos em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255.

maxTokenLength?: number

Valor de Propriedade

number

odatatype

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Valor de Propriedade

"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Detalhes da Propriedade Herdada

name

O nome do tokenizador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.

name: string

Valor de Propriedade

string

herdada deBaseLexicalTokenizer.name

Partilhar via

MicrosoftLanguageStemmingTokenizer interface

Propriedades

Propriedades Herdadas

Detalhes de Propriedade

isSearchTokenizer

Valor de Propriedade

language

Valor de Propriedade

maxTokenLength

Valor de Propriedade

odatatype

Valor de Propriedade

Detalhes da Propriedade Herdada

name

Valor de Propriedade

Recursos adicionais