Compartilhar via


MicrosoftLanguageTokenizer Classe

Definição

Divide o texto usando regras específicas de idioma.

public class MicrosoftLanguageTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type MicrosoftLanguageTokenizer = class
    inherit LexicalTokenizer
Public Class MicrosoftLanguageTokenizer
Inherits LexicalTokenizer
Herança
MicrosoftLanguageTokenizer

Construtores

MicrosoftLanguageTokenizer(String)

Inicializa uma nova instância do MicrosoftLanguageTokenizer.

Propriedades

IsSearchTokenizer

Um valor que indica como o tokenizer é usado. Defina como true se usado como o tokenizador de pesquisa, defina como false se usado como o tokenizador de indexação. O padrão é false.

Language

O idioma a ser usado. O padrão é inglês.

MaxTokenLength

O comprimento máximo do token. Tokens maiores do que o tamanho máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são divididos primeiro em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255.

Name

O nome do tokenizer. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres.

(Herdado de LexicalTokenizer)

Aplica-se a