MicrosoftLanguageTokenizer Classe

Referência

Definição

Namespace:: Azure.Search.Documents.Indexes.Models

Assembly:: Azure.Search.Documents.dll

Pacote:: Azure.Search.Documents v11.5.0

Pacote:: Azure.Search.Documents v11.5.0-beta.5

Importante

Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.

Divide o texto usando regras específicas de idioma.

public class MicrosoftLanguageTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer

type MicrosoftLanguageTokenizer = class
    inherit LexicalTokenizer

Public Class MicrosoftLanguageTokenizer
Inherits LexicalTokenizer

Herança: Object

LexicalTokenizer
MicrosoftLanguageTokenizer

Construtores

MicrosoftLanguageTokenizer(String)

Inicializa uma nova instância do MicrosoftLanguageTokenizer.

Propriedades

IsSearchTokenizer	Um valor que indica como o tokenizer é usado. Defina como true se usado como o tokenizador de pesquisa, defina como false se usado como o tokenizador de indexação. O padrão é false.
Language	O idioma a ser usado. O padrão é inglês.
MaxTokenLength	O comprimento máximo do token. Tokens maiores do que o tamanho máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são divididos primeiro em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255.
Name	O nome do tokenizer. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres. (Herdado de LexicalTokenizer)

Aplica-se a

Compartilhar via