MicrosoftLanguageTokenizer Classe

Referência

Definição

Namespace:: Microsoft.Azure.Search.Models

Assembly:: Microsoft.Azure.Search.Service.dll

Pacote:: Microsoft.Azure.Search.Service v10.1.0

Origem:: MicrosoftLanguageTokenizer.cs

Importante

Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.

Divide o texto usando regras específicas de idioma.

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageTokenizer")]
public class MicrosoftLanguageTokenizer : Microsoft.Azure.Search.Models.Tokenizer

[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageTokenizer")>]
type MicrosoftLanguageTokenizer = class
    inherit Tokenizer

Public Class MicrosoftLanguageTokenizer
Inherits Tokenizer

Herança: Object

Tokenizer
MicrosoftLanguageTokenizer

Atributos: Newtonsoft.Json.JsonObjectAttribute

Construtores

MicrosoftLanguageTokenizer()	Inicializa uma nova instância da classe MicrosoftLanguageTokenizer.
MicrosoftLanguageTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftTokenizerLanguage>)	Inicializa uma nova instância da classe MicrosoftLanguageTokenizer.

Propriedades

IsSearchTokenizer	Obtém ou define um valor que indica como o criador de token é usado. Defina como true se usado como o criador de tokens de pesquisa, defina como false se usado como o criador de tokens de indexação. O padrão é false.
Language	Obtém ou define o idioma a ser usado. O padrão é inglês. Os valores possíveis incluem: 'bangla', 'búlgaro', 'catalão', 'chineseSimplified', 'chineseTraditional', 'croata', 'tcheco', 'dinamarquês', 'holandês', 'inglês', 'francês', 'alemão', 'grego', 'gujarati', 'hindi', 'islandês', 'indonésio', 'italiano', 'japonês', 'kannada', 'coreano', 'malaio', 'malaia', 'marathi', 'norwegianBokmaal', 'polish', 'portuguese', 'portugueseBrazilian', 'punjabi', 'romeno', 'russo', 'sérvioCyrillic', 'sérvioLatin', 'esloveno', 'espanhol', 'sueco', 'tâmil', ' telugu', 'thai', 'ucraniano', 'urdu', 'vietnamita'
MaxTokenLength	Obtém ou define o comprimento máximo do token. Tokens maiores do que o tamanho máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são primeiro divididos em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255.
Name	Obtém ou define o nome do criador de tokens. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres. (Herdado de Tokenizer)

Métodos

Validate()

Valide o objeto .

Aplica-se a

Compartilhar via