Compartilhar via


CustomAnalyzer Classe

Definição

Permite que você assuma o controle sobre o processo de conversão de texto em tokens indexáveis/pesquisáveis. É uma configuração definida pelo usuário que consiste em um único tokenizer predefinido e um ou mais filtros. O criador de token é responsável por dividir o texto em tokens e os filtros para modificar tokens emitidos pelo criador de tokens.

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.CustomAnalyzer")]
public class CustomAnalyzer : Microsoft.Azure.Search.Models.Analyzer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.CustomAnalyzer")>]
type CustomAnalyzer = class
    inherit Analyzer
Public Class CustomAnalyzer
Inherits Analyzer
Herança
CustomAnalyzer
Atributos
Newtonsoft.Json.JsonObjectAttribute

Construtores

CustomAnalyzer()

Inicializa uma nova instância da classe CustomAnalyzer.

CustomAnalyzer(String, TokenizerName, IList<TokenFilterName>, IList<CharFilterName>)

Inicializa uma nova instância da classe CustomAnalyzer.

Propriedades

CharFilters

Obtém ou define uma lista de filtros de caracteres usados para preparar o texto de entrada antes de ser processado pelo criador de tokens. Por exemplo, ele pode substituir certos caracteres ou símbolos. Os filtros são executados na ordem em que estão listados.

Name

Obtém ou define o nome do analisador. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres.

(Herdado de Analyzer)
TokenFilters

Obtém ou define uma lista de filtros de token usados para filtrar ou modificar os tokens gerados por um criador de tokens. Por exemplo, você pode especificar um filtro de minúsculas que converte todos os caracteres em letras minúsculas. Os filtros são executados na ordem em que estão listados.

Tokenizer

Obtém ou define o nome do criador de token a ser usado para dividir o texto contínuo em uma sequência de tokens, como dividir uma frase em palavras. Os valores possíveis incluem: 'classic', 'edgeNGram', 'keyword_v2', 'letter', 'lowercase', 'microsoft_language_tokenizer', 'microsoft_language_stemming_tokenizer', 'nGram', 'path_hierarchy_v2', 'pattern', 'standard_v2', 'uax_url_email', 'whitespace'

Métodos

Validate()

Valide o objeto .

Aplica-se a