Compartir a través de


CustomAnalyzer Clase

Definición

Permite tomar el control sobre el proceso de conversión de texto en tokens indexables o buscables. Se trata de una configuración definida por el usuario que consta de un único tokenizador predefinido y uno o varios filtros. El tokenizador es responsable de dividir texto en tokens y los filtros para modificar los tokens emitidos por el tokenizador.

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.CustomAnalyzer")]
public class CustomAnalyzer : Microsoft.Azure.Search.Models.Analyzer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.CustomAnalyzer")>]
type CustomAnalyzer = class
    inherit Analyzer
Public Class CustomAnalyzer
Inherits Analyzer
Herencia
CustomAnalyzer
Atributos
Newtonsoft.Json.JsonObjectAttribute

Constructores

CustomAnalyzer()

Inicializa una nueva instancia de la clase CustomAnalyzer.

CustomAnalyzer(String, TokenizerName, IList<TokenFilterName>, IList<CharFilterName>)

Inicializa una nueva instancia de la clase CustomAnalyzer.

Propiedades

CharFilters

Obtiene o establece una lista de filtros de caracteres usados para preparar el texto de entrada antes de que el tokenizador lo procese. Por ejemplo, pueden reemplazar determinados caracteres o símbolos. Los filtros se ejecutan en el orden en que se muestran.

Name

Obtiene o establece el nombre del analizador. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres.

(Heredado de Analyzer)
TokenFilters

Obtiene o establece una lista de filtros de token usados para filtrar o modificar los tokens generados por un tokenizador. Por ejemplo, puede especificar un filtro en minúsculas que convierte todos los caracteres a minúsculas. Los filtros se ejecutan en el orden en que se muestran.

Tokenizer

Obtiene o establece el nombre del tokenizador que se va a usar para dividir el texto continuo en una secuencia de tokens, como dividir una frase en palabras. Entre los valores posibles se incluyen: "classic", "edgeNGram", "keyword_v2", "letter", "lowercase", "microsoft_language_tokenizer", "microsoft_language_stemming_tokenizer", "nGram", "path_hierarchy_v2", "pattern", "standard_v2", "uax_url_email", "whitespace".

Métodos

Validate()

Valide el objeto .

Se aplica a