Compartir a través de


CustomAnalyzer interface

Permite tomar el control sobre el proceso de conversión de texto en tokens indexables o que se pueden buscar. Se trata de una configuración definida por el usuario que consta de un único tokenizador predefinido y uno o varios filtros. El tokenizador es responsable de dividir texto en tokens y los filtros para modificar los tokens emitidos por el tokenizador.

Propiedades

charFilters

Lista de filtros de caracteres usados para preparar el texto de entrada antes de que el tokenizador lo procese. Por ejemplo, pueden reemplazar determinados caracteres o símbolos. Los filtros se ejecutan en el orden en que se muestran.

name

Nombre del analizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

odatatype

Discriminador polimórfico

tokenFilters

Lista de filtros de token usados para filtrar o modificar los tokens generados por un tokenizador. Por ejemplo, puede especificar un filtro en minúsculas que convierta todos los caracteres en minúsculas. Los filtros se ejecutan en el orden en que se muestran.

tokenizerName

Nombre del tokenizador que se va a usar para dividir el texto continuo en una secuencia de tokens, como dividir una oración en palabras. KnownTokenizerNames es una enumeración que contiene nombres de tokenizador integrados.

Detalles de las propiedades

charFilters

Lista de filtros de caracteres usados para preparar el texto de entrada antes de que el tokenizador lo procese. Por ejemplo, pueden reemplazar determinados caracteres o símbolos. Los filtros se ejecutan en el orden en que se muestran.

charFilters?: string[]

Valor de propiedad

string[]

name

Nombre del analizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

name: string

Valor de propiedad

string

odatatype

Discriminador polimórfico

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

Valor de propiedad

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

Lista de filtros de token usados para filtrar o modificar los tokens generados por un tokenizador. Por ejemplo, puede especificar un filtro en minúsculas que convierta todos los caracteres en minúsculas. Los filtros se ejecutan en el orden en que se muestran.

tokenFilters?: string[]

Valor de propiedad

string[]

tokenizerName

Nombre del tokenizador que se va a usar para dividir el texto continuo en una secuencia de tokens, como dividir una oración en palabras. KnownTokenizerNames es una enumeración que contiene nombres de tokenizador integrados.

tokenizerName: string

Valor de propiedad

string