Compartir a través de


CustomAnalyzer interface

Permite tomar el control sobre el proceso de conversión de texto en tokens indexables o buscables. Se trata de una configuración definida por el usuario que consta de un único tokenizador predefinido y uno o varios filtros. El tokenizador es responsable de dividir el texto en tokens y de los filtros para modificar los tokens emitidos por el tokenizador.

Propiedades

charFilters

Lista de filtros de caracteres usados para preparar el texto de entrada antes de que el tokenizador lo procese. Por ejemplo, pueden reemplazar determinados caracteres o símbolos. Los filtros se ejecutan en el orden en que se muestran.

name

Nombre del analizador. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres.

odatatype

Discriminador polimórfico

tokenFilters

Lista de filtros de token usados para filtrar o modificar los tokens generados por un tokenizador. Por ejemplo, puede especificar un filtro en minúsculas que convierte todos los caracteres a minúsculas. Los filtros se ejecutan en el orden en que se muestran.

tokenizerName

Nombre del tokenizador que se va a usar para dividir el texto continuo en una secuencia de tokens, como dividir una oración en palabras. KnownTokenizerNames es una enumeración que contiene nombres de tokenizador integrados.

Detalles de las propiedades

charFilters

Lista de filtros de caracteres usados para preparar el texto de entrada antes de que el tokenizador lo procese. Por ejemplo, pueden reemplazar determinados caracteres o símbolos. Los filtros se ejecutan en el orden en que se muestran.

charFilters?: string[]

Valor de propiedad

string[]

name

Nombre del analizador. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres.

name: string

Valor de propiedad

string

odatatype

Discriminador polimórfico

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

Valor de propiedad

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

Lista de filtros de token usados para filtrar o modificar los tokens generados por un tokenizador. Por ejemplo, puede especificar un filtro en minúsculas que convierte todos los caracteres a minúsculas. Los filtros se ejecutan en el orden en que se muestran.

tokenFilters?: string[]

Valor de propiedad

string[]

tokenizerName

Nombre del tokenizador que se va a usar para dividir el texto continuo en una secuencia de tokens, como dividir una oración en palabras. KnownTokenizerNames es una enumeración que contiene nombres de tokenizador integrados.

tokenizerName: string

Valor de propiedad

string