CustomAnalyzer interface
Permite tomar el control sobre el proceso de conversión de texto en tokens indexables o que se pueden buscar. Se trata de una configuración definida por el usuario que consta de un único tokenizador predefinido y uno o varios filtros. El tokenizador es responsable de dividir texto en tokens y los filtros para modificar los tokens emitidos por el tokenizador.
Propiedades
char |
Lista de filtros de caracteres usados para preparar el texto de entrada antes de que el tokenizador lo procese. Por ejemplo, pueden reemplazar determinados caracteres o símbolos. Los filtros se ejecutan en el orden en que se muestran. |
name | Nombre del analizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres. |
odatatype | Discriminador polimórfico |
token |
Lista de filtros de token usados para filtrar o modificar los tokens generados por un tokenizador. Por ejemplo, puede especificar un filtro en minúsculas que convierta todos los caracteres en minúsculas. Los filtros se ejecutan en el orden en que se muestran. |
tokenizer |
Nombre del tokenizador que se va a usar para dividir el texto continuo en una secuencia de tokens, como dividir una oración en palabras. KnownTokenizerNames es una enumeración que contiene nombres de tokenizador integrados. |
Detalles de las propiedades
charFilters
Lista de filtros de caracteres usados para preparar el texto de entrada antes de que el tokenizador lo procese. Por ejemplo, pueden reemplazar determinados caracteres o símbolos. Los filtros se ejecutan en el orden en que se muestran.
charFilters?: string[]
Valor de propiedad
string[]
name
Nombre del analizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
name: string
Valor de propiedad
string
odatatype
Discriminador polimórfico
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
Valor de propiedad
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
Lista de filtros de token usados para filtrar o modificar los tokens generados por un tokenizador. Por ejemplo, puede especificar un filtro en minúsculas que convierta todos los caracteres en minúsculas. Los filtros se ejecutan en el orden en que se muestran.
tokenFilters?: string[]
Valor de propiedad
string[]
tokenizerName
Nombre del tokenizador que se va a usar para dividir el texto continuo en una secuencia de tokens, como dividir una oración en palabras. KnownTokenizerNames es una enumeración que contiene nombres de tokenizador integrados.
tokenizerName: string
Valor de propiedad
string