Поделиться через


CustomAnalyzer interface

Позволяет управлять процессом преобразования текста в индексируемые и доступные для поиска маркеры. Это определяемая пользователем конфигурация, состоящая из одного предопределенного создателя маркеров и одного или нескольких фильтров. Создатель маркеров отвечает за разбиение текста на маркеры и фильтры для изменения маркеров, выдаваемых создателем маркеров.

Свойства

charFilters

Список фильтров символов, используемых для подготовки входного текста перед его обработкой создателем маркеров. Например, фильтр может заменить определенные знаки или символы. Фильтры выполняются в том порядке, в котором они перечислены.

name

Имя анализатора. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.

odatatype

Полиморфный дискриминатор

tokenFilters

Список фильтров маркеров, используемых для фильтрации или изменения маркеров, созданных создателем маркеров. Например, вы можете указать специальный фильтр, который преобразует все символы в нижний регистр. Фильтры выполняются в том порядке, в котором они перечислены.

tokenizerName

Имя создателя маркеров, используемое для разделения непрерывного текста на последовательность маркеров, например разбиение предложения на слова. KnownTokenizerNames — это перечисление, содержащее встроенные имена токенизаторов.

Сведения о свойстве

charFilters

Список фильтров символов, используемых для подготовки входного текста перед его обработкой создателем маркеров. Например, фильтр может заменить определенные знаки или символы. Фильтры выполняются в том порядке, в котором они перечислены.

charFilters?: string[]

Значение свойства

string[]

name

Имя анализатора. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.

name: string

Значение свойства

string

odatatype

Полиморфный дискриминатор

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

Значение свойства

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

Список фильтров маркеров, используемых для фильтрации или изменения маркеров, созданных создателем маркеров. Например, вы можете указать специальный фильтр, который преобразует все символы в нижний регистр. Фильтры выполняются в том порядке, в котором они перечислены.

tokenFilters?: string[]

Значение свойства

string[]

tokenizerName

Имя создателя маркеров, используемое для разделения непрерывного текста на последовательность маркеров, например разбиение предложения на слова. KnownTokenizerNames — это перечисление, содержащее встроенные имена токенизаторов.

tokenizerName: string

Значение свойства

string