Поделиться через


CustomAnalyzer interface

Позволяет контролировать процесс преобразования текста в индексируемые и поисковые маркеры. Это определяемая пользователем конфигурация, состоящая из одного предопределенного токенизатора и одного или нескольких фильтров. Маркеризатор отвечает за разбиение текста в маркеры и фильтры для изменения маркеров, создаваемых токенизатором.

Свойства

charFilters

Список фильтров символов, используемых для подготовки входного текста перед обработкой маркеризатором. Например, они могут заменить определенные символы или символы. Фильтры выполняются в том порядке, в котором они перечислены.

name

Имя анализатора. Он должен содержать только буквы, цифры, пробелы, дефисы или символы подчеркивания, может начинаться и заканчиваться буквенно-цифровыми символами и ограничен 128 символами.

odatatype

Полиморфная дискриминация

tokenFilters

Список фильтров маркеров, используемых для фильтрации или изменения маркеров, созданных токенизатором. Например, можно указать строчный фильтр, который преобразует все символы в строчный регистр. Фильтры выполняются в том порядке, в котором они перечислены.

tokenizerName

Имя токенизатора, используемого для разделения непрерывного текста на последовательность маркеров, например разбиение предложения на слова. KnownTokenizerNames — это перечисление со встроенными именами токенизаторов.

Сведения о свойстве

charFilters

Список фильтров символов, используемых для подготовки входного текста перед обработкой маркеризатором. Например, они могут заменить определенные символы или символы. Фильтры выполняются в том порядке, в котором они перечислены.

charFilters?: string[]

Значение свойства

string[]

name

Имя анализатора. Он должен содержать только буквы, цифры, пробелы, дефисы или символы подчеркивания, может начинаться и заканчиваться буквенно-цифровыми символами и ограничен 128 символами.

name: string

Значение свойства

string

odatatype

Полиморфная дискриминация

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

Значение свойства

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

Список фильтров маркеров, используемых для фильтрации или изменения маркеров, созданных токенизатором. Например, можно указать строчный фильтр, который преобразует все символы в строчный регистр. Фильтры выполняются в том порядке, в котором они перечислены.

tokenFilters?: string[]

Значение свойства

string[]

tokenizerName

Имя токенизатора, используемого для разделения непрерывного текста на последовательность маркеров, например разбиение предложения на слова. KnownTokenizerNames — это перечисление со встроенными именами токенизаторов.

tokenizerName: string

Значение свойства

string