CustomAnalyzer interface
Позволяет управлять процессом преобразования текста в индексируемые и доступные для поиска маркеры. Это определяемая пользователем конфигурация, состоящая из одного предопределенного создателя маркеров и одного или нескольких фильтров. Создатель маркеров отвечает за разбиение текста на маркеры и фильтры для изменения маркеров, выдаваемых создателем маркеров.
Свойства
char |
Список фильтров символов, используемых для подготовки входного текста перед его обработкой создателем маркеров. Например, фильтр может заменить определенные знаки или символы. Фильтры выполняются в том порядке, в котором они перечислены. |
name | Имя анализатора. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков. |
odatatype | Полиморфный дискриминатор |
token |
Список фильтров маркеров, используемых для фильтрации или изменения маркеров, созданных создателем маркеров. Например, вы можете указать специальный фильтр, который преобразует все символы в нижний регистр. Фильтры выполняются в том порядке, в котором они перечислены. |
tokenizer |
Имя создателя маркеров, используемое для разделения непрерывного текста на последовательность маркеров, например разбиение предложения на слова. KnownTokenizerNames — это перечисление, содержащее встроенные имена токенизаторов. |
Сведения о свойстве
charFilters
Список фильтров символов, используемых для подготовки входного текста перед его обработкой создателем маркеров. Например, фильтр может заменить определенные знаки или символы. Фильтры выполняются в том порядке, в котором они перечислены.
charFilters?: string[]
Значение свойства
string[]
name
Имя анализатора. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.
name: string
Значение свойства
string
odatatype
Полиморфный дискриминатор
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
Значение свойства
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
Список фильтров маркеров, используемых для фильтрации или изменения маркеров, созданных создателем маркеров. Например, вы можете указать специальный фильтр, который преобразует все символы в нижний регистр. Фильтры выполняются в том порядке, в котором они перечислены.
tokenFilters?: string[]
Значение свойства
string[]
tokenizerName
Имя создателя маркеров, используемое для разделения непрерывного текста на последовательность маркеров, например разбиение предложения на слова. KnownTokenizerNames — это перечисление, содержащее встроенные имена токенизаторов.
tokenizerName: string
Значение свойства
string