CustomAnalyzer interface
Позволяет контролировать процесс преобразования текста в индексируемые и поисковые маркеры. Это определяемая пользователем конфигурация, состоящая из одного предопределенного токенизатора и одного или нескольких фильтров. Маркеризатор отвечает за разбиение текста в маркеры и фильтры для изменения маркеров, создаваемых токенизатором.
Свойства
| char |
Список фильтров символов, используемых для подготовки входного текста перед обработкой маркеризатором. Например, они могут заменить определенные символы или символы. Фильтры выполняются в том порядке, в котором они перечислены. |
| name | Имя анализатора. Он должен содержать только буквы, цифры, пробелы, дефисы или символы подчеркивания, может начинаться и заканчиваться буквенно-цифровыми символами и ограничен 128 символами. |
| odatatype | Полиморфная дискриминация |
| token |
Список фильтров маркеров, используемых для фильтрации или изменения маркеров, созданных токенизатором. Например, можно указать строчный фильтр, который преобразует все символы в строчный регистр. Фильтры выполняются в том порядке, в котором они перечислены. |
| tokenizer |
Имя токенизатора, используемого для разделения непрерывного текста на последовательность маркеров, например разбиение предложения на слова. KnownTokenizerNames — это перечисление со встроенными именами токенизаторов. |
Сведения о свойстве
charFilters
Список фильтров символов, используемых для подготовки входного текста перед обработкой маркеризатором. Например, они могут заменить определенные символы или символы. Фильтры выполняются в том порядке, в котором они перечислены.
charFilters?: string[]
Значение свойства
string[]
name
Имя анализатора. Он должен содержать только буквы, цифры, пробелы, дефисы или символы подчеркивания, может начинаться и заканчиваться буквенно-цифровыми символами и ограничен 128 символами.
name: string
Значение свойства
string
odatatype
Полиморфная дискриминация
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
Значение свойства
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
Список фильтров маркеров, используемых для фильтрации или изменения маркеров, созданных токенизатором. Например, можно указать строчный фильтр, который преобразует все символы в строчный регистр. Фильтры выполняются в том порядке, в котором они перечислены.
tokenFilters?: string[]
Значение свойства
string[]
tokenizerName
Имя токенизатора, используемого для разделения непрерывного текста на последовательность маркеров, например разбиение предложения на слова. KnownTokenizerNames — это перечисление со встроенными именами токенизаторов.
tokenizerName: string
Значение свойства
string