ClassicTokenizer interface
Грамматический создатель маркеров, который подходит для обработки большинства документов на европейском языке. Этот создатель маркеров реализуется с помощью Apache Lucene.
- Extends
Свойства
max |
Максимальная длина маркера. Значение по умолчанию — 255. Маркеры, размер которых превышает максимальную длину, разделяются. Максимальная длина маркера, которую можно использовать, составляет 300 символов. |
odatatype | Полиморфный дискриминатор, который указывает различные типы, которые могут быть у этого объекта. |
Унаследованные свойства
name | Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков. |
Сведения о свойстве
maxTokenLength
Максимальная длина маркера. Значение по умолчанию — 255. Маркеры, размер которых превышает максимальную длину, разделяются. Максимальная длина маркера, которую можно использовать, составляет 300 символов.
maxTokenLength?: number
Значение свойства
number
odatatype
Полиморфный дискриминатор, который указывает различные типы, которые могут быть у этого объекта.
odatatype: "#Microsoft.Azure.Search.ClassicTokenizer"
Значение свойства
"#Microsoft.Azure.Search.ClassicTokenizer"
Сведения об унаследованном свойстве
name
Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.
name: string
Значение свойства
string
Наследуется отBaseLexicalTokenizer.name