NGramTokenizer interface
Размечает входные данные на N-граммы заданного размера. Этот создатель маркеров реализуется с помощью Apache Lucene.
- Extends
Свойства
max |
Максимальная длина n-грамма. По умолчанию используется значение 2. Максимум — 300. |
min |
Минимальная n-граммовая длина. Значение по умолчанию: 1. Максимум — 300. Значение должно быть меньше значения maxGram. |
odatatype | Полиморфный дискриминатор, который указывает различные типы, которые могут быть у этого объекта. |
token |
Классы символов, которые нужно сохранить в маркерах. |
Унаследованные свойства
name | Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков. |
Сведения о свойстве
maxGram
Максимальная длина n-грамма. По умолчанию используется значение 2. Максимум — 300.
maxGram?: number
Значение свойства
number
minGram
Минимальная n-граммовая длина. Значение по умолчанию: 1. Максимум — 300. Значение должно быть меньше значения maxGram.
minGram?: number
Значение свойства
number
odatatype
Полиморфный дискриминатор, который указывает различные типы, которые могут быть у этого объекта.
odatatype: "#Microsoft.Azure.Search.NGramTokenizer"
Значение свойства
"#Microsoft.Azure.Search.NGramTokenizer"
tokenChars
Классы символов, которые нужно сохранить в маркерах.
tokenChars?: TokenCharacterKind[]
Значение свойства
Сведения об унаследованном свойстве
name
Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.
name: string
Значение свойства
string
Наследуется отBaseLexicalTokenizer.name