Поделиться через


EdgeNGramTokenizer interface

Маркеризует входные данные из ребра в n граммов заданного размера. Этот создатель маркеров реализуется с помощью Apache Lucene.

Extends

Свойства

maxGram

Максимальная длина n-грамма. По умолчанию используется значение 2. Максимум — 300.

minGram

Минимальная n-граммовая длина. Значение по умолчанию: 1. Максимум — 300. Значение должно быть меньше значения maxGram.

odatatype

Полиморфный дискриминатор, который указывает различные типы, которые могут быть у этого объекта.

tokenChars

Классы символов, которые нужно сохранить в маркерах.

Унаследованные свойства

name

Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.

Сведения о свойстве

maxGram

Максимальная длина n-грамма. По умолчанию используется значение 2. Максимум — 300.

maxGram?: number

Значение свойства

number

minGram

Минимальная n-граммовая длина. Значение по умолчанию: 1. Максимум — 300. Значение должно быть меньше значения maxGram.

minGram?: number

Значение свойства

number

odatatype

Полиморфный дискриминатор, который указывает различные типы, которые могут быть у этого объекта.

odatatype: "#Microsoft.Azure.Search.EdgeNGramTokenizer"

Значение свойства

"#Microsoft.Azure.Search.EdgeNGramTokenizer"

tokenChars

Классы символов, которые нужно сохранить в маркерах.

tokenChars?: TokenCharacterKind[]

Значение свойства

Сведения об унаследованном свойстве

name

Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.

name: string

Значение свойства

string

Наследуется отBaseLexicalTokenizer.name