Поделиться через


CjkBigramTokenFilter interface

Формирует большие кадры терминов CJK, созданных из стандартного токенизатора. Этот фильтр маркеров реализуется с помощью Apache Lucene.

Extends

Свойства

ignoreScripts

Скрипты, которые следует игнорировать.

odatatype

Полиморфная дискриминация, указывающая различные типы этого объекта, может быть

outputUnigrams

Значение, указывающее, следует ли выводить юниграммы и bigrams (если значение true), или просто bigrams (если значение false). Значение по умолчанию — false.

Унаследованные свойства

name

Имя фильтра маркеров. Он должен содержать только буквы, цифры, пробелы, дефисы или символы подчеркивания, может начинаться и заканчиваться буквенно-цифровыми символами и ограничен 128 символами.

Сведения о свойстве

ignoreScripts

Скрипты, которые следует игнорировать.

ignoreScripts?: CjkBigramTokenFilterScripts[]

Значение свойства

odatatype

Полиморфная дискриминация, указывающая различные типы этого объекта, может быть

odatatype: "#Microsoft.Azure.Search.CjkBigramTokenFilter"

Значение свойства

"#Microsoft.Azure.Search.CjkBigramTokenFilter"

outputUnigrams

Значение, указывающее, следует ли выводить юниграммы и bigrams (если значение true), или просто bigrams (если значение false). Значение по умолчанию — false.

outputUnigrams?: boolean

Значение свойства

boolean

Сведения об унаследованном свойстве

name

Имя фильтра маркеров. Он должен содержать только буквы, цифры, пробелы, дефисы или символы подчеркивания, может начинаться и заканчиваться буквенно-цифровыми символами и ограничен 128 символами.

name: string

Значение свойства

string

унаследован отBaseTokenFilter.name