CjkBigramTokenFilter interface
Формирует большие кадры терминов CJK, созданных из стандартного токенизатора. Этот фильтр маркеров реализуется с помощью Apache Lucene.
- Extends
Свойства
ignore |
Скрипты, которые следует игнорировать. |
odatatype | Полиморфная дискриминация, указывающая различные типы этого объекта, может быть |
output |
Значение, указывающее, следует ли выводить юниграммы и bigrams (если значение true), или просто bigrams (если значение false). Значение по умолчанию — false. |
Унаследованные свойства
name | Имя фильтра маркеров. Он должен содержать только буквы, цифры, пробелы, дефисы или символы подчеркивания, может начинаться и заканчиваться буквенно-цифровыми символами и ограничен 128 символами. |
Сведения о свойстве
ignoreScripts
Скрипты, которые следует игнорировать.
ignoreScripts?: CjkBigramTokenFilterScripts[]
Значение свойства
odatatype
Полиморфная дискриминация, указывающая различные типы этого объекта, может быть
odatatype: "#Microsoft.Azure.Search.CjkBigramTokenFilter"
Значение свойства
"#Microsoft.Azure.Search.CjkBigramTokenFilter"
outputUnigrams
Значение, указывающее, следует ли выводить юниграммы и bigrams (если значение true), или просто bigrams (если значение false). Значение по умолчанию — false.
outputUnigrams?: boolean
Значение свойства
boolean
Сведения об унаследованном свойстве
name
Имя фильтра маркеров. Он должен содержать только буквы, цифры, пробелы, дефисы или символы подчеркивания, может начинаться и заканчиваться буквенно-цифровыми символами и ограничен 128 символами.
name: string
Значение свойства
string
унаследован отBaseTokenFilter.name