Udostępnij za pośrednictwem


CjkBigramTokenFilter interface

Tworzy bigramy terminów CJK generowanych na podstawie standardowego tokenizatora. Ten filtr tokenu jest implementowany przy użyciu rozwiązania Apache Lucene.

Extends

Właściwości

ignoreScripts

Skrypty do zignorowania.

odatatype

Dyskryminujący polimorficzny, który określa różne typy tego obiektu może być

outputUnigrams

Wartość wskazująca, czy wyjdą zarówno unigramy, jak i bigramy (jeśli prawda), czy tylko bigramy (jeśli fałsz). Wartość domyślna to false.

Właściwości dziedziczone

name

Nazwa filtru tokenu. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.

Szczegóły właściwości

ignoreScripts

Skrypty do zignorowania.

ignoreScripts?: CjkBigramTokenFilterScripts[]

Wartość właściwości

odatatype

Dyskryminujący polimorficzny, który określa różne typy tego obiektu może być

odatatype: "#Microsoft.Azure.Search.CjkBigramTokenFilter"

Wartość właściwości

"#Microsoft.Azure.Search.CjkBigramTokenFilter"

outputUnigrams

Wartość wskazująca, czy wyjdą zarówno unigramy, jak i bigramy (jeśli prawda), czy tylko bigramy (jeśli fałsz). Wartość domyślna to false.

outputUnigrams?: boolean

Wartość właściwości

boolean

Szczegóły właściwości dziedziczonej

name

Nazwa filtru tokenu. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.

name: string

Wartość właściwości

string

Dziedziczone zBaseTokenFilter.name