CjkBigramTokenFilter interface
Tworzy bigramy terminów CJK generowanych na podstawie standardowego tokenizatora. Ten filtr tokenu jest implementowany przy użyciu rozwiązania Apache Lucene.
- Extends
Właściwości
ignore |
Skrypty do zignorowania. |
odatatype | Dyskryminujący polimorficzny, który określa różne typy tego obiektu może być |
output |
Wartość wskazująca, czy wyjdą zarówno unigramy, jak i bigramy (jeśli prawda), czy tylko bigramy (jeśli fałsz). Wartość domyślna to false. |
Właściwości dziedziczone
name | Nazwa filtru tokenu. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków. |
Szczegóły właściwości
ignoreScripts
Skrypty do zignorowania.
ignoreScripts?: CjkBigramTokenFilterScripts[]
Wartość właściwości
odatatype
Dyskryminujący polimorficzny, który określa różne typy tego obiektu może być
odatatype: "#Microsoft.Azure.Search.CjkBigramTokenFilter"
Wartość właściwości
"#Microsoft.Azure.Search.CjkBigramTokenFilter"
outputUnigrams
Wartość wskazująca, czy wyjdą zarówno unigramy, jak i bigramy (jeśli prawda), czy tylko bigramy (jeśli fałsz). Wartość domyślna to false.
outputUnigrams?: boolean
Wartość właściwości
boolean
Szczegóły właściwości dziedziczonej
name
Nazwa filtru tokenu. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.
name: string
Wartość właściwości
string
Dziedziczone zBaseTokenFilter.name