Dela via


CjkBigramTokenFilter interface

Bildar bigrams av CJK-termer som genereras från standardtokeniseraren. Det här tokenfiltret implementeras med Apache Lucene.

Extends

Egenskaper

ignoreScripts

Skripten som ska ignoreras.

odatatype

Polymorfisk diskriminering, som anger de olika typerna som det här objektet kan vara

outputUnigrams

Ett värde som anger om du vill mata ut både unigram och bigrams (om det är sant) eller bara bigrams (om falskt). Standardvärdet är false.

Ärvda egenskaper

name

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

Egenskapsinformation

ignoreScripts

Skripten som ska ignoreras.

ignoreScripts?: CjkBigramTokenFilterScripts[]

Egenskapsvärde

odatatype

Polymorfisk diskriminering, som anger de olika typerna som det här objektet kan vara

odatatype: "#Microsoft.Azure.Search.CjkBigramTokenFilter"

Egenskapsvärde

"#Microsoft.Azure.Search.CjkBigramTokenFilter"

outputUnigrams

Ett värde som anger om du vill mata ut både unigram och bigrams (om det är sant) eller bara bigrams (om falskt). Standardvärdet är false.

outputUnigrams?: boolean

Egenskapsvärde

boolean

Information om ärvda egenskaper

name

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

name: string

Egenskapsvärde

string

Ärvd frånBaseTokenFilter.name