Sdílet prostřednictvím


CjkBigramTokenFilter interface

Vytváří bigramy výrazů CJK, které jsou generovány ze standardního tokenizátoru. Tento filtr tokenů je implementovaný pomocí Apache Lucene.

Extends

Vlastnosti

ignoreScripts

Skripty, které se mají ignorovat.

odatatype

Polymorfní diskriminátor, který určuje, jaké typy může být tento objekt

outputUnigrams

Hodnota označující, jestli se mají vydělovat jak unigramy, tak bigramy (pokud je pravda), nebo jenom bigramy (pokud false). Výchozí hodnota je false.

Zděděné vlastnosti

name

Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.

Podrobnosti vlastnosti

ignoreScripts

Skripty, které se mají ignorovat.

ignoreScripts?: CjkBigramTokenFilterScripts[]

Hodnota vlastnosti

odatatype

Polymorfní diskriminátor, který určuje, jaké typy může být tento objekt

odatatype: "#Microsoft.Azure.Search.CjkBigramTokenFilter"

Hodnota vlastnosti

"#Microsoft.Azure.Search.CjkBigramTokenFilter"

outputUnigrams

Hodnota označující, jestli se mají vydělovat jak unigramy, tak bigramy (pokud je pravda), nebo jenom bigramy (pokud false). Výchozí hodnota je false.

outputUnigrams?: boolean

Hodnota vlastnosti

boolean

Podrobnosti zděděných vlastností

name

Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.

name: string

Hodnota vlastnosti

string

Zděděno zBaseTokenFilter.name