CjkBigramTokenFilter interface
Vytváří bigramy výrazů CJK, které jsou generovány ze standardního tokenizátoru. Tento filtr tokenů je implementovaný pomocí Apache Lucene.
- Extends
Vlastnosti
ignore |
Skripty, které se mají ignorovat. |
odatatype | Polymorfní diskriminátor, který určuje, jaké typy může být tento objekt |
output |
Hodnota označující, jestli se mají vydělovat jak unigramy, tak bigramy (pokud je pravda), nebo jenom bigramy (pokud false). Výchozí hodnota je false. |
Zděděné vlastnosti
name | Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků. |
Podrobnosti vlastnosti
ignoreScripts
Skripty, které se mají ignorovat.
ignoreScripts?: CjkBigramTokenFilterScripts[]
Hodnota vlastnosti
odatatype
Polymorfní diskriminátor, který určuje, jaké typy může být tento objekt
odatatype: "#Microsoft.Azure.Search.CjkBigramTokenFilter"
Hodnota vlastnosti
"#Microsoft.Azure.Search.CjkBigramTokenFilter"
outputUnigrams
Hodnota označující, jestli se mají vydělovat jak unigramy, tak bigramy (pokud je pravda), nebo jenom bigramy (pokud false). Výchozí hodnota je false.
outputUnigrams?: boolean
Hodnota vlastnosti
boolean
Podrobnosti zděděných vlastností
name
Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.
name: string
Hodnota vlastnosti
string
Zděděno zBaseTokenFilter.name