Sdílet prostřednictvím


CommonGramTokenFilter interface

Sestavte bigramy pro často se vyskytující termíny při indexování. Jednotlivé termíny se stále indexují, překryvné bigramy. Tento filtr tokenů se implementuje pomocí Apache Lucene.

Extends

Vlastnosti

commonWords

Sada běžných slov.

ignoreCase

Hodnota označující, jestli se u běžných slov nerozlišují malá a velká písmena. Výchozí hodnota je false.

odatatype

Polymorfní diskriminátor, který určuje různé typy, které mohou být tímto objektem

useQueryMode

Hodnota, která označuje, jestli je filtr tokenů v režimu dotazu. V režimu dotazu filtr tokenů vygeneruje bigramy a pak odebere běžná slova a jednotlivé termíny následované společným slovem. Výchozí hodnota je false.

Zděděné vlastnosti

name

Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.

Podrobnosti vlastnosti

commonWords

Sada běžných slov.

commonWords: string[]

Hodnota vlastnosti

string[]

ignoreCase

Hodnota označující, jestli se u běžných slov nerozlišují malá a velká písmena. Výchozí hodnota je false.

ignoreCase?: boolean

Hodnota vlastnosti

boolean

odatatype

Polymorfní diskriminátor, který určuje různé typy, které mohou být tímto objektem

odatatype: "#Microsoft.Azure.Search.CommonGramTokenFilter"

Hodnota vlastnosti

"#Microsoft.Azure.Search.CommonGramTokenFilter"

useQueryMode

Hodnota, která označuje, jestli je filtr tokenů v režimu dotazu. V režimu dotazu filtr tokenů vygeneruje bigramy a pak odebere běžná slova a jednotlivé termíny následované společným slovem. Výchozí hodnota je false.

useQueryMode?: boolean

Hodnota vlastnosti

boolean

Podrobnosti zděděných vlastností

name

Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.

name: string

Hodnota vlastnosti

string

Zděděno zBaseTokenFilter.name