CommonGramTokenFilter interface
Sestavte bigramy pro často se vyskytující termíny při indexování. Jednotlivé termíny se stále indexují, překryvné bigramy. Tento filtr tokenů se implementuje pomocí Apache Lucene.
- Extends
Vlastnosti
common |
Sada běžných slov. |
ignore |
Hodnota označující, jestli se u běžných slov nerozlišují malá a velká písmena. Výchozí hodnota je false. |
odatatype | Polymorfní diskriminátor, který určuje různé typy, které mohou být tímto objektem |
use |
Hodnota, která označuje, jestli je filtr tokenů v režimu dotazu. V režimu dotazu filtr tokenů vygeneruje bigramy a pak odebere běžná slova a jednotlivé termíny následované společným slovem. Výchozí hodnota je false. |
Zděděné vlastnosti
name | Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků. |
Podrobnosti vlastnosti
commonWords
Sada běžných slov.
commonWords: string[]
Hodnota vlastnosti
string[]
ignoreCase
Hodnota označující, jestli se u běžných slov nerozlišují malá a velká písmena. Výchozí hodnota je false.
ignoreCase?: boolean
Hodnota vlastnosti
boolean
odatatype
Polymorfní diskriminátor, který určuje různé typy, které mohou být tímto objektem
odatatype: "#Microsoft.Azure.Search.CommonGramTokenFilter"
Hodnota vlastnosti
"#Microsoft.Azure.Search.CommonGramTokenFilter"
useQueryMode
Hodnota, která označuje, jestli je filtr tokenů v režimu dotazu. V režimu dotazu filtr tokenů vygeneruje bigramy a pak odebere běžná slova a jednotlivé termíny následované společným slovem. Výchozí hodnota je false.
useQueryMode?: boolean
Hodnota vlastnosti
boolean
Podrobnosti zděděných vlastností
name
Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.
name: string
Hodnota vlastnosti
string
Zděděno zBaseTokenFilter.name