Sdílet prostřednictvím


ShingleTokenFilter interface

Vytvoří kombinace tokenů jako jeden token. Tento filtr tokenů se implementuje pomocí Apache Lucene.

Extends

Vlastnosti

filterToken

Řetězec, který se má vložit pro každou pozici, na které není token. Výchozí hodnota je podtržítko ("_").

maxShingleSize

Maximální velikost šindele Výchozí a minimální hodnota je 2.

minShingleSize

Minimální velikost šindele Výchozí a minimální hodnota je 2. Musí být menší než hodnota maxShingleSize.

odatatype

Polymorfní diskriminátor, který určuje různé typy, které mohou být tímto objektem

outputUnigrams

Hodnota označující, jestli bude výstupní datový proud obsahovat vstupní tokeny (unigramy) i šindele. Platí výchozí hodnota.

outputUnigramsIfNoShingles

Hodnota označující, zda se mají vydělovat unigramy v době, kdy nejsou k dispozici žádné šindele. Tato vlastnost má přednost, pokud outputUnigrams je nastavena na false. Výchozí hodnota je false.

tokenSeparator

Řetězec, který se má použít při spojování sousedních tokenů za účelem vytvoření šindele. Výchozí hodnota je jedna mezera (" ").

Zděděné vlastnosti

name

Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.

Podrobnosti vlastnosti

filterToken

Řetězec, který se má vložit pro každou pozici, na které není token. Výchozí hodnota je podtržítko ("_").

filterToken?: string

Hodnota vlastnosti

string

maxShingleSize

Maximální velikost šindele Výchozí a minimální hodnota je 2.

maxShingleSize?: number

Hodnota vlastnosti

number

minShingleSize

Minimální velikost šindele Výchozí a minimální hodnota je 2. Musí být menší než hodnota maxShingleSize.

minShingleSize?: number

Hodnota vlastnosti

number

odatatype

Polymorfní diskriminátor, který určuje různé typy, které mohou být tímto objektem

odatatype: "#Microsoft.Azure.Search.ShingleTokenFilter"

Hodnota vlastnosti

"#Microsoft.Azure.Search.ShingleTokenFilter"

outputUnigrams

Hodnota označující, jestli bude výstupní datový proud obsahovat vstupní tokeny (unigramy) i šindele. Platí výchozí hodnota.

outputUnigrams?: boolean

Hodnota vlastnosti

boolean

outputUnigramsIfNoShingles

Hodnota označující, zda se mají vydělovat unigramy v době, kdy nejsou k dispozici žádné šindele. Tato vlastnost má přednost, pokud outputUnigrams je nastavena na false. Výchozí hodnota je false.

outputUnigramsIfNoShingles?: boolean

Hodnota vlastnosti

boolean

tokenSeparator

Řetězec, který se má použít při spojování sousedních tokenů za účelem vytvoření šindele. Výchozí hodnota je jedna mezera (" ").

tokenSeparator?: string

Hodnota vlastnosti

string

Podrobnosti zděděných vlastností

name

Název filtru tokenů. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.

name: string

Hodnota vlastnosti

string

Zděděno zBaseTokenFilter.name