Sdílet prostřednictvím


NGramTokenizer interface

Tokenizuje vstup na n-gramy dané velikosti. Tento tokenizátor se implementuje pomocí Apache Lucene.

Extends

Vlastnosti

maxGram

Maximální délka n-gramu. Výchozí hodnota je 2. Maximum je 300.

minGram

Minimální délka n-gramu. Výchozí hodnota je 1. Maximum je 300. Musí být menší než hodnota maxGram.

odatatype

Polymorfní diskriminátor, který určuje různé typy tohoto objektu

tokenChars

Třídy znaků, které mají být v tokenech zachovány.

Zděděné vlastnosti

name

Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit alfanumerickými znaky a je omezena na 128 znaků.

Podrobnosti vlastnosti

maxGram

Maximální délka n-gramu. Výchozí hodnota je 2. Maximum je 300.

maxGram?: number

Hodnota vlastnosti

number

minGram

Minimální délka n-gramu. Výchozí hodnota je 1. Maximum je 300. Musí být menší než hodnota maxGram.

minGram?: number

Hodnota vlastnosti

number

odatatype

Polymorfní diskriminátor, který určuje různé typy tohoto objektu

odatatype: "#Microsoft.Azure.Search.NGramTokenizer"

Hodnota vlastnosti

"#Microsoft.Azure.Search.NGramTokenizer"

tokenChars

Třídy znaků, které mají být v tokenech zachovány.

tokenChars?: TokenCharacterKind[]

Hodnota vlastnosti

Podrobnosti zděděných vlastností

name

Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit alfanumerickými znaky a je omezena na 128 znaků.

name: string

Hodnota vlastnosti

string

Zděděno poLexicalTokenizer.name