Sdílet prostřednictvím


ClassicTokenizer interface

Tokenizátor založený na gramatikě, který je vhodný pro zpracování většiny dokumentů evropského jazyka. Tento tokenizátor se implementuje pomocí Apache Lucene.

Extends

Vlastnosti

maxTokenLength

Maximální délka tokenu. Výchozí hodnota je 255. Tokeny delší než maximální délka jsou rozdělené. Maximální délka tokenu, kterou lze použít, je 300 znaků.

odatatype

Polymorfní diskriminátor, který určuje různé typy tohoto objektu

Zděděné vlastnosti

name

Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit alfanumerickými znaky a je omezena na 128 znaků.

Podrobnosti vlastnosti

maxTokenLength

Maximální délka tokenu. Výchozí hodnota je 255. Tokeny delší než maximální délka jsou rozdělené. Maximální délka tokenu, kterou lze použít, je 300 znaků.

maxTokenLength?: number

Hodnota vlastnosti

number

odatatype

Polymorfní diskriminátor, který určuje různé typy tohoto objektu

odatatype: "#Microsoft.Azure.Search.ClassicTokenizer"

Hodnota vlastnosti

"#Microsoft.Azure.Search.ClassicTokenizer"

Podrobnosti zděděných vlastností

name

Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit alfanumerickými znaky a je omezena na 128 znaků.

name: string

Hodnota vlastnosti

string

Zděděno poLexicalTokenizer.name