ClassicTokenizer interface
Tokenizátor založený na gramatikě, který je vhodný pro zpracování většiny dokumentů evropského jazyka. Tento tokenizátor se implementuje pomocí Apache Lucene.
- Extends
Vlastnosti
| max |
Maximální délka tokenu. Výchozí hodnota je 255. Tokeny delší než maximální délka jsou rozdělené. Maximální délka tokenu, kterou lze použít, je 300 znaků. |
| odatatype | Polymorfní diskriminátor, který určuje různé typy tohoto objektu |
Zděděné vlastnosti
| name | Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit alfanumerickými znaky a je omezena na 128 znaků. |
Podrobnosti vlastnosti
maxTokenLength
Maximální délka tokenu. Výchozí hodnota je 255. Tokeny delší než maximální délka jsou rozdělené. Maximální délka tokenu, kterou lze použít, je 300 znaků.
maxTokenLength?: number
Hodnota vlastnosti
number
odatatype
Polymorfní diskriminátor, který určuje různé typy tohoto objektu
odatatype: "#Microsoft.Azure.Search.ClassicTokenizer"
Hodnota vlastnosti
"#Microsoft.Azure.Search.ClassicTokenizer"
Podrobnosti zděděných vlastností
name
Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit alfanumerickými znaky a je omezena na 128 znaků.
name: string
Hodnota vlastnosti
string
Zděděno poLexicalTokenizer.name