ClassicTokenizer interface
Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva.
- Extends
Tulajdonságok
max |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
odatatype | Polimorf diszkriminatív, amely meghatározza az objektum különböző típusait |
Örökölt tulajdonságok
name | A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
Tulajdonság adatai
maxTokenLength
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.
maxTokenLength?: number
Tulajdonság értéke
number
odatatype
Polimorf diszkriminatív, amely meghatározza az objektum különböző típusait
odatatype: "#Microsoft.Azure.Search.ClassicTokenizer"
Tulajdonság értéke
"#Microsoft.Azure.Search.ClassicTokenizer"
Örökölt tulajdonság részletei
name
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
name: string
Tulajdonság értéke
string
ÖrököltBaseLexicalTokenizer.name