Megosztás a következőn keresztül:


ClassicTokenizer interface

Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva.

Extends

Tulajdonságok

maxTokenLength

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

odatatype

Polimorf diszkriminatív, amely meghatározza az objektum különböző típusait

Örökölt tulajdonságok

name

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

Tulajdonság adatai

maxTokenLength

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

maxTokenLength?: number

Tulajdonság értéke

number

odatatype

Polimorf diszkriminatív, amely meghatározza az objektum különböző típusait

odatatype: "#Microsoft.Azure.Search.ClassicTokenizer"

Tulajdonság értéke

"#Microsoft.Azure.Search.ClassicTokenizer"

Örökölt tulajdonság részletei

name

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

name: string

Tulajdonság értéke

string

ÖrököltBaseLexicalTokenizer.name