NGramTokenizer interface
Tokenisasi input ke dalam n-gram dari ukuran yang diberikan. Tokenizer ini diimplementasikan menggunakan Apache Lucene.
- Memperluas
Properti
| max |
Panjang n-gram maksimum. Defaultnya adalah 2. Maksimum adalah 300. |
| min |
Panjang n-gram minimum. Defaultnya adalah 1. Maksimum adalah 300. Harus kurang dari nilai maxGram. |
| odatatype | Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat |
| token |
Kelas karakter untuk disimpan dalam token. |
Properti yang Diwariskan
| name | Nama tokenizer. Ini hanya boleh berisi huruf, digit, spasi, tanda hubung atau garis bawah, hanya dapat dimulai dan diakhir dengan karakter alfanumerik, dan dibatasi hingga 128 karakter. |
Detail Properti
maxGram
Panjang n-gram maksimum. Defaultnya adalah 2. Maksimum adalah 300.
maxGram?: number
Nilai Properti
number
minGram
Panjang n-gram minimum. Defaultnya adalah 1. Maksimum adalah 300. Harus kurang dari nilai maxGram.
minGram?: number
Nilai Properti
number
odatatype
Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat
odatatype: "#Microsoft.Azure.Search.NGramTokenizer"
Nilai Properti
"#Microsoft.Azure.Search.NGramTokenizer"
tokenChars
Kelas karakter untuk disimpan dalam token.
tokenChars?: TokenCharacterKind[]