MicrosoftLanguageStemmingTokenizer interface
Membagi teks menggunakan aturan khusus bahasa dan mengurangi kata-kata ke formulir dasarnya.
- Memperluas
Properti
| is |
Nilai yang menunjukkan bagaimana tokenizer digunakan. Atur ke true jika digunakan sebagai tokenizer pencarian, atur ke false jika digunakan sebagai tokenizer pengindeksan. Defaultnya adalah false. |
| language | Bahasa yang digunakan. Defaultnya adalah bahasa Inggris. |
| max |
Panjang token maksimum. Token yang lebih panjang dari panjang maksimum dibagi. Panjang token maksimum yang dapat digunakan adalah 300 karakter. Token yang lebih panjang dari 300 karakter pertama kali dibagi menjadi token dengan panjang 300 dan kemudian masing-masing token tersebut dibagi berdasarkan panjang token maksimum yang ditetapkan. Defaultnya adalah 255. |
| odatatype | Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat |
Properti yang Diwariskan
| name | Nama tokenizer. Ini hanya boleh berisi huruf, digit, spasi, tanda hubung atau garis bawah, hanya dapat dimulai dan diakhir dengan karakter alfanumerik, dan dibatasi hingga 128 karakter. |
Detail Properti
isSearchTokenizer
Nilai yang menunjukkan bagaimana tokenizer digunakan. Atur ke true jika digunakan sebagai tokenizer pencarian, atur ke false jika digunakan sebagai tokenizer pengindeksan. Defaultnya adalah false.
isSearchTokenizer?: boolean
Nilai Properti
boolean
language
Bahasa yang digunakan. Defaultnya adalah bahasa Inggris.
language?: MicrosoftStemmingTokenizerLanguage
Nilai Properti
maxTokenLength
Panjang token maksimum. Token yang lebih panjang dari panjang maksimum dibagi. Panjang token maksimum yang dapat digunakan adalah 300 karakter. Token yang lebih panjang dari 300 karakter pertama kali dibagi menjadi token dengan panjang 300 dan kemudian masing-masing token tersebut dibagi berdasarkan panjang token maksimum yang ditetapkan. Defaultnya adalah 255.
maxTokenLength?: number
Nilai Properti
number
odatatype
Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Nilai Properti
"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Detail Properti yang Diwariskan
name
Nama tokenizer. Ini hanya boleh berisi huruf, digit, spasi, tanda hubung atau garis bawah, hanya dapat dimulai dan diakhir dengan karakter alfanumerik, dan dibatasi hingga 128 karakter.
name: string
Nilai Properti
string
Diwariskan DariBaseLexicalTokenizer.name