MicrosoftLanguageStemmingTokenizer interface
Membagi teks menggunakan aturan khusus bahasa dan mengurangi kata-kata ke formulir dasarnya.
- Extends
Properti
is |
Nilai yang menunjukkan bagaimana tokenizer digunakan. Atur ke true jika digunakan sebagai tokenizer pencarian, atur ke false jika digunakan sebagai tokenizer pengindeksan. Defaultnya adalah false. |
language | Bahasa yang akan digunakan. Defaultnya adalah bahasa Inggris. |
max |
Panjang token maksimum. Token yang lebih panjang dari panjang maksimum dipecah. Panjang token maksimum yang dapat digunakan adalah 300 karakter. Token yang lebih panjang dari 300 karakter pertama kali dibagi menjadi token dengan panjang 300 dan kemudian masing-masing token tersebut dibagi berdasarkan set panjang token maksimum. Defaultnya adalah 255. |
odatatype | Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat |
Properti yang Diwariskan
name | Nama tokenizer. Nama hanya boleh berisi huruf, digit, spasi, garis putus-putus, atau garis bawah, hanya dapat dimulai dan diakhiri dengan karakter alfanumerik, dan dibatasi hingga 128 karakter. |
Detail Properti
isSearchTokenizer
Nilai yang menunjukkan bagaimana tokenizer digunakan. Atur ke true jika digunakan sebagai tokenizer pencarian, atur ke false jika digunakan sebagai tokenizer pengindeksan. Defaultnya adalah false.
isSearchTokenizer?: boolean
Nilai Properti
boolean
language
Bahasa yang akan digunakan. Defaultnya adalah bahasa Inggris.
language?: MicrosoftStemmingTokenizerLanguage
Nilai Properti
maxTokenLength
Panjang token maksimum. Token yang lebih panjang dari panjang maksimum dipecah. Panjang token maksimum yang dapat digunakan adalah 300 karakter. Token yang lebih panjang dari 300 karakter pertama kali dibagi menjadi token dengan panjang 300 dan kemudian masing-masing token tersebut dibagi berdasarkan set panjang token maksimum. Defaultnya adalah 255.
maxTokenLength?: number
Nilai Properti
number
odatatype
Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Nilai Properti
"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Detail Properti yang Diwariskan
name
Nama tokenizer. Nama hanya boleh berisi huruf, digit, spasi, garis putus-putus, atau garis bawah, hanya dapat dimulai dan diakhiri dengan karakter alfanumerik, dan dibatasi hingga 128 karakter.
name: string
Nilai Properti
string
Diwarisi DariBaseLexicalTokenizer.name