MicrosoftLanguageStemmingTokenizer interface

Referensi

Paket:: @azure/search-documents

Membagi teks menggunakan aturan khusus bahasa dan mengurangi kata-kata ke formulir dasarnya.

Extends: BaseLexicalTokenizer

Properti

isSearchTokenizer	Nilai yang menunjukkan bagaimana tokenizer digunakan. Atur ke true jika digunakan sebagai tokenizer pencarian, atur ke false jika digunakan sebagai tokenizer pengindeksan. Defaultnya adalah false.
language	Bahasa yang akan digunakan. Defaultnya adalah bahasa Inggris.
maxTokenLength	Panjang token maksimum. Token yang lebih panjang dari panjang maksimum dipecah. Panjang token maksimum yang dapat digunakan adalah 300 karakter. Token yang lebih panjang dari 300 karakter pertama kali dibagi menjadi token dengan panjang 300 dan kemudian masing-masing token tersebut dibagi berdasarkan set panjang token maksimum. Defaultnya adalah 255.
odatatype	Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat

Properti yang Diwariskan

name	Nama tokenizer. Nama hanya boleh berisi huruf, digit, spasi, garis putus-putus, atau garis bawah, hanya dapat dimulai dan diakhiri dengan karakter alfanumerik, dan dibatasi hingga 128 karakter.

Detail Properti

isSearchTokenizer

Nilai yang menunjukkan bagaimana tokenizer digunakan. Atur ke true jika digunakan sebagai tokenizer pencarian, atur ke false jika digunakan sebagai tokenizer pengindeksan. Defaultnya adalah false.

isSearchTokenizer?: boolean

Nilai Properti

boolean

language

Bahasa yang akan digunakan. Defaultnya adalah bahasa Inggris.

language?: MicrosoftStemmingTokenizerLanguage

Nilai Properti

MicrosoftStemmingTokenizerLanguage

maxTokenLength

Panjang token maksimum. Token yang lebih panjang dari panjang maksimum dipecah. Panjang token maksimum yang dapat digunakan adalah 300 karakter. Token yang lebih panjang dari 300 karakter pertama kali dibagi menjadi token dengan panjang 300 dan kemudian masing-masing token tersebut dibagi berdasarkan set panjang token maksimum. Defaultnya adalah 255.

maxTokenLength?: number

Nilai Properti

number

odatatype

Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Nilai Properti

"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Detail Properti yang Diwariskan

name

Nama tokenizer. Nama hanya boleh berisi huruf, digit, spasi, garis putus-putus, atau garis bawah, hanya dapat dimulai dan diakhiri dengan karakter alfanumerik, dan dibatasi hingga 128 karakter.

name: string

Nilai Properti

string

Diwarisi DariBaseLexicalTokenizer.name

Bagikan melalui

MicrosoftLanguageStemmingTokenizer interface

Properti

Properti yang Diwariskan

Detail Properti

isSearchTokenizer

Nilai Properti

language

Nilai Properti

maxTokenLength

Nilai Properti

odatatype

Nilai Properti

Detail Properti yang Diwariskan

name

Nilai Properti

Sumber Daya Tambahan: