Analisis Sentimen dan dukungan bahasa Penggalian Opini

Gunakan artikel ini untuk mempelajari bahasa mana yang didukung oleh Analisis Sentimen dan Pengumpulan Opini. Kontainer API dan Docker berbasis cloud mendukung bahasa yang sama.

Dukungan bahasa Analisis Sentimen

Total kode bahasa yang didukung: 94

Bahasa Kode bahasa Catatan
Afrika af
Albania sq
Amharik am
Arab ar
Armenia hy
Assam as
Azerbaijani az
Basque eu
Belarusia (baru) be
Bengali bn
Bosnia bs
Breton (baru) br
Bulgaria bg
Birma my
Katalan ca
Tionghoa (Aksara Sederhana) zh-hans zh juga diterima
Tionghoa (Aksara Tradisional) zh-hant
Kroasia hr
Cheska cs
Dansk da
Belanda nl
Inggris en
Esperanto (baru) eo
Esti et
Filipino fil
Suomi fi
Prancis fr
Galisia gl
Georgia ka
Jerman de
Yunani el
Gujarat gu
Hausa (baru) ha
Ibrani he
Hindi hi
Hungaria hu
Indonesia id
Irlandia ga
Italia it
Jepang ja
Jawa (baru) jv
Kannada kn
Kazakh kk
Khmer km
Korea ko
Kurdi (Kurmanji) ku
Kyrgyz ky
Laos lo
Latin (baru) la
Latvi lv
Lituavi lt
Makedonia mk
Malagasi mg
Melayu ms
Malayalam ml
Marathi mr
Mongolia mn
Nepal ne
Norwegia no
Odia or
Oromo (baru) om
Pashto ps
Farsi fa
Polski pl
Portugis (Portugal) pt-PT pt juga diterima
Portugis (Brasil) pt-BR
Punjabi pa
Rumania ro
Rusia ru
Sanskerta (baru) sa
Gaelik Skotlandia (baru) gd
Serbia sr
Sindhi (baru) sd
Sinhala (baru) si
Slovak sk
Sloven sl
Somali so
Spanyol es
Sunda (baru) su
Swahili sw
Swedia sv
Tamil ta
Telugu te
Thailand th
Turki tr
Ukraina uk
Urdu ur
Uyghur ug
Uzbek uz
Vietnam vi
Wales cy
Frisian Barat (baru) fy
Xhosa (baru) xh
Yiddish (baru) yi

Dukungan bahasa Penggalian Opini

Total kode bahasa yang didukung: 94

Bahasa Kode bahasa Catatan
Afrikaans (baru) af
Albania (baru) sq
Amharik (baru) am
Arab ar
Armenia (baru) hy
Assamese (baru) as
Azerbaijan (baru) az
Basque (baru) eu
Belarusia (baru) be
Bengali bn
Bosnia (baru) bs
Breton (baru) br
Bulgaria (baru) bg
Burma (baru) my
Katala (baru) ca
Tionghoa (Aksara Sederhana) zh-hans zh juga diterima
Bahasa Tionghoa (Tradisional) (baru) zh-hant
Kroasia (baru) hr
Ceko (baru) cs
Dansk da
Belanda nl
Inggris en
Esperanto (baru) eo
Estonia (baru) et
Filipino (baru) fil
Suomi fi
Prancis fr
Galisia (baru) gl
Georgian (baru) ka
Jerman de
Yunani el
Gujarati (baru) gu
Hausa (baru) ha
Ibrani (baru) he
Hindi hi
Hungaria hu
Indonesia id
Irlandia (baru) ga
Italia it
Jepang ja
Jawa (baru) jv
Kannada (baru) kn
Kazakh (baru) kk
Khmer (baru) km
Korea ko
Kurdi (Kurmanji) ku
Kyrgyz (baru) ky
Lao (baru) lo
Latin (baru) la
Latvia (baru) lv
Lituania (baru) lt
Makedonia (baru) mk
Malagasy (baru) mg
Melayu (baru) ms
Malayalam (baru) ml
Marathi mr
Mongolia (baru) mn
Nepal (baru) ne
Norwegia no
Odia (baru) or
Oromo (baru) om
Pashto (baru) ps
Persia (baru) fa
Polski pl
Portugis (Portugal) pt-PT pt juga diterima
Portugis (Brasil) pt-BR
Punjabi (baru) pa
Rumania (baru) ro
Rusia ru
Sanskerta (baru) sa
Gaelik Skotlandia (baru) gd
Serbia (baru) sr
Sindhi (baru) sd
Sinhala (baru) si
Slowakia (baru) sk
Slovenia (baru) sl
Somali (baru) so
Spanyol es
Sunda (baru) su
Swahili (baru) sw
Swedia sv
Tamil ta
Telugu te
Thai (baru) th
Turki tr
Ukraina (baru) uk
Urdu (baru) ur
Uyghur (baru) ug
Uzbek (baru) uz
Vietnam (baru) vi
Welsh (baru) cy
Frisian Barat (baru) fy
Xhosa (baru) xh
Yiddish (baru) yi

Opsi multibahasa (Hanya analisis sentimen kustom)

Dengan Analisis sentimen kustom, Anda dapat melatih model dalam satu bahasa dan menggunakan untuk mengklasifikasikan dokumen dalam bahasa lain. Fitur ini berguna karena membantu menghemat waktu dan usaha. Alih-alih membangun proyek terpisah untuk setiap bahasa, Anda dapat menangani set data multibahasa dalam satu proyek. Himpunan data Anda tidak harus sepenuhnya dalam bahasa yang sama tetapi Anda harus mengaktifkan opsi multibahasa untuk proyek Anda saat membuat atau nanti di pengaturan proyek. Jika Anda melihat model Anda berperforma buruk dalam bahasa tertentu selama proses evaluasi, pertimbangkan untuk menambahkan lebih banyak data dalam bahasa ini ke set pelatihan Anda.

Anda dapat melatih proyek Anda sepenuhnya dengan dokumen bahasa Inggris, dan menanyakannya dalam bahasa: Prancis, Jerman, Mandarin, Jepang, Korea, dan lainnya. Analisis sentimen kustom memudahkan Anda untuk menskalakan proyek Anda ke beberapa bahasa dengan menggunakan teknologi multibahasa untuk melatih model Anda.

Setiap kali Anda mengidentifikasi bahwa bahasa tertentu tidak berperforma sebaik bahasa lain, Anda dapat menambahkan lebih banyak dokumen untuk bahasa itu di proyek Anda.

Anda tidak diharapkan untuk menambahkan jumlah dokumen yang sama untuk setiap bahasa. Anda harus membangun sebagian besar proyek Anda dalam satu bahasa, dan hanya menambahkan beberapa dokumen dalam bahasa yang Anda amati tidak berperforma baik. Jika Anda membuat proyek yang terutama dalam bahasa Inggris, dan mulai mengujinya dalam bahasa Prancis, Jerman, dan Spanyol, Anda mungkin mengamati bahwa bahasa Jerman tidak memiliki performa sebaik dua bahasa lainnya. Dalam hal ini, pertimbangkan untuk menambahkan 5% dari dokumen asli bahasa Inggris Anda dalam bahasa Jerman, latih model baru dan uji dalam bahasa Jerman lagi. Seharusnya hasilnya menjadi lebih baik untuk kueri Jerman. Semakin banyak dokumen berlabel yang Anda tambahkan, semakin besar kemungkinan hasilnya akan menjadi lebih baik.

Ketika Anda menambahkan data dalam bahasa lain, Anda seharusnya tidak mengharapkannya berdampak negatif terhadap bahasa lain.

Langkah berikutnya