Dukungan bahasa untuk pemahaman bahasa percakapan
Gunakan artikel ini untuk mempelajari tentang berbagai bahasa yang saat ini didukung oleh fitur CLU.
Opsi multibahasa
Tip
Lihat Cara melatih seorang model untuk informasi tentang mode pelatihan mana yang harus Anda gunakan untuk proyek multibahasa.
Dengan menggunakan CLU, Anda dapat melatih seorang model dalam satu bahasa dan menggunakan untuk memprediksi niat dan entitas dari ucapan dalam bahasa lain. Fitur ini sangat kuat karena membantu menghemat waktu dan usaha. Alih-alih membangun proyek terpisah untuk setiap bahasa, Anda dapat menangani set data multibahasa dalam satu proyek. Himpunan data Anda tidak harus sepenuhnya dalam bahasa yang sama tetapi Anda harus mengaktifkan opsi multibahasa untuk proyek Anda saat membuat atau nanti di pengaturan proyek. Jika Anda melihat model Anda berperforma buruk dalam bahasa tertentu selama proses evaluasi, pertimbangkan untuk menambahkan lebih banyak data dalam bahasa ini ke set pelatihan Anda.
Anda dapat melatih proyek Anda sepenuhnya dengan ucapan bahasa Inggris, dan permintaan di: Bahasa Prancis, Jerman, Mandarin, Jepang, Korea, dan lainnya. Pemahaman bahasa percakapan memudahkan Anda untuk menskalakan proyek Anda ke berbagai bahasa dengan menggunakan teknologi multibahasa untuk melatih model Anda.
Setiap kali Anda mengidentifikasi bahwa bahasa tertentu tidak berkinerja sebaik bahasa lain, Anda dapat menambahkan ucapan untuk bahasa itu dalam proyek Anda. Di halaman ucapan tag di Studio Bahasa, Anda dapat memilih bahasa ucapan yang Anda tambahkan. Ketika Anda memperkenalkan contoh untuk bahasa itu ke model, model itu mengenal lebih banyak sintaks dalam bahasa itu, dan belajar untuk memprediksinya dengan lebih baik.
Anda tidak diharapkan untuk menambahkan jumlah ucapan yang sama untuk setiap bahasa komputer. Anda harus membangun sebagian besar proyek Anda dalam satu bahasa, dan hanya menambahkan beberapa ucapan dalam bahasa yang Anda amati tidak berperforma baik. Jika Anda membuat proyek yang terutama dalam bahasa Inggris, dan mulai mengujinya dalam bahasa Prancis, Jerman, dan Spanyol, Anda mungkin mengamati bahwa bahasa Jerman tidak memiliki performa sebaik dua bahasa lainnya. Dalam hal ini, pertimbangkan untuk menambahkan 5% dari contoh bahasa Inggris asli Anda dalam bahasa Jerman, latih model baru dan uji dalam bahasa Jerman lagi. Seharusnya hasilnya menjadi lebih baik untuk kueri Jerman. Semakin banyak ucapan yang Anda tambahkan, semakin besar kemungkinan hasilnya akan menjadi lebih baik.
Ketika Anda menambahkan data dalam bahasa lain, Anda seharusnya tidak mengharapkannya berdampak negatif terhadap bahasa lain.
Daftar dan komponen bawaan dalam berbagai bahasa
Proyek dengan beberapa bahasa diaktifkan akan memungkinkan Anda untuk menentukan sinonim per bahasa untuk setiap kunci daftar. Bergantung pada bahasa yang Anda minta untuk proyek Anda, Anda hanya akan mendapatkan kecocokan untuk komponen daftar dengan sinonim dari bahasa itu. Saat Anda mengkueri proyek Anda, Anda dapat menentukan bahasa di isi permintaan:
"query": "{query}"
"language": "{language code}"
Jika Anda tidak memberikan bahasa, maka akan kembali ke bahasa default proyek Anda.
Komponen bawaan serupa, di mana Anda harus berharap untuk mendapatkan prediksi untuk komponen bawaan yang tersedia dalam bahasa tertentu. Bahasa permintaan kembali menentukan komponen mana yang mencoba diprediksi.
Bahasa yang didukung oleh CLU
CLU mendukung ucapan dalam bahasa berikut:
Bahasa | Kode bahasa |
---|---|
Afrikaans | af |
Amharik | am |
Arab | ar |
Assam | as |
Azerbaijani | az |
Belarusia | be |
Bulgaria | bg |
Bengali | bn |
Breton | br |
Bosnia | bs |
Katalan | ca |
Cheska | cs |
Wales | cy |
Dansk | da |
Jerman | de |
Yunani | el |
Inggris (US) | en-us |
Bahasa Inggris (UK) | en-gb |
Esperanto | eo |
Spanyol | es |
Esti | et |
Basque | eu |
Persia | fa |
Suomi | fi |
Prancis | fr |
Frisia Barat | fy |
Irlandia | ga |
Gaelik Skotlandia | gd |
Galisia | gl |
Gujarat | gu |
Hausa | ha |
Ibrani | he |
Hindi | hi |
Kroasia | hr |
Hungaria | hu |
Armenia | hy |
Indonesia | id |
Italia | it |
Jepang | ja |
Jawa | jv |
Georgia | ka |
Kazakh | kk |
Khmer | km |
Kannada | kn |
Korea | ko |
Kurdi (Kurmanji) | ku |
Kirgiz | ky |
Latin | la |
Laos | lo |
Lituavi | lt |
Latvi | lv |
Malagasi | mg |
Makedonia | mk |
Malayalam | ml |
Mongolia | mn |
Marathi | mr |
Melayu | ms |
Birma | my |
Nepal | ne |
Belanda | nl |
Norwegia (Bokmal) | nb |
Odia | or |
Punjabi | pa |
Polski | pl |
Pashto | ps |
Portugis (Brasil) | pt-br |
Portugis (Portugal) | pt-pt |
Rumania | ro |
Rusia | ru |
Sanskrit | sa |
Sindhi | sd |
Sinhala | si |
Slovak | sk |
Sloven | sl |
Somali | so |
Albania | sq |
Serbia | sr |
Sunda | su |
Swedia | sv |
Swahili | sw |
Tamil | ta |
Telugu | te |
Thailand | th |
Filipino | tl |
Turki | tr |
Uyghur | ug |
Ukraina | uk |
Urdu | ur |
Uzbek | uz |
Vietnam | vi |
Xhosa | xh |
Yiddi | yi |
Tionghoa (Aksara Sederhana) | zh-hans |
Tionghoa (Aksara Tradisional) | zh-hant |
Zulu | zu |