Membangun serta mengelola dokumen pelatihan
Penerjemah Kustom memungkinkan Anda untuk membangun model terjemahan yang mencerminkan bisnis, industri, dan terminologi dan gaya khusus domain Anda. Melatih dan menyebarkan model kustom itu mudah dan tidak memerlukan keterampilan pemrograman apa pun. Penerjemah Kustom memungkinkan Anda mengunggah file paralel, file memori terjemahan, atau file zip.
Dokumen paralel adalah pasangan dokumen yang salah satu dokumennya (target) adalah terjemahan dari yang lain (sumber). Satu dokumen dalam pasangan dokumen berisi kalimat dalam bahasa sumber dan dokumen lainnya berisi kalimat-kalimat yang diterjemahkan ke bahasa target.
Sebelum mengunggah dokumen Anda, tinjau format dokumen dan panduan konvensi penamaan untuk memastikan Penerjemah Kustom mendukung format file Anda.
Cara membuat set dokumen
Menemukan data kualitas dalam domain sering kali merupakan tugas yang menantang yang bervariasi berdasarkan klasifikasi pengguna. Berikut adalah beberapa pertanyaan yang dapat Anda tanyakan pada diri sendiri saat Anda mengevaluasi data apa yang mungkin tersedia untuk Anda:
Apakah perusahaan Anda memiliki data terjemahan sebelumnya yang tersedia yang dapat Anda gunakan? Perusahaan sering memiliki banyak data terjemahan yang terakumulasi selama bertahun-tahun menggunakan terjemahan manusia.
Apakah Anda memiliki sejumlah besar data monolingual? Data monolingual adalah data hanya dalam satu bahasa. Jika demikian, bisakah Anda mendapatkan terjemahan untuk data ini?
Bisakah Anda menjelajahi portal online untuk mengumpulkan kalimat sumber dan mensintesis kalimat target?
Materi pelatihan untuk setiap jenis dokumen
Sumber | Apa fungsinya | Aturan yang harus diikuti |
---|---|---|
Dokumen pelatihan bilingual | Mengajarkan sistem terminologi dan gaya Anda. | Jadilah liberal. Terjemahan manusia dalam domain lebih baik daripada terjemahan mesin. Tambahkan dan hapus dokumen saat Anda pergi dan coba tingkatkan BLEU skor. |
Menyetel dokumen | Melatih parameter Terjemahan Mesin Neural. | Jadilah ketat. Tulis mereka untuk secara optimal mewakili apa yang akan Anda terjemahkan di masa depan. |
Dokumen pengujian | Hitung skor.BLEU |
Jadilah ketat. Tulis dokumen pengujian agar secara optimal mewakili apa yang Anda rencanakan untuk diterjemahkan di masa mendatang. |
Kamus frasa | Memaksa terjemahan yang diberikan 100% dari waktu. | Jadilah membatasi. Kamus frasa peka huruf besar/kecil dan kata atau frasa apa pun yang tercantum diterjemahkan dengan cara yang Anda tentukan. Dalam banyak kasus, lebih baik tidak menggunakan kamus frasa dan membiarkan sistem belajar. |
kamus kalimat | Memaksa terjemahan yang diberikan 100% dari waktu. | Jadilah ketat. Kamus kalimat tidak peka huruf besar/kecil dan baik untuk umum dalam kalimat pendek domain. Agar kecocokan kamus kalimat terjadi, seluruh kalimat yang dikirimkan harus cocok dengan entri kamus sumber. Jika hanya sebagian kalimat yang cocok, entri tidak cocok. |
Cara mengunggah dokumen
Jenis dokumen dikaitkan dengan pasangan bahasa yang dipilih saat Anda membuat proyek.
Masuk ke portal Penerjemah Kustom. Ruang kerja default Anda dimuat dan daftar proyek yang dibuat sebelumnya ditampilkan.
Pilih Nama proyek yang diinginkan. Secara default, bilah Kelola dokumen dipilih dan daftar dokumen yang diunggah sebelumnya ditampilkan.
Pilih Tambahkan set dokumen dan pilih jenis dokumen:
- Set pelatihan
- Set pengujian
- Set penyetelan
- Kumpulan kamus:
- Kamus Frasa
- Kamus Kalimat
Pilih Selanjutnya.
Catatan
Memilih set Kamus meluncurkan dialog Pilih jenis kamus. Pilih salah satu dan pilih Berikutnya
Pilih format dokumen Anda dari tombol radio.
- Untuk dokumen Paralel, isi
Document set name
dan pilih Telusuri file untuk memilih dokumen sumber dan target. - Untuk file Memori terjemahan (TM) atau Unggah beberapa set dengan ZIP, pilih Telusuri file untuk memilih file
- Untuk dokumen Paralel, isi
Pilih Unggah.
Pada titik ini, Penerjemah Kustom sedang memproses dokumen Anda dan mencoba mengekstrak kalimat seperti yang ditunjukkan dalam pemberitahuan pengunggahan. Setelah selesai diproses, Anda akan melihat pemberitahuan pengunggahan berhasil.
Lihat riwayat unggahan
Di halaman ruang kerja Anda dapat melihat riwayat semua detail unggahan dokumen seperti jenis dokumen, pasangan bahasa, status unggahan, dll.
Tab riwayat unggahan memperlihatkan riwayat dari halaman ruang kerja portal Penerjemah Kustom.
Halaman ini menunjukkan status semua unggahan Anda sebelumnya. Hal ini menampilkan unggahan dari yang terbaru hingga yang terbaru. Setiap status unggahan memperlihatkan nama dokumen, dibuat oleh, status unggahan, tanggal unggahan, jumlah file yang diunggah, jenis file yang diunggah, dan pasangan bahasa. Anda dapat menggunakan filter untuk menemukan dokumen dengan cepat berdasarkan nama, status, bahasa, dan rentang tanggal.
Halaman detail riwayat unggahan menunjukkan file yang diunggah sebagai bagian dari status file yang diunggah, bahasa file, dan pesan kesalahan (jika ada kesalahan dalam unggahan).
Langkah berikutnya
- Pelajari cara melatih model.
- Pelajari cara menguji dan mengevaluasi kualitas model.
- Pelajari cara menerbitkan model.
- Pelajari cara menerjemahkan dengan model kustom.