Bagikan melalui


Membangun serta mengelola dokumen pelatihan

Penerjemah Kustom memungkinkan Anda untuk membangun model terjemahan yang mencerminkan bisnis, industri, dan terminologi dan gaya khusus domain Anda. Melatih dan menyebarkan model kustom itu mudah dan tidak memerlukan keterampilan pemrograman apa pun. Penerjemah Kustom memungkinkan Anda mengunggah file paralel, file memori terjemahan, atau file zip.

Dokumen paralel adalah pasangan dokumen yang salah satu dokumennya (target) adalah terjemahan dari yang lain (sumber). Satu dokumen dalam pasangan dokumen berisi kalimat dalam bahasa sumber dan dokumen lainnya berisi kalimat-kalimat yang diterjemahkan ke bahasa target.

Sebelum mengunggah dokumen Anda, tinjau format dokumen dan panduan konvensi penamaan untuk memastikan Penerjemah Kustom mendukung format file Anda.

Cara membuat set dokumen

Menemukan data kualitas dalam domain sering kali merupakan tugas yang menantang yang bervariasi berdasarkan klasifikasi pengguna. Berikut adalah beberapa pertanyaan yang dapat Anda tanyakan pada diri sendiri saat Anda mengevaluasi data apa yang mungkin tersedia untuk Anda:

  • Apakah perusahaan Anda memiliki data terjemahan sebelumnya yang tersedia yang dapat Anda gunakan? Perusahaan sering memiliki banyak data terjemahan yang terakumulasi selama bertahun-tahun menggunakan terjemahan manusia.

  • Apakah Anda memiliki sejumlah besar data monolingual? Data monolingual adalah data hanya dalam satu bahasa. Jika demikian, bisakah Anda mendapatkan terjemahan untuk data ini?

  • Bisakah Anda menjelajahi portal online untuk mengumpulkan kalimat sumber dan mensintesis kalimat target?

Materi pelatihan untuk setiap jenis dokumen

Sumber Apa fungsinya Aturan yang harus diikuti
Dokumen pelatihan bilingual Mengajarkan sistem terminologi dan gaya Anda. Jadilah liberal. Terjemahan manusia dalam domain lebih baik daripada terjemahan mesin. Tambahkan dan hapus dokumen saat Anda pergi dan coba tingkatkan BLEU skor.
Menyetel dokumen Melatih parameter Terjemahan Mesin Neural. Jadilah ketat. Tulis mereka untuk secara optimal mewakili apa yang akan Anda terjemahkan di masa depan.
Dokumen pengujian Hitung skor.BLEU Jadilah ketat. Tulis dokumen pengujian agar secara optimal mewakili apa yang Anda rencanakan untuk diterjemahkan di masa mendatang.
Kamus frasa Memaksa terjemahan yang diberikan 100% dari waktu. Jadilah membatasi. Kamus frasa peka huruf besar/kecil dan kata atau frasa apa pun yang tercantum diterjemahkan dengan cara yang Anda tentukan. Dalam banyak kasus, lebih baik tidak menggunakan kamus frasa dan membiarkan sistem belajar.
kamus kalimat Memaksa terjemahan yang diberikan 100% dari waktu. Jadilah ketat. Kamus kalimat tidak peka huruf besar/kecil dan baik untuk umum dalam kalimat pendek domain. Agar kecocokan kamus kalimat terjadi, seluruh kalimat yang dikirimkan harus cocok dengan entri kamus sumber. Jika hanya sebagian kalimat yang cocok, entri tidak cocok.

Cara mengunggah dokumen

Jenis dokumen dikaitkan dengan pasangan bahasa yang dipilih saat Anda membuat proyek.

  1. Masuk ke portal Penerjemah Kustom. Ruang kerja default Anda dimuat dan daftar proyek yang dibuat sebelumnya ditampilkan.

  2. Pilih Nama proyek yang diinginkan. Secara default, bilah Kelola dokumen dipilih dan daftar dokumen yang diunggah sebelumnya ditampilkan.

  3. Pilih Tambahkan set dokumen dan pilih jenis dokumen:

    • Set pelatihan
    • Set pengujian
    • Set penyetelan
    • Kumpulan kamus:
      • Kamus Frasa
      • Kamus Kalimat
  4. Pilih Selanjutnya.

    Cuplikan layar yang mengilustrasikan tautan unggahan dokumen.

    Catatan

    Memilih set Kamus meluncurkan dialog Pilih jenis kamus. Pilih salah satu dan pilih Berikutnya

  5. Pilih format dokumen Anda dari tombol radio.

    Cuplikan layar yang mengilustrasikan halaman unggahan dokumen.

    • Untuk dokumen Paralel, isi Document set name dan pilih Telusuri file untuk memilih dokumen sumber dan target.
    • Untuk file Memori terjemahan (TM) atau Unggah beberapa set dengan ZIP, pilih Telusuri file untuk memilih file
  6. Pilih Unggah.

Pada titik ini, Penerjemah Kustom sedang memproses dokumen Anda dan mencoba mengekstrak kalimat seperti yang ditunjukkan dalam pemberitahuan pengunggahan. Setelah selesai diproses, Anda akan melihat pemberitahuan pengunggahan berhasil.

Cuplikan layar yang mengilustrasikan jendela dialog pemrosesan dokumen unggahan.

Lihat riwayat unggahan

Di halaman ruang kerja Anda dapat melihat riwayat semua detail unggahan dokumen seperti jenis dokumen, pasangan bahasa, status unggahan, dll.

  1. Tab riwayat unggahan memperlihatkan riwayat dari halaman ruang kerja portal Penerjemah Kustom.

    Cuplikan layar memperlihatkan tab riwayat unggahan.

  2. Halaman ini menunjukkan status semua unggahan Anda sebelumnya. Hal ini menampilkan unggahan dari yang terbaru hingga yang terbaru. Setiap status unggahan memperlihatkan nama dokumen, dibuat oleh, status unggahan, tanggal unggahan, jumlah file yang diunggah, jenis file yang diunggah, dan pasangan bahasa. Anda dapat menggunakan filter untuk menemukan dokumen dengan cepat berdasarkan nama, status, bahasa, dan rentang tanggal.

    Cuplikan layar memperlihatkan halaman riwayat unggahan.

  3. Halaman detail riwayat unggahan menunjukkan file yang diunggah sebagai bagian dari status file yang diunggah, bahasa file, dan pesan kesalahan (jika ada kesalahan dalam unggahan).

Langkah berikutnya