Tanya jawab umum Penerjemah Kustom

Artikel ini berisi jawaban atas pertanyaan yang sering diajukan tentang Penerjemah Kustom.

Apa saja pembatasan saat ini di Penerjemah Kustom?

Ada pembatasan dan batasan sehubungan dengan ukuran file, pelatihan model, dan penyebaran model. Ingat pembatasan ini saat menyiapkan pelatihan Anda untuk membangun model di Penerjemah Kustom.

  • File yang dikirim harus berukuran kurang dari 100 MB.
  • Data monolingual tidak didukung.

Kapan saya harus meminta penyebaran untuk sistem penerjemahan yang telah dilatih?

Mungkin perlu beberapa pelatihan untuk membuat sistem terjemahan yang optimal untuk proyek Anda. Anda mungkin ingin mencoba menggunakan lebih banyak data pelatihan atau data yang difilter dengan lebih hati-hati, jika skor BLEU dan/atau hasil pengujian tidak memuaskan. Anda harus berlaku ketat dan hati-hati dalam merancang set penyetelan dan set pengujian Anda. Pastikan set Anda sepenuhnya mewakili terminologi dan gaya bahan yang ingin Anda terjemahkan. Anda bisa lebih bebas dalam menyusun data pelatihan Anda, dan bereksperimen dengan opsi yang berbeda. Minta penyebaran sistem saat Anda puas dengan terjemahan dalam hasil pengujian sistem Anda dan jangan tambahkan data ke pelatihan lagi untuk meningkatkan sistem terlatih Anda.

Berapa banyak sistem terlatih yang dapat digunakan dalam satu proyek?

Hanya satu sistem terlatih yang dapat digunakan per proyek. Mungkin perlu beberapa pelatihan untuk membuat sistem terjemahan yang sesuai untuk proyek Anda dan kami mendorong Anda untuk meminta penyebaran pelatihan yang memberi Anda hasil terbaik. Anda dapat menentukan kualitas pelatihan dengan skor BLEU (lebih tinggi lebih baik), dan melalui konsultasi dengan pengulas sebelum memutuskan kualitas terjemahan cocok untuk penyebaran.

Kapan saya dapat mengharapkan pelatihan saya disebarkan?

Penyebaran umumnya memakan waktu kurang dari satu jam.

Bagaimana Anda mengakses sistem yang diterapkan?

Sistem yang disebarkan dapat diakses melalui Microsoft Translator Text API V3 dengan menentukan CategoryID. Informasi selengkapnya tentang Translator Text API dapat ditemukan di halaman web Referensi API.

Bagaimana cara melewati penyelarasan dan pemecahan kalimat jika data saya sudah diratakan dengan kalimat?

Penerjemah Kustom melewati penyelarasan kalimat dan pemecahan kalimat untuk file TMX dan untuk file teks dengan ekstensi .align. File .align memberi pengguna opsi untuk melewati proses pemecahan kalimat dan penyelarasan kalimat Penerjemah Kustom untuk file yang diratakan dengan sempurna, dan tidak perlu diproses lebih lanjut. Sebaiknya .align gunakan ekstensi hanya untuk file yang diratakan dengan sempurna.

Jika jumlah kalimat yang diekstrak tidak cocok dengan dua file dengan nama dasar yang sama, Penerjemah Kustom akan tetap menjalankan penyelaras kalimat pada file .align.

Saya mencoba mengunggah TMX, tetapi "pemrosesan dokumen gagal" muncul

Pastikan TMX sesuai dengan Spesifikasi TMX 1.4b.

Langkah berikutnya