Bagikan melalui


Tanya jawab umum Penerjemah Kustom

Artikel ini berisi jawaban atas pertanyaan yang sering diajukan tentang Penerjemah Kustom.

Apa saja pembatasan saat ini di Penerjemah Kustom?

Ada pembatasan dan batasan sehubungan dengan ukuran file, pelatihan model, dan penyebaran model. Ingat pembatasan ini saat menyiapkan pelatihan Anda untuk membangun model di Penerjemah Kustom.

  • File untuk terjemahan harus berukuran kurang dari 100 MB.
  • Data monolingual tidak didukung. File ekabahasa memiliki satu bahasa yang tidak dipasangkan dengan file lain dari bahasa yang berbeda.

Kapan saya harus meminta penyebaran untuk sistem terjemahan terlatih?

Mungkin perlu beberapa pelatihan untuk membuat sistem terjemahan yang optimal untuk proyek Anda. Anda mungkin ingin mencoba menggunakan lebih banyak data pelatihan atau data yang difilter dengan lebih hati-hati, jika BLEU skor dan/ atau hasil pengujian tidak memuaskan. Anda harus berlaku ketat dan hati-hati dalam merancang set penyetelan dan set pengujian Anda. Pastikan set Anda sepenuhnya mewakili terminologi dan gaya bahan yang ingin Anda terjemahkan. Anda bisa lebih bebas dalam menyusun data pelatihan Anda, dan bereksperimen dengan opsi yang berbeda. Minta penyebaran sistem saat terjemahan dalam hasil pengujian sistem Anda memuaskan dan Anda tidak memiliki lebih banyak data untuk ditambahkan untuk meningkatkan sistem terlatih Anda.

Berapa banyak sistem terlatih yang dapat digunakan dalam satu proyek?

Hanya satu sistem terlatih yang dapat digunakan per proyek. Mungkin perlu beberapa pelatihan untuk membuat sistem terjemahan yang sesuai untuk proyek Anda dan kami mendorong Anda untuk meminta penyebaran pelatihan yang memberi Anda hasil terbaik. Anda dapat menentukan kualitas pelatihan dengan BLEU skor (lebih tinggi lebih baik), dan dengan berkonsultasi dengan peninjau sebelum memutuskan bahwa kualitas terjemahan cocok untuk penyebaran.

Kapan saya dapat mengharapkan pelatihan saya disebarkan?

Penyebaran umumnya memakan waktu kurang dari satu jam.

Bagaimana Anda mengakses sistem yang diterapkan?

Sistem yang disebarkan dapat diakses melalui Microsoft Translator Text API V3 dengan menentukan CategoryID. Informasi selengkapnya tentang Translator Text API dapat ditemukan di halaman web Referensi API.

Bagaimana cara melewati penyelarasan dan pemecahan kalimat jika data saya sudah diratakan dengan kalimat?

Penerjemah Kustom melewati perataan kalimat dan pemecahan kalimat untuk TMX file dan untuk file teks dengan .align ekstensi. File .align memberi pengguna opsi untuk melewati proses pemecahan kalimat dan penyelarasan kalimat Penerjemah Kustom untuk file yang diratakan dengan sempurna, dan tidak perlu diproses lebih lanjut. Sebaiknya .align gunakan ekstensi hanya untuk file yang diratakan dengan sempurna.

Jika jumlah kalimat yang diekstrak tidak cocok dengan dua file dengan nama dasar yang sama, Penerjemah Kustom menjalankan perataan kalimat pada .align file.

Saya mencoba mengunggah file Translation Memory Exchange (TMX) saya, tetapi bertuliskan "pemrosesan dokumen gagal"

Pastikan TMX sesuai dengan Spesifikasi TMX 1.4b.

Langkah berikutnya