Bagikan melalui


Uji model Anda

Setelah model Anda berhasil dilatih, Anda dapat menggunakan terjemahan untuk mengevaluasi kualitas model Anda. Untuk membuat keputusan yang tepat tentang apakah akan menggunakan model standar kami atau model kustom Anda, Anda harus mengevaluasi delta antara skor BLEU model kustom Anda dan Baseline BLEU model standar kami. Jika model Anda dilatih dalam domain sempit, dan data pelatihan Anda konsisten dengan data pengujian, Anda dapat mengharapkan skor BLEU yang tinggi.

Skor BLEU

BLEU (Bilingual Evaluation Understudy) adalah algoritma untuk mengevaluasi presisi atau akurasi teks yang diterjemahkan mesin dari satu bahasa ke bahasa lain. Penerjemah Kustom menggunakan metrik BLEU sebagai salah satu cara untuk menyampaikan akurasi terjemahan.

Skor BLEU adalah angka antara nol dan 100. Skor nol menunjukkan terjemahan berkualitas rendah yaitu tidak ada yang cocok dalam terjemahan dengan referensi. Skor 100 menunjukkan terjemahan sempurna yang identik dengan referensi. Tidak perlu mencapai skor 100 — skor BLEU antara 40 dan 60 menunjukkan terjemahan berkualitas tinggi.

Baca selengkapnya

Detail model

  1. Pilih bilah Detail model.

  2. Pilih nama model. Tinjau tanggal/waktu pelatihan, total waktu pelatihan, jumlah kalimat yang digunakan untuk pelatihan, penyetelan, pengujian, dan kamus. Periksa apakah sistem menghasilkan set pengujian dan penyetelan. Category ID Gunakan untuk membuat permintaan terjemahan.

  3. Evaluasi skor BLEU model. Tinjau set pengujian: skor BLEU adalah skor model kustom dan Baseline BLEU adalah model dasar yang telah dilatih sebelumnya yang digunakan untuk penyesuaian. Skor BLEU yang lebih tinggi berarti ada kualitas terjemahan tinggi menggunakan model kustom.

    Cuplikan layar yang mengilustrasikan detail model.

Menguji kualitas terjemahan model Anda

  1. Pilih bilah Model pengujian.

  2. Pilih Nama model.

  3. Manusia mengevaluasi terjemahan dari model Kustom Anda dan model Garis Besar (garis besar yang telah dilatih sebelumnya digunakan untuk penyesuaian) terhadap Referensi (terjemahan target dari set pengujian).

  4. Jika hasil pelatihan memuaskan, tempatkan permintaan penyebaran untuk model terlatih.

Langkah berikutnya