Apa itu kamus?
Kamus adalah sepasang dokumen selaras yang menentukan daftar frasa atau kalimat dan terjemahannya yang sesuai. Gunakan kamus dalam pelatihan Anda, saat Anda ingin Penerjemah menerjemahkan instans frasa atau kalimat sumber apa pun, menggunakan terjemahan yang Anda berikan dalam kamus. Kamus kadang-kadang disebut glosarium atau basis istilah. Anda dapat menganggap kamus sebagai brute force "salin dan ganti" untuk semua istilah yang Anda cantumkan. Selanjutnya, layanan Penerjemah Kustom Microsoft membangun dan menggunakan kamus tujuan umum sendiri untuk meningkatkan kualitas terjemahannya. Namun, kamus yang disediakan pelanggan lebih dulu dan dicari terlebih dahulu untuk mencari kata atau kalimat.
Kamus hanya berfungsi untuk proyek dalam pasangan bahasa pemrograman yang memiliki model jaringan saraf umum Microsoft yang didukung penuh di belakangnya. Lihat daftar lengkap bahasa pemrograman.
Kamus frasa
Kamus frasa peka huruf besar/kecil. Ini adalah operasi pencarian-dan-penggantian yang tepat. Saat Anda menyertakan kamus frasa dalam melatih model Anda, kata atau frasa apa pun yang tercantum akan diterjemahkan dengan cara yang Anda tentukan. Sisa kalimat diterjemahkan seperti biasa. Anda dapat menggunakan kamus frasa untuk menentukan frasa yang tidak boleh diterjemahkan dengan memberikan frasa yang belum diterjemahkan yang sama di file sumber dan target.
Kamus dinamis
Fitur kamus dinamis memungkinkan Anda menyesuaikan terjemahan untuk istilah atau frasa tertentu. Anda menentukan terjemahan kustom untuk konteks unik, bahasa, atau kebutuhan spesifik Anda.
Kamus frasa neural
Kamus frasa saraf memperluas kamus dinamis dan fitur kamus frasa standar kami. Kamus dinamis dan frasa memungkinkan Anda menyesuaikan output terjemahan dengan memberikan terjemahan Anda sendiri untuk istilah atau frasa tertentu. Fitur kamus dinamis digunakan dengan API Penerjemah sementara kamus frasa saraf diaktifkan menggunakan Penerjemah Kustom. Kamus frasa saraf meningkatkan kualitas terjemahan untuk kalimat yang mencakup satu atau beberapa terjemahan istilah dengan membiarkan model terjemahan mesin menyesuaikan istilah dan konteks. Penyesuaian ini menghasilkan terjemahan yang lebih fasih. Pada saat yang sama, ia mempertahankan akurasi terjemahan jangka tinggi.
kamus kalimat
Kamus kalimat tidak peka huruf besar/kecil. Kamus kalimat memungkinkan Anda untuk menentukan terjemahan target yang tepat untuk kalimat sumber. Agar kecocokan kamus kalimat terjadi, seluruh kalimat yang dikirimkan harus cocok dengan entri kamus sumber. Entri kamus sumber yang diakhir dengan tanda baca diabaikan selama kecocokan. Jika hanya sebagian kalimat yang cocok, entri tidak cocok. Ketika kecocokan terdeteksi, entri target kamus kalimat dikembalikan.
Pelatihan khusus kamus
Anda dapat melatih model hanya dengan menggunakan data kamus. Untuk melakukannya, pilih hanya dokumen kamus (atau beberapa dokumen kamus) yang ingin Anda sertakan dan pilih Buat model. Karena pelatihan ini hanya untuk kamus, tidak ada jumlah minimum kalimat pelatihan yang diperlukan. Model Anda biasanya menyelesaikan pelatihan lebih cepat daripada pelatihan standar. Model yang dihasilkan menggunakan model garis besar Microsoft untuk terjemahan dengan penambahan kamus yang Anda tambahkan. Anda tidak mendapatkan laporan pengujian.
Catatan
Penerjemah Kustom tidak meratakan kalimat file kamus, jadi penting bahwa ada jumlah yang sama dari frasa/kalimat sumber dan target dalam dokumen kamus Anda dan mereka diselaraskan dengan tepat.
Rekomendasi
Kamus bukanlah pengganti untuk melatih model menggunakan data pelatihan. Untuk mendapatkan hasil yang lebih baik, kami sarankan untuk membiarkan sistem belajar dari data pelatihan Anda. Namun, ketika kalimat atau kata benda majemuk harus diterjemahkan verbatim, gunakan kamus frasa.
Kamus frase harus digunakan dengan hemat. Ketika frasa dalam kalimat diganti, konteks kalimat tersebut hilang atau terbatas untuk menerjemahkan sisa kalimat. Hasilnya adalah bahwa, sementara frasa atau kata dalam kalimat diterjemahkan sesuai dengan kamus yang disediakan, kualitas terjemahan keseluruhan kalimat sering menderita.
Kamus frasa bekerja dengan baik untuk kata benda majemuk seperti nama produk ("Microsoft SQL Server"), nama yang tepat ("Kota Hamburg"), atau fitur produk ("tabel pivot"). Ini tidak berfungsi juga untuk kata kerja atau kata sifat karena, biasanya, kata-kata tersebut sangat kontekstual dalam bahasa sumber atau target. Praktik terbaik adalah menghindari entri kamus frasa untuk apa pun kecuali kata benda majemuk.
Jika Anda menggunakan kamus frasa, kapitalisasi dan tanda baca sangatlah penting. Entri kamus peka huruf besar/kecil dan tanda baca. Penerjemah Kustom hanya cocok dengan kata dan frasa dalam kalimat input yang menggunakan tanda baca dan kapitalisasi dan tanda baca yang sama persis seperti yang ditentukan dalam file kamus sumber. Selain itu, terjemahan mencerminkan kapitalisasi dan tanda baca yang disediakan dalam file kamus target.
Contoh
- Jika Anda melatih sistem bahasa Inggris-ke-Spanyol yang menggunakan kamus frasa dan Anda menentukan server SQL dalam file sumber dan Microsoft SQL Server dalam file target. Saat Anda meminta terjemahan kalimat yang berisi frasa server SQL, Penerjemah Kustom cocok dengan entri kamus dan terjemahan yang berisi Microsoft SQL Server.
- Saat Anda meminta terjemahan kalimat yang menyertakan frasa yang sama tetapi tidak cocok dengan apa yang ada di file sumber Anda, seperti sql server, sql Server, atau SQL Server, itu tidak akan mengembalikan kecocokan dari kamus Anda.
- Terjemahan mengikuti aturan bahasa target seperti yang ditentukan dalam kamus frasa Anda.
Untuk informasi selengkapnya tentang kamus frasa saraf, lihat panduan dan rekomendasi kamus saraf.
Jika Anda menggunakan kamus kalimat, tanda baca akhir kalimat diabaikan.
Contoh
- Jika kamus sumber Anda berisi "Kalimat ini berakhir dengan tanda baca!", maka setiap permintaan terjemahan yang berisi "Kalimat ini berakhir dengan tanda baca" cocok.
Kamus Anda harus berisi baris sumber yang unik. Jika baris sumber (kata, frasa, atau kalimat) muncul lebih dari sekali dalam file kamus , sistem selalu menggunakan entri terakhir yang disediakan dan mengembalikan target saat kecocokan ditemukan.
Hindari menambahkan frasa yang hanya terdiri dari angka atau kata dua atau tiga huruf, seperti akronim, dalam file kamus sumber.