Bagikan melalui


Apa itu terjemahan Dokumen?

Terjemahan dokumen adalah fitur terjemahan mesin berbasis cloud dari layanan Penerjemah Azure AI . Anda dapat menerjemahkan dokumen yang banyak dan kompleks ke semua bahasa dan dialek yang didukung dengan tetap mempertahankan struktur dokumen asli dan format data. API Terjemahan Dokumen mendukung dua proses terjemahan:

  • Terjemahan batch asinkron mendukung pemrosesan beberapa dokumen dan file besar. Proses terjemahan batch memerlukan akun penyimpanan Azure Blob dengan kontainer penyimpanan untuk sumber dan dokumen yang diterjemahkan.

  • File tunggal sinkron mendukung pemrosesan terjemahan file tunggal. Proses terjemahan file tidak memerlukan akun penyimpanan Azure Blob. Respons akhir berisi dokumen yang diterjemahkan dan dikembalikan langsung ke klien panggilan.

Terjemahan kelompok asinkron

Gunakan pemrosesan dokumen asinkron untuk menerjemahkan beberapa dokumen dan file besar.

Fitur utama batch

Fitur Deskripsi
Menerjemahkan file berukuran besar Terjemahkan seluruh dokumen secara asinkron.
Menerjemahkan banyak file Menerjemahkan beberapa file di semua bahasa dan dialek yang didukung sambil mempertahankan struktur dokumen dan format data.
Terjemahkan teks yang disematkan dalam gambar dalam dokumen 🆕 . Fitur ini tersedia dengan API terjemahan dokumen batch untuk .docx format file.
Mempertahankan presentasi file sumber Terjemahkan file sambil mempertahankan tata letak dan format asli.
Menerapkan terjemahan kustom Terjemahkan dokumen menggunakan model terjemahan umum dan terjemahan kustom.
Menerapkan glosarium kustom Terjemahkan dokumen menggunakan glosarium kustom.
Mendeteksi bahasa dokumen secara otomatis Biarkan layanan terjemahan Dokumen menentukan bahasa dokumen.
Menerjemahkan dokumen dengan konten dalam beberapa bahasa Gunakan fitur deteksi otomatis untuk menerjemahkan dokumen dengan konten yang terdiri dari beberapa bahasa ke dalam bahasa target Anda.

Pilihan pengembangan batch

Anda dapat menambahkan terjemahan Dokumen ke aplikasi Anda menggunakan REST API atau SDK pustaka klien:

  • REST API. adalah antarmuka yang tidak bergantung pada bahasa yang memungkinkan Anda untuk membuat permintaan HTTP dan header otorisasi untuk menerjemahkan dokumen.

  • SDK pustaka klien adalah kelas, objek, metode, serta kode khusus bahasa yang dapat Anda gunakan dengan cepat dengan menambahkan referensi dalam proyek Anda. Saat ini Terjemahan dokumen memiliki dukungan bahasa pemrograman untuk C#/.NET dan Python.

Format dokumen yang didukung oleh batch

Metode Dapatkan format dokumen yang didukung mengembalikan daftar format dokumen yang didukung oleh layanan Terjemahan dokumen. Daftar ini mencakup ekstensi file umum, dan jenis konten jika menggunakan API pengunggahan.

Jenis file Ekstensi {i>file Deskripsi
Adobe PDF pdf Format dokumen file portabel. Terjemahan dokumen menggunakan teknologi pengenalan karakter optik (OCR) untuk mengekstrak dan menerjemahkan teks dalam dokumen PDF yang dipindai sambil mempertahankan tata letak asli.
Nilai yang Dipisahkan Koma csv File data mentah yang dipisahkan koma, digunakan oleh program lembar kerja.
HTML html, htm Bahasa Penanda Hyperteks
XML Format File Pertukaran Lokalisasi xlff Format dokumen paralel, ekspor dari sistem Memori terjemahan. Bahasa yang digunakan didefinisikan di dalam file.
Bahasa pemformatan Markdown markdown, mdown, mkdn, md, mkd, mdwn, mdtxt, mdtext, rmd Bahasa markup ringan untuk membuat teks yang diformat.
MHTML mhtml, mht Format arsip halaman web yang digunakan untuk menggabungkan kode HTML dan sumber daya pendampingnya.
Microsoft Excel xls, xlsx File spreadsheet untuk analisis data dan dokumentasi.
Microsoft Outlook msg Pesan email yang dibuat atau disimpan dalam Microsoft Outlook.
Microsoft PowerPoint ppt, pptx File presentasi yang digunakan untuk menampilkan konten dalam format tayangan slide.
Microsoft Word doc, docx File dokumen teks.
Format Teks OpenDocument odt File dokumen teks sumber terbuka.
OpenDocument Presentasi odp File presentasi sumber terbuka.
Lembar Bentang OpenDocument ods File lembar kerja sumber terbuka.
Format teks kaya rtf Dokumen teks yang berisi pemformatan.
Nilai yang dipisahkan oleh tab tsv/tab File data mentah yang dibatasi tab yang digunakan oleh program spreadsheet.
Teks txt Dokumen teks yang tidak diformat.

Jenis File Lama Batch

Jenis file sumber dipertahankan selama terjemahan dokumen dengan pengecualian berikut:

Ekstensi file sumber Ekstensi file hasil terjemahan
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Format glosarium yang didukung pemrosesan batch

Terjemahan dokumen mendukung jenis file glosarium berikut:

Jenis file Ekstensi {i>file Deskripsi
Nilai yang Dipisahkan Koma csv File data mentah yang dipisahkan koma, digunakan oleh program lembar kerja.
XML Format File Pertukaran Lokalisasi xlf , xliff Format dokumen paralel, ekspor sistem Translation Memory yang digunakan oleh bahasa didefinisikan di dalam file.
Tab Separated Values/TAB tsv, tab File data mentah yang dibatasi tab yang digunakan oleh program spreadsheet.

Terjemahan sinkron

Gunakan pemrosesan terjemahan sinkron untuk mengirim dokumen sebagai bagian dari isi permintaan HTTP dan menerima dokumen yang diterjemahkan dalam respons HTTP.

Fitur kunci terjemahan sinkron

Fitur Deskripsi
Menerjemahkan file halaman tunggal Permintaan sinkron hanya menerima satu dokumen sebagai input.
Mempertahankan presentasi file sumber Terjemahkan file sambil mempertahankan tata letak dan format asli.
Menerapkan terjemahan kustom Terjemahkan dokumen menggunakan model terjemahan umum dan terjemahan kustom.
Menerapkan glosarium kustom Terjemahkan dokumen menggunakan glosarium kustom.
Terjemahan bahasa tunggal Terjemahkan ke dan dari satu bahasa yang didukung.
Mendeteksi bahasa dokumen secara otomatis Biarkan layanan terjemahan Dokumen menentukan bahasa dokumen.
Menerapkan glosarium kustom Menerjemahkan dokumen menggunakan glosarium kustom.

Format dokumen yang didukung sinkron

Jenis file Ekstensi {i>file Jenis konten Deskripsi
Teks Biasa .txt text/plain Dokumen teks yang tidak diformat.
Nilai yang Dipisahkan dengan Tab .txv
.tab
text/tab-separated-values Format file teks yang menggunakan tab untuk memisahkan nilai dan baris baru untuk memisahkan rekaman.
Nilai yang Dipisahkan Koma .csv text/csv Format file teks yang menggunakan koma sebagai pemisah di antara nilai.
Bahasa Markup HyperText .html
.htm
text/html HTML adalah bahasa markup standar yang digunakan untuk menyusun halaman web dan konten.
MHTML .mhtml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Format file arsip untuk halaman web.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation Format file berbasis XML yang digunakan untuk presentasi peragaan slide PowerPoint.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Format file berbasis XML yang digunakan untuk lembar bentang Excel.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Format file berbasis XML yang digunakan untuk dokumen Word.
Microsoft Outlook .msg application/vnd.ms-outlook Format berkas yang digunakan untuk menyimpan objek pesan email Outlook.
Pertukaran Lokalisasi XML .xlf
.xliff
application/xliff+xml Format file berbasis XML standar yang banyak digunakan dalam pemrosesan perangkat lunak terjemahan dan pelokalan.

Format glosarium didukung sinkron

Terjemahan dokumen mendukung jenis file glosarium berikut:

Jenis file Ekstensi {i>file Deskripsi
Nilai yang Dipisahkan Koma (CSV) csv File data mentah yang dipisahkan koma, digunakan oleh program lembar kerja.
XmlLocalizationInterchange xlf , xliff Format berbasis XML yang dirancang untuk menstandarkan bagaimana data diteruskan selama proses pelokalan.
TabSeparatedValues tsv, tab File data mentah yang dibatasi tab yang digunakan oleh program spreadsheet.

Batas Permintaan terjemahan dokumen

Untuk informasi terperinci mengenai batas permintaan Layanan Penerjemah Azure AI, lihatBatas permintaan terjemahan dokumen.

Residensi data dokumen terjemahan

Residensi data terjemahan dokumen bergantung pada wilayah Azure tempat sumber daya Penerjemah Anda dibuat:

✔️ Fitur: Terjemahan Dokumen
✔️ Titik akhir layanan: Kustom: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Wilayah tempat sumber daya dibuat Meminta pusat data pemrosesan
Global Pusat data terdekat yang tersedia.
Amerika US Timur 2 • US Barat 2
Asia Pasifik Jepang Timur • Asia Tenggara
Eropa (kecuali Swiss) Prancis Tengah • Eropa Barat
Swiss Swiss Utara • Swiss Barat

Langkah berikutnya

Dalam panduan mulai cepat kami, Anda mempelajari cara menggunakan terjemahan Dokumen secara cepat. Untuk memulai, Anda memerlukan akun Azure aktif. Jika Anda tidak memilikinya, Anda dapat membuat akun gratis.