Apa itu Document Translation?
Terjemahan Dokumen adalah fitur terjemahan mesin berbasis cloud dari layanan Penerjemah Azure AI. Anda dapat menerjemahkan beberapa dokumen dan kompleks di semua bahasa dan dialek yang didukung sambil mempertahankan struktur dokumen asli dan format data. API Terjemahan Dokumen mendukung dua proses terjemahan:
Terjemahan batch asinkron mendukung pemrosesan beberapa dokumen dan file besar. Proses terjemahan batch memerlukan akun penyimpanan Azure Blob dengan kontainer penyimpanan untuk sumber dan dokumen yang diterjemahkan.
File tunggal sinkron mendukung pemrosesan terjemahan file tunggal. Proses terjemahan file tidak memerlukan akun penyimpanan Azure Blob. Respons akhir berisi dokumen yang diterjemahkan dan dikembalikan langsung ke klien panggilan.
Terjemahan batch asinkron
Gunakan pemrosesan dokumen asinkron untuk menerjemahkan beberapa dokumen dan file besar.
Fitur utama batch
Fitur | Deskripsi |
---|---|
Menerjemahkan file berukuran besar | Terjemahkan seluruh dokumen secara asinkron. |
Menerjemahkan banyak file | Menerjemahkan beberapa file di semua bahasa dan dialek yang didukung sambil mempertahankan struktur dokumen dan format data. |
Mempertahankan presentasi file sumber | Terjemahkan {i>file |
Menerapkan terjemahan kustom | Terjemahkan dokumen menggunakan model terjemahan umum dan terjemahan kustom. |
Menerapkan glosarium kustom | Terjemahkan dokumen menggunakan glosarium kustom. |
Mendeteksi bahasa dokumen secara otomatis | Izinkan layanan Document Translation menentukan bahasa dokumen. |
Menerjemahkan dokumen dengan konten dalam beberapa bahasa | Gunakan fitur deteksi otomatis untuk menerjemahkan dokumen dengan konten yang terdiri dari beberapa bahasa ke dalam bahasa target Anda. |
Opsi pengembangan batch
Anda dapat menambahkan Document Translation ke aplikasi Anda dengan menggunakan REST API atau SDK pustaka klien:
REST API. adalah antarmuka agnostik bahasa yang memungkinkan Anda untuk membuat permintaan dan header otorisasi untuk menerjemahkan dokumen.
SDK pustaka klien adalah kelas, objek, metode, serta kode khusus bahasa yang dapat Anda gunakan dengan cepat dengan menambahkan referensi dalam proyek Anda. Saat ini Document Translation mendukung bahasa pemrogram C#/.NET dan Python.
Format dokumen yang didukung batch
Metode Dapatkan format dokumen yang didukung mengembalikan daftar format dokumen yang didukung oleh layanan Terjemahan Dokumen. Daftar ini mencakup ekstensi file umum, dan jenis konten jika menggunakan API pengunggahan.
Jenis file | Ekstensi {i>file | Deskripsi |
---|---|---|
Adobe PDF | pdf |
Format file dokumen portabel. Penerjemahan Dokumen menggunakan teknologi pengenalan karakter optik (OCR) untuk mengekstrak dan menerjemahkan teks dalam dokumen PDF yang dipindai sambil mempertahankan tata letak aslinya. |
Comma Separated Values | csv |
{i>File spreadsheet |
HTML | html , htm |
Hyper Text Markup Language. |
Localization Interchange File Format | xlf | Format dokumen paralel, ekspor sistem Memori Terjemahan. Bahasa yang digunakan didefinisikan di dalam file. |
Markdown | markdown , , mkdn mdown , md , mkd , mdwn , mdtxt , , mdtext ,rmd |
Bahasa markup ringan untuk membuat teks yang diformat. |
MHTML | mthml , mht |
Format arsip halaman web yang digunakan untuk menggabungkan kode HTML dan sumber daya pendampingnya. |
Microsoft Excel | xls , xlsx |
{i>File spreadsheet |
Microsoft Outlook | msg |
Pesan email yang dibuat atau disimpan dalam Microsoft Outlook. |
Microsoft PowerPoint | ppt , pptx |
{i>File slideshow |
Microsoft Word | doc , docx |
{i>File |
OpenDocument Text | odt |
File{i> |
OpenDocument Presentation | odp |
File{i> |
OpenDocument Spreadsheet | ods |
File{i> |
Rich Text Format | rtf |
Dokumen teks yang berisi pemformatan. |
Tab Separated Values/TAB | tsv /tab |
{i>File spreadsheet |
Teks | txt |
Dokumen teks yang tidak diformat. |
Jenis file Warisan Batch
Jenis file sumber dipertahankan selama terjemahan dokumen dengan pengecualian berikut:
Ekstensi file sumber | Ekstensi file terjemahan |
---|---|
.doc, .odt, .rtf, | .docx |
.xls, .ods | .xlsx |
.ppt, .odp | .pptx |
Format glosarium yang didukung batch
Document Translation mendukung jenis file glosarium berikut:
Jenis file | Ekstensi {i>file | Deskripsi |
---|---|---|
Comma Separated Values | csv |
{i>File spreadsheet |
Localization Interchange File Format | xlf , xliff |
Format dokumen paralel, ekspor sistem Translation Memory yang digunakan oleh bahasa didefinisikan di dalam file. |
Tab Separated Values/TAB | tsv , tab |
{i>File spreadsheet |
Terjemahan sinkron
Gunakan pemrosesan terjemahan sinkron untuk mengirim dokumen sebagai bagian dari isi permintaan HTTP dan menerima dokumen yang diterjemahkan dalam respons HTTP.
Fitur kunci terjemahan sinkron
Fitur | Deskripsi |
---|---|
Menerjemahkan file halaman tunggal | Permintaan sinkron hanya menerima satu dokumen sebagai input. |
Mempertahankan presentasi file sumber | Terjemahkan {i>file |
Menerapkan terjemahan kustom | Terjemahkan dokumen menggunakan model terjemahan umum dan terjemahan kustom. |
Menerapkan glosarium kustom | Terjemahkan dokumen menggunakan glosarium kustom. |
Terjemahan bahasa tunggal | Terjemahkan ke dan dari satu bahasa yang didukung. |
Mendeteksi bahasa dokumen secara otomatis | Izinkan layanan Document Translation menentukan bahasa dokumen. |
Menerapkan glosarium kustom | Menerjemahkan dokumen menggunakan glosarium kustom. |
Format dokumen yang didukung sinkron
Jenis file | Ekstensi {i>file | Jenis konten | Deskripsi |
---|---|---|---|
Teks Biasa | .txt |
text/plain |
Dokumen teks yang tidak diformat. |
Nilai Yang Dipisahkan Tab | .txv .tab |
text/tab-separated-values |
Format file teks yang menggunakan tab untuk memisahkan nilai dan baris baru untuk memisahkan rekaman. |
Nilai yang Dipisahkan Koma | .csv |
text/csv |
Format file teks yang menggunakan koma sebagai pemisah di antara nilai. |
Bahasa Markup HyperText | .html .htm |
text/html |
HTML adalah bahasa markup standar yang digunakan untuk menyusun halaman web dan konten. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Format file arsip halaman web. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Format file berbasis XML yang digunakan untuk presentasi peragaan slide PowerPoint. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Format file berbasis XML yang digunakan untuk lembar bentang Excel. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Format file berbasis XML yang digunakan untuk dokumen Word. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Format file yang digunakan untuk objek pesan email Outlook tersimpan. |
Pertukaran Pelokalan Xml | .xlf .xliff |
application/xliff+xml |
Format file berbasis XML standar yang banyak digunakan dalam pemrosesan perangkat lunak terjemahan dan pelokalan. |
Format glosarium yang didukung sinkron
Document Translation mendukung jenis file glosarium berikut:
Jenis file | Ekstensi {i>file | Deskripsi |
---|---|---|
Nilai yang Dipisahkan Koma | csv |
{i>File spreadsheet |
XmlLocalizationInterchange | xlf , xliff |
Format berbasis XML yang dirancang untuk menstandarkan bagaimana data diteruskan selama proses pelokalan. |
TabSeparatedValues | tsv , tab |
{i>File spreadsheet |
Batas Permintaan Terjemahan Dokumen
Untuk informasi terperinci mengenai batas permintaan Layanan Penerjemah Azure AI, lihat Batas permintaan Terjemahan Dokumen.
Residensi data Terjemahan Dokumen
Residensi data Terjemahan Dokumen bergantung pada wilayah Azure tempat sumber daya Penerjemah Anda dibuat:
✔️ Fitur: Titik akhir Layanan Terjemahan ✔️
Dokumen: Kustom: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Wilayah yang dibuat sumber daya | Meminta pusat data pemrosesan |
---|---|
Global | Pusat data terdekat yang tersedia. |
Amerika | US Timur 2 • US Barat 2 |
Asia Pasifik | Jepang Timur • Asia Tenggara |
Eropa (kecuali Swiss) | Prancis Tengah • Eropa Barat |
Swiss | Swiss Utara • Swiss Barat |
Langkah berikutnya
Dalam mulai cepat kami, Anda mempelajari cara mulai menggunakan Terjemahan Dokumen dengan cepat. Untuk memulai, Anda memerlukan akun Azure aktif. Jika Anda tidak memilikinya, Anda dapat membuat akun gratis.