Dukungan bahasa di Azure AI Video Indexer

Penting

Karena pengumuman penghentian Azure Media Services, Azure AI Video Indexer mengumumkan penyesuaian fitur Azure AI Video Indexer. Lihat Perubahan yang terkait dengan penghentian Azure Media Service (AMS) untuk memahami apa artinya ini untuk akun Azure AI Video Indexer Anda. Lihat panduan Mempersiapkan penghentian AMS: Pembaruan VI dan migrasi.

Artikel ini menjelaskan opsi bahasa Pengindeks Video dan menyediakan daftar dukungan bahasa untuk masing-masing opsi bahasa. Ini termasuk dukungan bahasa untuk fitur Video Indexer, terjemahan, identifikasi bahasa, kustomisasi, dan pengaturan bahasa situs web Video Indexer.

Bahasa yang didukung per skenario

Bagian ini menjelaskan opsi bahasa Pengindeks Video dan memiliki tabel bahasa yang didukung untuk masing-masing bahasa.

Penting

Semua bahasa yang tercantum mendukung terjemahan saat mengindeks melalui API.

Penjelasan kolom

  • Bahasa sumber yang didukung - Bahasa yang digunakan dalam file media yang didukung untuk transkripsi, terjemahan, dan pencarian.

  • Identifikasi bahasa - Apakah bahasa dapat secara otomatis terdeteksi oleh Video Indexer saat identifikasi bahasa digunakan untuk pengindeksan. Untuk mempelajari selengkapnya, lihat Menggunakan Pengindeks Video Azure AI untuk mengidentifikasi bahasa lisan secara otomatis dan bagian Identifikasi Bahasa.

  • Kustomisasi (model bahasa) - Apakah bahasa dapat digunakan saat menyesuaikan model bahasa di Video Indexer. Untuk mempelajari selengkapnya, lihat Mengkustomisasi model bahasa di Azure AI Video Indexer.

  • Pengucapan (model bahasa) - Apakah bahasa dapat digunakan untuk membuat himpunan data pengucapan sebagai bagian dari model ucapan kustom. Untuk mempelajari selengkapnya, lihat Mengkustomisasi model ucapan dengan Azure AI Video Indexer.

  • Terjemahan Situs Web – Apakah bahasa tersebut didukung untuk terjemahan saat menggunakan situs web Azure AI Video Indexer. Pilih bahasa yang diterjemahkan di menu drop-down bahasa.

    Cuplikan layar memperlihatkan menu dengan unduhan, bahasa Inggris, dan tampilan sebagai item menu. Tipsalat ditampilkan sebagai mouseover pada item bahasa Inggris dan mengatakan Terjemahan diatur ke bahasa Inggris.

    Wawasan berikut diterjemahkan:

    • Transkrip
    • Kata Kunci
    • Topik
    • Label
    • Pola bingkai (Sementara hanya untuk bahasa Ibrani)

    Semua wawasan lain muncul dalam bahasa Inggris saat menggunakan terjemahan.

  • Bahasa Situs Web - Apakah bahasa dapat dipilih untuk digunakan di situs web Azure AI Video Indexer. Pilih ikon Pengaturan lalu pilih bahasa di menu dropdown Pengaturan bahasa.

    Cuplikan layar memperlihatkan menu dengan pengaturan pengguna memperlihatkan semuanya diaktifkan.

Bahasa Kode Didukung
bahasa sumber
Bahasa
Identifikasi
Kustomisasi
(model bahasa)
Pengucapan
(model bahasa)
Website
Terjemahan
Website
Bahasa
Afrika af-ZA
Arab (Israel) ar-IL
Arab (Irak) ar-IQ
Arab (Jordania) ar-JO
Arab (Kuwait) ar-KW
Arab (Lebanon) ar-LB
Arab (Oman) ar-OM
Arab (Otoritas Nasional Palestina) ar-PS
Arab (Qatar) ar-QA
Arab (Arab Saudi) ar-SA
Arab (Uni Emirat Arab) ar-AE
Arab Mesir ar-EG
Standar Modern Bahasa Arab (Bahrain) ar-BH
Bahasa Arab Republik Arab Siria ar-SY
Armenia hy-AM
Bengali bn-BD
Bosnia bs-Latn
Bulgaria bg-BG
Katalan ca-ES
Bahasa Mandarin (Kanton, Tradisional) zh-HK
Tionghoa (Aksara Sederhana) zh-HanS
Tionghoa (Aksara Sederhana) zh-CK
Tionghoa (Aksara Tradisional) zh-Hant
Kroasia hr-HR
Cheska cs-CZ
Dansk da-DK
Belanda nl-NL
Bahasa Inggris Australia en-AU
Bahasa Inggris Britania Raya en-GB
Bahasa Inggris Amerika Serikat id-ID
Esti et-EE
Fiji en-FJ
Filipino fil-PH
Suomi fi-FI
Prancis fr-FR
Prancis (Kanada) fr-CA
Jerman de-DE
Yunani el-GR
Gujarat gu-IN
Haiti fr-HT
Ibrani he-IL
Hindi hi-IN
Hungaria hu-HU
Islandia is-IS
Indonesia id-ID
Irlandia ga-IE
Italia it-IT
Jepang ja-JP
Kannada kn-IN
Kiswahili sw-KE
Korea ko-KR
Latvi lv-LV
Lituavi lt-LT
Malagasi mg-MG
Melayu ms-MY
Malayalam ml-IN
Malta mt-MT
Norwegia nb-NO
Farsi fa-IR
Polski pl-PL
Portugis pt-BR
Portugis (Portugal) pt-PT
Rumania ro-RO
Rusia ru-RU
Samoa en-WS
Serbia (Sirilik) sr-Cyrl-RS
Serbia (Latin) sr-Latn-RS
Slovak sk-SK
Sloven sl-SI
Spanyol es-ES
Spanyol (Meksiko) es-MX
Swedia sv-SE
Tamil ta-IN
Telugu te-IN
Thailand th-TH
Tongan to-TO
Turki tr-TR
Ukraina uk-UA
Urdu ur-PK
Vietnam vi-VN

Mendapatkan bahasa yang didukung melalui API

Gunakan panggilan Get Supported Languages API untuk menarik daftar lengkap bahasa yang didukung per area. Untuk informasi selengkapnya, lihat Mendapatkan Bahasa yang Didukung.

API mengembalikan daftar bahasa yang didukung dengan nilai berikut:

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • Bahasa sumber yang didukung:

    Jika isSourceLanguage salah, bahasa hanya didukung untuk terjemahan. Jika isSourceLanguage benar, bahasa ini didukung sebagai sumber untuk transkripsi, terjemahan, dan pencarian.

  • Identifikasi bahasa (deteksi otomatis):

    Jika isAutoDetect benar, bahasa ini didukung untuk identifikasi bahasa (LID) dan identifikasi multi-bahasa (MLID).

Identifikasi Bahasa

Saat mengunggah file media ke Video Indexer, Anda dapat menentukan bahasa sumber file media. Jika mengindeks file melalui situs web Video Indexer, ini dapat dilakukan dengan memilih bahasa selama pengunggahan file. Jika Anda mengirimkan pekerjaan pengindeksan melalui API, itu dilakukan dengan menggunakan parameter bahasa. Bahasa yang dipilih kemudian digunakan untuk menghasilkan transkripsi file.

Jika Anda tidak yakin dengan bahasa sumber file media atau mungkin berisi beberapa bahasa, Video Indexer dapat mendeteksi bahasa lisan. Jika Anda memilih Auto-detect single language (LID) atau multi-bahasa (MLID) untuk bahasa sumber file media, bahasa atau bahasa yang terdeteksi akan digunakan untuk mentranskripsikan file media. Untuk mempelajari selengkapnya tentang LID dan MLID, lihat Menggunakan Pengindeks Video Azure AI untuk mengidentifikasi bahasa lisan secara otomatis, lihat Mengidentifikasi bahasa lisan secara otomatis dengan model identifikasi bahasa dan mengidentifikasi dan mentranskripsikan konten multi-bahasa secara otomatis

Ada batas 10 bahasa yang diizinkan untuk identifikasi selama pengindeksan file media untuk LID dan MLID. Berikut ini adalah 9 bahasa default identifikasi bahasa (LID) dan Identifikasi multibahas bahasa (MILD):

  • Bahasa Jerman (de-DE)
  • Bahasa Inggris Amerika Serikat (id-ID)
  • Spanyol (es-ES)
  • Prancis (fr-FR)
  • Bahasa Italia (it-IT)
  • Bahasa Jepang (ja-JP)
  • Portugis (pt-BR)
  • Rusia (ru-RU)
  • Bahasa Tionghoa (Sederhana) (zh-Hans)

Cara mengubah daftar bahasa default

Jika Anda perlu menggunakan bahasa untuk identifikasi yang tidak digunakan secara default, Anda dapat menyesuaikan daftar ke 10 bahasa yang mendukung penyesuaian melalui situs web atau API:

Gunakan situs web untuk mengubah daftar

  1. Pilih tab ID Bahasa di bawah Kustomisasi model. Daftar bahasa khusus untuk akun Video Indexer yang Anda gunakan dan untuk pengguna yang masuk. Daftar bahasa default disimpan per pengguna di perangkat lokal mereka, per perangkat, dan browser. Akibatnya, setiap pengguna dapat mengonfigurasi daftar bahasa yang diidentifikasi default mereka sendiri.

  2. Gunakan Tambahkan bahasa untuk mencari dan menambahkan lebih banyak bahasa. Jika 10 bahasa sudah dipilih, Anda harus terlebih dahulu menghapus salah satu bahasa yang terdeteksi sebelum menambahkan yang baru.

    Cuplikan layar memperlihatkan tabel yang memperlihatkan semua bahasa yang dipilih.

Menggunakan API untuk mengubah daftar

Saat Anda mengunggah file, model bahasa Video Indexer merujuk silang 9 bahasa secara default. Jika ada kecocokan, model menghasilkan transkripsi untuk file dengan bahasa yang terdeteksi.

Gunakan parameter bahasa untuk menentukan multi parameter (MLID) atau auto (LID). customLanguages Gunakan parameter untuk menentukan hingga 10 bahasa. (Parameter hanya digunakan saat parameter bahasa diatur ke multi atau auto.) Untuk mempelajari selengkapnya tentang menggunakan API, lihat Menggunakan API Pengindeks Video Azure AI.