Mengidentifikasi bahasa lisan secara otomatis dengan model identifikasi bahasa

Artikel
07/26/2024

Penting

Tenggat waktu untuk memigrasikan konten Azure Video Indexer karena penghentian Azure Media Services telah berlalu. Lihat panduan penghentian untuk informasi selengkapnya.

Azure AI Video Indexer mendukung identifikasi bahasa otomatis (LID), yang merupakan proses mengidentifikasi bahasa lisan secara otomatis dari konten audio. File media ditranskripsikan dalam bahasa yang diidentifikasi dominan.

Lihat daftar bahasa yang didukung oleh Bahasa Pengindeks Video Azure AI dalam bahasa yang didukung.

Pastikan untuk meninjau bagian Panduan dan batasan .

Memilih identifikasi bahasa otomatis pada pengindeksan

Saat mengindeks atau mengindeks ulang video menggunakan API, pilih opsi auto detect di parameter sourceLanguage.

Saat menggunakan portal, buka Video akun Anda di beranda Azure AI Video Indexer dan arahkan mouse ke atas nama video yang ingin Anda indeks ulang. Di sudut kanan bawah, pilih tombol Indeks ulang. Dalam dialog Indeks ulang video, pilih Deteksi otomatis dari kotak menu turun bawah Bahasa sumber video.

Cuplikan layar memperlihatkan tempat untuk memilih deteksi otomatis.

Output model

Pengindeks Video Azure AI mentranskripsikan video sesuai dengan bahasa yang paling mungkin jika keyakinan untuk bahasa tersebut adalah > 0.6. Jika bahasa tidak dapat diidentifikasi dengan percaya diri, ia mengasumsikan bahasa lisan adalah bahasa Inggris.

Bahasa dominan model tersedia dalam wawasan JSON sebagai atribut sourceLanguage (di bawah akar/video/wawasan). Skor keyakinan yang sesuai juga tersedia di bawah atribut sourceLanguageConfidence.

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Pedoman dan batasan

Identifikasi bahasa otomatis (LID) mendukung bahasa-bahasa berikut:

Lihat daftar bahasa yang didukung oleh Bahasa Pengindeks Video Azure AI dalam bahasa yang didukung.

Jika audio berisi bahasa selain daftar yang didukung, hasilnya tidak terduga.
Jika Azure AI Video Indexer tidak dapat mengidentifikasi bahasa dengan keyakinan yang cukup tinggi (lebih besar dari 0,6), bahasa fallbacknya adalah bahasa Inggris.
Saat ini, tidak ada dukungan untuk file dengan audio bahasa campuran. Jika audio berisi bahasa campuran, hasilnya tidak terduga.
Audio berkualitas rendah dapat memengaruhi hasil model.
Model membutuhkan setidaknya satu menit ucapan dalam audio.
Model ini dirancang untuk mengenali ucapan percakapan spontan (bukan perintah suara, nyanyian, dan sebagainya).

Bagikan melalui

Mengidentifikasi bahasa lisan secara otomatis dengan model identifikasi bahasa

Memilih identifikasi bahasa otomatis pada pengindeksan

Output model

Pedoman dan batasan

Saran dan Komentar

Saran dan Komentar

Sumber Daya Tambahan: