Apa itu transkripsi rapat? (Pratinjau)

Transkripsi rapat adalah solusi ucapan ke teks yang menyediakan transkripsi real time atau asinkron dari setiap rapat. Fitur ini, yang saat ini dalam pratinjau, menggabungkan pengenalan ucapan, identifikasi pembicara, dan atribusi kalimat untuk menentukan siapa yang mengatakan apa, dan kapan, dalam rapat.

Penting

Skenario "transkripsi percakapan" sebelumnya diganti namanya menjadi "transkripsi rapat." Misalnya, gunakan MeetingTranscriber alih-alih ConversationTranscriber, dan gunakan CreateMeetingAsync alih-alih CreateConversationAsync. Fitur "transkripsi percakapan" baru dirilis tanpa menggunakan profil pengguna dan tanda tangan suara. Untuk mengetahui informasi selengkapnya, lihat catatan rilis.

Fitur utama

Anda mungkin menemukan fitur transkripsi rapat berikut ini berguna:

  • Tanda waktu: Setiap ucapan pembicara memiliki tanda waktu, sehingga Anda dapat dengan mudah menemukan kapan sebuah frasa dikatakan.
  • Transkrip yang dapat dibaca: Transkrip memiliki pemformatan dan tanda baca yang ditambahkan secara otomatis untuk memastikan teks sangat cocok dengan apa yang dikatakan.
  • Profil pengguna: Profil pengguna dibuat dengan mengumpulkan sampel suara pengguna dan mengirimkannya ke pembuatan tanda tangan.
  • Identifikasi pembicara: Pembicara diidentifikasi menggunakan profil pengguna, dan pengidentifikasi pembicara ditetapkan untuk setiap profil pengguna.
  • Diarisasi multipembicara: Menentukan siapa yang berbicara dengan mensintesis aliran audio dengan setiap pengidentifikasi pembicara.
  • Transkripsi real time: Berikan transkrip langsung tentang siapa yang mengatakan apa, dan kapan, saat rapat terjadi.
  • Transkripsi asinkron: Memberikan transkripsi dengan akurasi yang lebih tinggi dengan menggunakan aliran audio multi-saluran.

Catatan

Meskipun transkripsi rapat tidak membatasi jumlah pembicara di ruangan, transkripsi ini dioptimalkan untuk 2-10 pembicara per sesi.

Mulai

Lihat mulai cepat transkripsi rapat real time untuk memulai.

Kasus penggunaan

Untuk membuat rapat inklusif bagi semua orang, seperti peserta yang tuli dan sulit mendengar, penting untuk memiliki transkripsi secara real-time. Transkripsi rapat dalam mode real time mengambil audio rapat dan menentukan siapa yang mengatakan apa, memungkinkan semua peserta rapat untuk mengikuti transkrip dan berpartisipasi dalam rapat, tanpa penundaan.

Peserta rapat dapat fokus pada rapat dan meninggalkan catatan untuk transkripsi rapat. Peserta dapat secara aktif terlibat dalam rapat dan dengan cepat menindaklanjuti langkah-langkah berikutnya dengan cepat, menggunakan transkrip alih-alih mencatat dan berpotensi terlewat sesuatu selama rapat.

Cara kerjanya

Diagram berikut menyajikan gambaran umum tingkat tinggi mengenai cara kerja fitur tersebut.

Diagram yang memperlihatkan hubungan di antara berbagai bagian solusi transkripsi rapat.

Input yang diharapkan

Transkripsi rapat menggunakan dua jenis input:

  • Aliran audio multi-saluran: Untuk detail spesifikasi dan desain, lihat Rekomendasi array mikrofon.
  • Sampel suara pengguna: Transkripsi rapat memerlukan profil pengguna sebelum percakapan untuk identifikasi pembicara. Kumpulkan rekaman audio dari setiap pengguna, lalu kirimkan rekaman tersebut ke layanan pembuatan tanda tangan untuk memvalidasi audio dan menghasilkan profil pengguna.

Catatan

Konfigurasi audio saluran tunggal untuk transkripsi rapat saat ini hanya tersedia dalam pratinjau privat.

Sampel suara pengguna untuk tanda tangan suara diperlukan untuk identifikasi pembicara. Pembicara yang tidak memiliki sampel suara akan dikenali sebagai tidak teridentifikasi. Pembicara tidak teridentifikasi masih dapat dibedakan jika properti DifferentiateGuestSpeakers diaktifkan (lihat contoh di bawah). Output transkripsi kemudian menunjukkan speaker sebagai, misalnya, Guest_0 dan Guest_1, bukan mengenalinya sebagai nama pembicara tertentu yang telah didaftarkan sebelumnya.

config.SetProperty("DifferentiateGuestSpeakers", "true");

Real time vs. asinkron

Bagian berikut memberikan detail lebih lanjut tentang mode transkripsi yang dapat Anda pilih.

Real time

Data audio diproses secara langsung untuk mengembalikan pengidentifikasi pembicara dan transkripsi. Pilih mode ini jika persyaratan solusi transkripsi Anda adalah memberi peserta rapat tampilan transkrip langsung dari rapat yang sedang berlangsung. Misalnya, membangun aplikasi untuk membuat rapat lebih mudah diakses oleh peserta tuna rungu dan sulit mendengar adalah kasus penggunaan yang ideal untuk transkripsi real-time.

Asinkron

Data audio diproses secara batch untuk mengembalikan pengidentifikasi pembicara dan transkripsi. Pilih mode ini jika persyaratan solusi transkripsi Anda untuk memberikan akurasi yang lebih tinggi, tanpa tampilan transkripsi langsung. Misalnya, jika Anda ingin membangun aplikasi untuk memungkinkan peserta rapat dengan mudah mengejar rapat yang terlewat, maka gunakan mode transkripsi asinkron untuk mendapatkan hasil transkripsi akurasi tinggi.

Real time ditambah asinkron

Data audio diproses secara langsung untuk mengembalikan pengidentifikasi pembicara dan transkripsi, dan, di samping itu, meminta transkripsi berakurasi tinggi melalui pemrosesan asinkron. Pilih mode ini jika aplikasi Anda memiliki kebutuhan akan transkripsi real-time, dan juga memerlukan transkrip akurasi yang lebih tinggi untuk digunakan setelah rapat terjadi.

Dukungan bahasa

Saat ini, transkripsi rapat mendukung semua bahasa ucapan ke teks di wilayah berikut: centralus, , eastasiaeastus, . westeurope

Langkah berikutnya