Pendahuluan

Selesai

Transkripsi ucapan dan sintesis adalah kemampuan yang berguna dalam banyak skenario, termasuk:

  • Mendokumen percakapan lisan dalam panggilan dan rapat.
  • Menghasilkan keterangan untuk video atau presentasi.
  • Membuat antarmuka pengguna yang dapat didengar untuk meningkatkan aksesibilitas aplikasi.
  • Mengembangkan asisten AI hands-free yang membaca pesan teks atau email secara nyaring.

Dalam modul ini, kita akan menjelajahi cara menggunakan model AI generatif berkemampuan ucapan di Microsoft Foundry untuk mengonversi ucapan ke teks dan teks ke ucapan.

Note

Kami menyadari bahwa orang yang berbeda suka belajar dengan cara yang berbeda. Anda dapat memilih untuk menyelesaikan modul ini dalam format berbasis video atau Anda dapat membaca konten sebagai teks dan gambar. Teks berisi detail yang lebih besar daripada video, jadi dalam beberapa kasus Anda mungkin ingin menyebutnya sebagai materi tambahan untuk presentasi video.