Ringkasan

1 menit

Dalam modul ini, Anda belajar tentang dua aspek utama teknologi suara: pengenalan ucapan dan sintesis. Pengenalan ucapan melibatkan konversi kata lisan menjadi data, sering ditranskripsikan menjadi teks, menggunakan model akustik dan model bahasa. Teks ini dapat digunakan untuk berbagai tujuan seperti keterangan tertutup, transkrip, dikte catatan otomatis, dan pemrosesan input pengguna. Sintesis ucapan, di sisi lain, adalah tentang vokalisasi data, biasanya dengan mengonversi teks ke ucapan. Ucapan yang disintesis dapat digunakan untuk menghasilkan respons lisan, membuat menu suara, membaca email atau teks dengan keras, dan menyiarkan pengumuman. Anda juga mempelajari tentang layanan Ucapan AI Microsoft Azure, yang menyediakan kemampuan pengenalan ucapan dan sintesis melalui fitur seperti API Ucapan ke Teks dan Teks ke Ucapan.

Takeaway utama dari modul ini adalah fungsionalitas layanan Azure AI Speech. API Ucapan ke Teks memungkinkan transkripsi audio secara real time atau batch ke dalam teks, menggunakan model berdasarkan Model Bahasa Universal yang dilatih oleh Microsoft. Ini dapat digunakan untuk transkripsi real-time selama presentasi atau demo, atau untuk transkripsi batch file audio yang disimpan. API Teks ke Ucapan mengonversi input teks menjadi ucapan yang dapat didengar, yang dapat disesuaikan dengan suara, bahasa, dan pengucapan regional yang berbedaAzure AI Speech adalah alat serbaguna yang dapat diakses melalui berbagai platform seperti Azure AI Speech Studio, Azure AI Studio, Command Line Interface (CLI), REST API, dan Software Development Kits (SDK).

Anda dapat mengetahui selengkapnya tentang Azure AI Speech dalam dokumentasi layanan.

Ringkasan

Saran dan Komentar