Memahami pengenalan dan sintesis ucapan

Selesai

Pengenalan ucapan mengambil kata lisan dan mengonversinya menjadi data yang dapat diproses - sering kali dengan menerjemahkannya menjadi teks. Kata yang diucapkan dapat berupa suara yang direkam dalam file audio, atau audio langsung dari mikrofon. Pola ucapan dianalisis dalam audio untuk menentukan pola yang dapat dikenali yang dipetakan ke kata-kata. Untuk mencapai hal ini, perangkat lunak biasanya menggunakan beberapa model, termasuk:

  • Model akustik yang mengonversi sinyal audio menjadi fonem (representasi suara tertentu).
  • Model bahasa yang memetakan fonem ke kata-kata, biasanya menggunakan algoritme statistik yang memprediksi urutan kata yang paling mungkin berdasarkan fonem.

Kata-kata yang dikenali biasanya dikonversi ke teks, yang dapat Anda gunakan untuk berbagai tujuan, seperti:

  • Menyediakan teks tertutup untuk video yang direkam atau langsung
  • Membuat transkrip panggilan telepon atau rapat
  • Dikte catatan otomatis
  • Menentukan input pengguna yang dimaksudkan untuk pemrosesan lebih lanjut

Sintesis ucapan berkaitan dengan vokalisasi data, biasanya dengan mengonversi teks ke ucapan. Solusi sintesis ucapan biasanya memerlukan informasi berikut:

  • Teks yang akan diucapkan
  • Suara yang akan digunakan untuk menyuarakan ucapan

Untuk mensistensi ucapan, sistem biasanya membuat token teks untuk memecahnya menjadi kata-kata individual, dan menetapkan suara fonektik untuk setiap kata. Kemudian memecah transkripsi fonetik menjadi unit prosodik (seperti frasa, klausa, atau kalimat) untuk membuat fonem yang akan dikonversi ke format audio. Fonem ini kemudian disintesis sebagai audio dan dapat diberi suara, tingkat bicara, nada, dan volume tertentu.

Anda dapat menggunakan output sintesis ucapan untuk banyak tujuan, termasuk:

  • Menghasilkan respons lisan terhadap input pengguna
  • Membuat menu suara untuk sistem telepon
  • Membaca email atau pesan teks dengan keras dalam skenario hands-free
  • Pengumuman penyiaran di lokasi publik, seperti stasiun kereta api atau bandara