Summary

1 นาที

Note

ดูแท็บ ข้อความและรูปภาพ สําหรับรายละเอียดเพิ่มเติม!

ในโมดูลนี้ คุณได้สํารวจเทคโนโลยีเสียงพูดพื้นฐานที่เปิดใช้งานการโต้ตอบด้วยเสียงที่เป็นธรรมชาติในแอปพลิเคชัน AI คุณได้เรียนรู้ว่าการรู้จําเสียงแปลงคําพูดเป็นข้อความอย่างไร และการสังเคราะห์เสียงสร้างเสียงที่เหมือนมนุษย์จากเนื้อหาที่เป็นลายลักษณ์อักษรได้อย่างไร

ตลอดโมดูลนี้ คุณค้นพบ:

สถานการณ์และแอปพลิเคชันคําพูด: เทคโนโลยีเสียงพูดเปลี่ยนประสบการณ์ของผู้ใช้ในการบริการลูกค้า การเข้าถึง AI การสนทนา เอกสารด้านการดูแลสุขภาพ และอีเลิร์นนิง คุณได้สํารวจว่าการรวมการรู้จําเสียงและการสังเคราะห์เข้าด้วยกันจะสร้างการสนทนาสองทางที่ลื่นไหลซึ่งให้ความรู้สึกเป็นธรรมชาติและลดแรงเสียดทานของผู้ใช้ได้อย่างไร
พื้นฐานการรู้จําเสียง: คุณได้ตรวจสอบไปป์ไลน์หกขั้นตอนที่แปลงเสียงเป็นข้อความ ตั้งแต่การบันทึกคลื่นเสียงไปจนถึงการสร้างการถอดเสียงที่จัดรูปแบบ คุณได้เรียนรู้ว่าคุณลักษณะ MFCC ดึงรูปแบบที่มีความหมายจากเสียงอย่างไร แบบจําลองอะคูสติกที่ใช้หม้อแปลงทํานายหน่วยเสียงอย่างไร และแบบจําลองภาษาแก้ไขความคลุมเครือโดยใช้คําศัพท์และความรู้ไวยากรณ์อย่างไร
พื้นฐานการสังเคราะห์เสียงพูด: คุณค้นพบกระบวนการสี่ขั้นตอนที่เปลี่ยนข้อความให้เป็นคําพูดที่เป็นธรรมชาติ ได้แก่ การทําให้เป็นมาตรฐานของข้อความ การวิเคราะห์ทางภาษา การสร้างฉันทลักษณ์ และการสังเคราะห์เสียง คุณได้สํารวจว่าการแปลงกราฟีมเป็นหน่วยเสียงจัดการกับรูปแบบการสะกดคําอย่างไรโมเดลหม้อแปลงทํานายจังหวะและการเน้นตามธรรมชาติและวิธีที่ vocoder ประสาทสร้างรูปคลื่นเสียงที่มีความเที่ยงตรงสูง

เคล็ดลับ

สําหรับข้อมูลเพิ่มเติม โปรดดู เริ่มต้นใช้งานการสั่งงานด้วยเสียงใน Azure

คำติชม

หน้านี้มีประโยชน์หรือไม่