Summary
Tip
ดูแท็บ ข้อความและรูปภาพ สําหรับรายละเอียดเพิ่มเติม!
โมดูลนี้แนะนําการรู้จําเสียง (การแปลงคําพูดเป็นข้อความ) เป็นรากฐานสําหรับแอปพลิเคชันและตัวแทนที่เปิดใช้งานเสียง ผู้เรียนสํารวจวิธีบันทึกเสียงพูดจากไมโครโฟนหรือไฟล์เสียง และแปลงเป็นข้อความที่เป็นลายลักษณ์อักษรโดยใช้ Azure Speech โมดูลอธิบายตําแหน่งที่การแปลงคําพูดเป็นข้อความพอดีกับแอปพลิเคชัน ไม่ว่าจะในแอปไคลเอ็นต์หรือบริการแบ็กเอนด์ และเน้นสถานการณ์ทั่วไป เช่น การถอดเสียงสด คําบรรยาย การประมวลผลข้อความเสียง และการป้อนข้อความไปยังตัวแทน AI
โมดูลจะครอบคลุมการสังเคราะห์เสียงพูด (การแปลงข้อความเป็นคําพูด) ซึ่งช่วยให้แอปพลิเคชันสามารถสร้างเสียงพูดที่ฟังดูเป็นธรรมชาติจากข้อความได้ ผู้เรียนจะเห็นว่า Azure Speech ใช้เสียงประสาทเพื่อควบคุมการออกเสียง โทนเสียง ความเร็ว และระดับเสียงอย่างไร และวิธีที่เสียงสังเคราะห์สามารถเล่นได้ทันทีหรือบันทึกไว้ใช้ในภายหลัง ส่วนนี้เน้นว่าการแปลงข้อความเป็นคําพูดช่วยให้แอปพลิเคชันและตัวแทนตอบสนองด้วยเสียงปรับปรุงการเข้าถึงการโต้ตอบแบบแฮนด์ฟรีและประสบการณ์ผู้ใช้โดยรวม
สุดท้าย โมดูลนี้นําความสามารถเหล่านี้มารวมกันกับการแปลงเสียงพูดเป็นคําพูดโดยใช้ Voice Live ผู้เรียนค้นพบว่า Voice Live รวมการแปลงคําพูดเป็นข้อความ การให้เหตุผลด้วย AI และการอ่านออกเสียงข้อความเป็นบริการเดียวที่มีการจัดการเต็มรูปแบบสําหรับการสนทนาแบบเรียลไทม์ได้อย่างไร นักพัฒนาสามารถใช้ Voice Live เพื่อสร้างตัวแทนเสียงที่เป็นธรรมชาติและตอบสนอง ซึ่งสามารถฟัง คิด และพูดได้ ซึ่งทําให้ง่ายต่อการสร้างประสบการณ์การสนทนาที่พร้อมใช้งานจริงด้วย Azure Speech และ Microsoft Foundry
ใช้ลิงก์ด้านล่างเพื่อเรียนรู้เพิ่มเติม
- Azure Speech ใน เอกสารประกอบบริการ
- เรียนรู้เพิ่มเติมเกี่ยวกับชุดพัฒนาซอฟต์แวร์ (SDK) ของ Azure Speech
- เรียนรู้เพิ่มเติมเกี่ยวกับ Azure Speech - Voice Live ใน เอกสารประกอบ