Introduction
Azure Speech in Foundry Tools มี API ที่คุณสามารถใช้เพื่อสร้างแอปพลิเคชันที่เปิดใช้งานเสียงพูด ได้แก่:
- เสียงพูดเป็นข้อความ: API ที่เปิดใช้งาน การรู้จําเสียง ซึ่งแอปพลิเคชันของคุณสามารถยอมรับการป้อนข้อมูลด้วยคําพูดได้
- ข้อความไปยังคําพูด: API ที่เปิดใช้งาน การสังเคราะห์คําพูด ซึ่งแอปพลิเคชันของคุณสามารถให้ผลลัพธ์ที่พูดได้
- การแปลคําพูด: API ที่คุณสามารถใช้เพื่อแปลข้อมูลป้อนเข้าด้วยคําพูดเป็นหลายภาษา
- Voice Live: API ที่คุณสามารถใช้เพื่อสร้างตัวแทน AI ที่สามารถดําเนินการสนทนาแบบเรียลไทม์ได้
โมดูลนี้มุ่งเน้นไปที่การรู้จําเสียงและการสังเคราะห์คําพูด ซึ่งเป็นความสามารถหลักของแอปพลิเคชันที่เปิดใช้งานคําพูด
ตัวอย่างโค้ดในโมดูลนี้มีให้ใน Python แต่คุณสามารถใช้แพคเกจ Azure Speech SDK ที่พร้อมใช้งานเพื่อพัฒนาแอปพลิเคชันที่เปิดใช้งานเสียงพูดในภาษาที่คุณต้องการได้ แพคเกจ SDK ที่พร้อมใช้งานประกอบด้วย:
Note
เราตระหนักดีว่าแต่ละคนชอบเรียนรู้ในรูปแบบที่แตกต่างกัน คุณสามารถเลือกที่จะทําโมดูลนี้ให้เสร็จในรูปแบบวิดีโอหรือคุณสามารถอ่านเนื้อหาเป็นข้อความและรูปภาพ ข้อความมีรายละเอียดมากกว่าวิดีโอ ดังนั้นในบางกรณี คุณอาจต้องการอ้างถึงข้อความดังกล่าวเป็นเนื้อหาเสริมในการนําเสนอวิดีโอ