Introduction

เสร็จสมบูรณ์เมื่อ

Azure Speech in Foundry Tools มี API ที่คุณสามารถใช้เพื่อสร้างแอปพลิเคชันที่เปิดใช้งานเสียงพูด ได้แก่:

  • เสียงพูดเป็นข้อความ: API ที่เปิดใช้งาน การรู้จําเสียง ซึ่งแอปพลิเคชันของคุณสามารถยอมรับการป้อนข้อมูลด้วยคําพูดได้
  • ข้อความไปยังคําพูด: API ที่เปิดใช้งาน การสังเคราะห์คําพูด ซึ่งแอปพลิเคชันของคุณสามารถให้ผลลัพธ์ที่พูดได้
  • การแปลคําพูด: API ที่คุณสามารถใช้เพื่อแปลข้อมูลป้อนเข้าด้วยคําพูดเป็นหลายภาษา
  • Voice Live: API ที่คุณสามารถใช้เพื่อสร้างตัวแทน AI ที่สามารถดําเนินการสนทนาแบบเรียลไทม์ได้

โมดูลนี้มุ่งเน้นไปที่การรู้จําเสียงและการสังเคราะห์คําพูด ซึ่งเป็นความสามารถหลักของแอปพลิเคชันที่เปิดใช้งานคําพูด

ตัวอย่างโค้ดในโมดูลนี้มีให้ใน Python แต่คุณสามารถใช้แพคเกจ Azure Speech SDK ที่พร้อมใช้งานเพื่อพัฒนาแอปพลิเคชันที่เปิดใช้งานเสียงพูดในภาษาที่คุณต้องการได้ แพคเกจ SDK ที่พร้อมใช้งานประกอบด้วย:

Note

เราตระหนักดีว่าแต่ละคนชอบเรียนรู้ในรูปแบบที่แตกต่างกัน คุณสามารถเลือกที่จะทําโมดูลนี้ให้เสร็จในรูปแบบวิดีโอหรือคุณสามารถอ่านเนื้อหาเป็นข้อความและรูปภาพ ข้อความมีรายละเอียดมากกว่าวิดีโอ ดังนั้นในบางกรณี คุณอาจต้องการอ้างถึงข้อความดังกล่าวเป็นเนื้อหาเสริมในการนําเสนอวิดีโอ