บทนำ

เสร็จสมบูรณ์เมื่อ

ความสามารถในการพูดของ AI ช่วยให้เราสามารถจัดการระบบด้วยคําแนะนําด้วยเสียง รับคําตอบจากคอมพิวเตอร์สําหรับคําถามที่พูด สร้างคําบรรยายจากเสียง และอื่นๆ อีกมากมาย อินเทอร์เฟซที่ใช้เสียงเป็นวิธีที่เป็นธรรมชาติมากขึ้นในการมีส่วนร่วมกับซอฟต์แวร์ AI ความสามารถในการโต้ตอบผ่านภาษาพูดสามารถเพิ่มการเข้าถึงและการรวมของแอปพลิเคชันและตัวแทน

หากต้องการเปิดใช้งานการโต้ตอบประเภทนี้ ระบบ AI ต้องสนับสนุนความสามารถอย่างน้อยสองประการ:

  • การรู้จําเสียง: ความสามารถในการตรวจจับและตีความการป้อนข้อมูลด้วยเสียง
  • การสังเคราะห์คําพูด: ความสามารถในการสร้างเอาต์พุตการพูด

ตัวอย่างของความสามารถเหล่านี้ ได้แก่:

  • การเขียนตามคําบอกทางคลินิกและการจดบันทึกในการดูแลสุขภาพ: แพทย์สามารถพูดบันทึกผู้ป่วยออกเสียงระหว่างหรือหลังการนัดหมาย แอปคําพูด AI แปลงเสียงเป็นข้อความทางการแพทย์ที่ถูกต้อง

  • การถอดเสียงการโทรในการสนับสนุนลูกค้า: ศูนย์ติดต่อจะถอดเสียงการโทรของลูกค้าแบบเรียลไทม์ ทําให้ง่ายต่อการตรวจสอบการสนทนา

  • คําบรรยายอัตโนมัติในสื่อและความบันเทิง: แพลตฟอร์มวิดีโอสร้างคําบรรยายสดหรือบันทึกไว้สําหรับรายการและสตรีม

  • การเรียนรู้ภาษาและข้อเสนอแนะการออกเสียงในการศึกษา: แอปการเรียนรู้ใช้ความสามารถในการพูดของ AI เพื่อฟังนักเรียนพูดและให้ข้อเสนอแนะการออกเสียง ช่วยให้ผู้เรียนฝึกฝนและพัฒนาทักษะการพูด

  • ผู้ช่วยที่เปิดใช้งานเสียงในการค้าปลีกและอีคอมเมิร์ซ: ผู้ช่วยช้อปปิ้งเสมือนใช้การรู้จําเสียงเพื่อทําความเข้าใจคําขอของลูกค้าที่พูด และแปลงข้อความเป็นคําพูดเพื่อตอบกลับด้วยข้อมูลผลิตภัณฑ์หรือสถานะการสั่งซื้อ

Azure Speech ใน Microsoft Foundry Tools ให้ความสามารถในการแปลงคําพูดเป็นข้อความ แปลงข้อความเป็นคําพูด และคําพูดผ่านการรู้จําเสียงและการสังเคราะห์ คุณสามารถใช้รูปแบบบริการคําพูดจัดทําสําเร็จและแบบกําหนดเองสําหรับงานต่างๆ ตั้งแต่การถอดเสียงไปจนถึงข้อความที่มีความแม่นยําสูง เพื่อระบุผู้พูดในการสนทนา สร้างเสียงแบบกําหนดเอง และอื่น ๆ ถัดไปเรียนรู้วิธีรวมการรู้จําเสียงลงในแอปพลิเคชันด้วย Azure Speech

Note

เราตระหนักดีว่าแต่ละคนชอบเรียนรู้ในรูปแบบที่แตกต่างกัน คุณสามารถเลือกที่จะทําโมดูลนี้ให้เสร็จในรูปแบบวิดีโอหรือคุณสามารถอ่านเนื้อหาเป็นข้อความและรูปภาพ ข้อความมีรายละเอียดมากกว่าวิดีโอ ดังนั้นในบางกรณี คุณอาจต้องการอ้างถึงข้อความดังกล่าวเป็นเนื้อหาเสริมในการนําเสนอวิดีโอ