分享方式:


什麼是語音助理?

使用具有語音服務的語音助理,開發人員可以為其應用程式及體驗建立自然、類似真人的對話介面。 語音助理服務可讓裝置與助理實作之間的互動快速又可靠。

選擇助理解決方案

建立語音助理的第一個步驟是決定您要語音助理做些什麼。 語音服務提供多個互補的解決方案,可用來製作助理互動。 您可能希望您的應用程式支援開放式對話,例如「我需要前往西雅圖」或「我可以訂購哪種披薩?」如需彈性和多用途,您可以使用 Azure AI Bot Service 搭配 Direct Line Speech 通道,將語音輸入和語音輸出功能新增至 Bot。

如果您還不確定要讓助理執行的作業,Direct Line Speech 是最佳的建議選項。 其提供與一組豐富的工具和撰寫輔助工具的整合,例如虛擬助理解決方案和企業範本,以及使用您現有的知識來源來建置的 QnA Maker 服務

使用語音 SDK 建置語音助理的參考結構

Conceptual diagram of the voice assistant orchestration service flow.

核心功能

無論您選擇 Direct Line Speech 或其他解決方案來建立您的助理互動,您都可以使用一組豐富的自訂功能,根據您的品牌、產品和特質自訂您的助理。

類別 功能
自訂關鍵字 使用者可以使用自訂關鍵字,例如「Hey Contoso」來開始與助理交談。應用程式會在語音 SDK 中使用自訂關鍵字引擎來執行此作業,您可以前往 開始使用自訂關鍵字 來設定。 語音助理可以使用服務端關鍵字驗證來改善關鍵字啟用的精確度 (相較於單獨使用裝置)。
語音轉換文字 語音助理使用語音服務的語音轉換文字,將即時音訊轉換成可辨識的文字。 當此文字轉譯時,就可供您的助理實作和用戶端應用程式使用。
文字轉換語音 助理的文字回應是透過語音服務的文字轉換語音進行合成。 然後,這個合成可供您的用戶端應用程式作為音訊串流。 Microsoft 提供的功能可讓您建置自己的自訂高品質神經文字轉換語音 (神經 TTS),為您的品牌提供語音。

開始使用語音助理

我們提供下列快速入門文章,其設計目的是讓您在 10 分鐘內執行程式碼:快速入門:使用 Direct Line Speech 建立自訂語音助理

範例程式碼和教學課程

您可以在 GitHub 上取得用來建立語音助理的範例程式碼。 這些範例涵蓋了用戶端應用程式,可讓您以數種熱門的程式設計語言連線到您的助理。

自訂

使用語音服務建置的語音助理可以使用完整的自訂選項。

注意

自訂選項會因語言和地區設定而有所不同。 若要深入了解,請參閱支援的語言

下一步