共用方式為


在 Windows 上開始使用語音助理

本指南將引導您完成在 Windows 上開始開發語音助理的步驟。

設定開發環境

若要開始開發適用於 Windows 的語音助理,您必須確定您有適當的開發環境。

  • Visual Studio: 您需要安裝 Microsoft Visual Studio 2017、Community Edition 或更高版本
  • Windows 版本:具有 Windows 測試人員 Fast Ring 組建的 Windows 和 Windows 測試人員版 Windows SDK 的電腦。 此範例程式代碼會驗證為使用 Windows SDK 19018 在 Windows 測試人員版本組建 19025.vb_release_analog.191112-1600 上運作。 高於指定版本的任何組建或 SDK 都必須相容。
  • UWP 開發工具:Visual Studio 中的通用 Windows 平台開發工作負載。 請參閱 UWP 的 [開始設定] 頁面,讓您的機器做好開發 UWP 應用程式的準備。
  • 正常運作的麥克風和音訊輸出

取得 Microsoft 的資源

Windows 上自訂語音代理程式所需的某些資源,將需要來自 Microsoft 的資源。 UWP 語音助理範例提供了這些資源的範例版本供初始開發和測試之用,因此進行初始開發時不需要參考這一節。

  • 關鍵字模型:要啟用語音,必須要有 Microsoft 以 .bin 檔案形式提供的關鍵字模型。 UWP 語音助理範例中提供的 .bin 檔案是以關鍵字 Contoso 定型的。
  • 有限存取功能權杖: 由於 ConversationalAgent API 提供麥克風音訊的存取,因此會受到有限存取功能限制的保護。 若要使用有限存取功能,您必須從 Microsoft 取得連線到應用程式套件身分識別的有限存取功能令牌。 如需任何有限存取功能或要求解除鎖定令牌的詳細資訊,請連絡 Microsoft 支援服務

建立對話服務

如需完整的語音助理體驗,應用程式需要對話服務

  • 偵測指定音訊檔案中的關鍵字
  • 接聽使用者輸入並將其轉換成文字
  • 提供文字給 Bot
  • 將 Bot 的文字回應翻譯為音訊輸出

這些是使用 Direct Line Speech 來建立基本對話服務的需求。

  • 語音資源: 適用於語音功能的 Azure 資源,例如語音轉換文字和文字轉換語音。 在 Azure 入口網站上建立語音資源。 如需詳細資訊,請參閱建立新的 Azure AI 服務資源
  • Bot Framework Bot: 使用 Bot Framework 4.2 版或更新版本的 Bot 訂閱 Direct Line Speech 來啟用語音輸入和輸出。 本指南包含建立「回應 Bot」並使其訂閱 Direct Line Speech 的逐步指示。 您也可以前往 此 Bot Framework 文章 ,以取得如何建立自定義 Bot 的步驟。 然後遵循這裡的相同步驟來訂閱 Direct Line Speech,但使用您的新 Bot,而不是「回應 Bot」。

試用範例應用程式

使用語音資源金鑰和回應 Bot 的 Bot 識別碼,您就可以開始試用 UWP 語音助理範例。 依照讀我檔案中的指示執行應用程式,並輸入您的認證。

自行建立適用於 Windows 的語音助理

一旦您收到來自 Microsoft 的有限存取功能令牌和 bin 檔案,您就可以在 Windows 上開始自己的語音助理。

下一步