什麼是Speech Studio?

Speech Studio 是一組 UI 型工具,可在您的應用程式中建置及整合 Azure AI 語音服務的功能。 您可以使用無程式代碼方法在Speech Studio中建立專案,然後使用語音 SDK語音 CLI 或 REST API 在應用程式中參考這些資產。

提示

您可以在 Speech Studio 中嘗試語音轉換文字和文字轉換語音,而不需要註冊或撰寫任何程式碼。

Speech Studio 案例

探索、試用及檢視一些常見使用案例的範例程序代碼。

  • 標題:選擇範例影片剪輯,以查看即時或脫機處理 標題 結果。 瞭解如何同步處理 標題 與輸入音訊、套用不雅內容篩選、取得部分結果、套用自定義專案,以及識別多語種案例的口語語言。 如需詳細資訊,請參閱 標題 快速入門

  • 通話中心:檢視如何使用語言和語音服務來分析話務中心交談的示範。 實時轉譯通話或處理一批通話、修訂個人識別資訊,以及擷取情感等見解,以協助您處理您的話務中心使用案例。 如需詳細資訊,請參閱 客服中心快速入門

如需在 Speech Studio 中這些案例的示範,請檢視此簡介影片

Speech Studio 功能

在Speech Studio中,下列語音服務功能可作為項目類型使用:

  • 即時語音轉換文字:在不必使用任何程式碼的情況下,將音訊檔案拖曳至此,即可快速測試語音轉換文字。 Speech Studio 有示範工具,可查看語音轉換文字在音訊範例上的運作方式。 若要探索完整的功能,請參閱什麼是語音轉換文字

  • 批次語音轉換文字:快速測試批次謄寫功能以在儲存體中謄寫大量音訊,並以非同步方式接收結果,若要深入了解批次語音轉換文字,請參閱批次語音轉換文字概觀

  • 自訂語音:建立專為特定詞彙集和說話樣式量身打造的語音辨識模型。 相較於基底語音辨識模型,自定義語音模型會成為您獨特競爭優勢的一部分,因為它們無法公開存取。 若要開始上傳範例音訊以建立自定義語音模型,請參閱 上傳定型和測試數據集

  • 發音評估:評估語音發音,並提供說話者關於口語音頻正確性和流暢性的意見反應。 Speech Studio 提供沙箱來快速測試這項功能,而不需要程序代碼。 若要在應用程式中搭配語音 SDK 使用此功能,請參閱 發音評估 一文。

  • 語音翻譯:以低延遲快速測試語音,並將語音翻譯成您選擇的其他語言。 若要探索完整的功能,請參閱什麼是語音翻譯

  • 語音庫:建置自然說話的應用程式和服務。 從廣泛的語言、語音和變體組合中選擇。 使用高度表達和人類般的神經聲音來讓您的案例上線。

  • 自訂語音:建立文字到語音轉換的自定義、一種語音。 您可以在Speech Studio中提供音訊檔案並建立相符的轉譯,然後在應用程式中使用自訂語音。 若要透過端點建立及使用自定義語音,請參閱 建立和使用您的語音模型

  • 音訊內容建立:文字轉換語音合成的無程式碼方法。 您可以依目前方式使用輸出音訊,或做為進一步自定義的起點。 您可以針對各種案例建置高度自然的音訊內容,例如音頻手冊、新聞廣播、視訊旁白和聊天機器人。 如需詳細資訊,請參閱 音訊內容建立 檔。

  • 自定義關鍵詞:自定義關鍵詞是一個單字或簡短片語,可用來語音啟動產品。 您可以在Speech Studio中建立自訂關鍵字,然後產生二進位檔,以 搭配應用程式中的語音 SDK 使用。

  • 自定義命令:輕鬆建置專為語音優先互動體驗優化的豐富語音命令應用程式。 自定義命令在Speech Studio中提供無程式代碼撰寫體驗、自動裝載模型,以及相對較低的複雜度。 此功能可協助您專注於為語音命令案例建置最佳解決方案。 如需詳細資訊,請參閱 開發自定義命令應用程式 指南。 另請參閱 使用語音 SDK 與用戶端應用程式整合。

下一步