什麼是Speech Studio？

發行項
01/22/2024

Speech Studio 是一組 UI 型工具，可在您的應用程式中建置及整合 Azure AI 語音服務的功能。您可以使用無程式代碼方法在Speech Studio中建立專案，然後使用語音 SDK、語音 CLI 或 REST API 在應用程式中參考這些資產。

提示

您可以在 Speech Studio 中嘗試語音轉換文字和文字轉換語音，而不需要註冊或撰寫任何程式碼。

Speech Studio 案例

探索、試用及檢視一些常見使用案例的範例程序代碼。

標題：選擇範例影片剪輯，以查看即時或脫機處理標題結果。瞭解如何同步處理標題與輸入音訊、套用不雅內容篩選、取得部分結果、套用自定義專案，以及識別多語種案例的口語語言。如需詳細資訊，請參閱標題快速入門。
通話中心：檢視如何使用語言和語音服務來分析話務中心交談的示範。實時轉譯通話或處理一批通話、修訂個人識別資訊，以及擷取情感等見解，以協助您處理您的話務中心使用案例。如需詳細資訊，請參閱客服中心快速入門。

如需在 Speech Studio 中這些案例的示範，請檢視此簡介影片。

Speech Studio 功能

在Speech Studio中，下列語音服務功能可作為項目類型使用：

即時語音轉換文字：在不必使用任何程式碼的情況下，將音訊檔案拖曳至此，即可快速測試語音轉換文字。 Speech Studio 有示範工具，可查看語音轉換文字在音訊範例上的運作方式。若要探索完整的功能，請參閱什麼是語音轉換文字。
批次語音轉換文字：快速測試批次謄寫功能以在儲存體中謄寫大量音訊，並以非同步方式接收結果，若要深入了解批次語音轉換文字，請參閱批次語音轉換文字概觀。
自訂語音：建立專為特定詞彙集和說話樣式量身打造的語音辨識模型。相較於基底語音辨識模型，自定義語音模型會成為您獨特競爭優勢的一部分，因為它們無法公開存取。若要開始上傳範例音訊以建立自定義語音模型，請參閱上傳定型和測試數據集。
發音評估：評估語音發音，並提供說話者關於口語音頻正確性和流暢性的意見反應。 Speech Studio 提供沙箱來快速測試這項功能，而不需要程序代碼。若要在應用程式中搭配語音 SDK 使用此功能，請參閱發音評估一文。
語音翻譯：以低延遲快速測試語音，並將語音翻譯成您選擇的其他語言。若要探索完整的功能，請參閱什麼是語音翻譯。
語音庫：建置自然說話的應用程式和服務。從廣泛的語言、語音和變體組合中選擇。使用高度表達和人類般的神經聲音來讓您的案例上線。
自訂語音：建立文字到語音轉換的自定義、一種語音。您可以在Speech Studio中提供音訊檔案並建立相符的轉譯，然後在應用程式中使用自訂語音。若要透過端點建立及使用自定義語音，請參閱建立和使用您的語音模型。
音訊內容建立：文字轉換語音合成的無程式碼方法。您可以依目前方式使用輸出音訊，或做為進一步自定義的起點。您可以針對各種案例建置高度自然的音訊內容，例如音頻手冊、新聞廣播、視訊旁白和聊天機器人。如需詳細資訊，請參閱音訊內容建立檔。
自定義關鍵詞：自定義關鍵詞是一個單字或簡短片語，可用來語音啟動產品。您可以在Speech Studio中建立自訂關鍵字，然後產生二進位檔，以搭配應用程式中的語音 SDK 使用。
自定義命令：輕鬆建置專為語音優先互動體驗優化的豐富語音命令應用程式。自定義命令在Speech Studio中提供無程式代碼撰寫體驗、自動裝載模型，以及相對較低的複雜度。此功能可協助您專注於為語音命令案例建置最佳解決方案。如需詳細資訊，請參閱開發自定義命令應用程式指南。另請參閱使用語音 SDK 與用戶端應用程式整合。

下一步

探索 Speech Studio

什麼是Speech Studio？

Speech Studio 案例

Speech Studio 功能

下一步

其他資源