透過自訂語音,您可以使用自訂模型即時語音轉換文字、語音翻譯和批次謄寫,來增強應用程式的語音辨識正確性。
小提示
將你自訂的語音模型從 Speech Studio 帶到 Microsoft Foundry 入口網站。 在 Microsoft Foundry 入口網站中,你可以連接現有的語音資源,繼續上次的作業。 如需連線到現有語音資源的詳細資訊,請參閱連線到現有的語音資源。
你可以透過用自己的資料微調 Azure Speech 的基礎模型來建立自訂語音模型。 您可以上傳資料、測試和定訓練自訂模型、比較模型之間的正確性,以及將模型部署至自訂端點。
本文說明如何使用微調來建立自定義語音模型。 如需自訂語音的詳細資訊,請參閱自訂語音概觀文件。
小提示
你可以將 Speech Studio 的自訂語音模型帶到 Microsoft Foundry 入口網站。 在 Microsoft Foundry,你可以連接現有的語音資源,繼續上次的作業。 如需連線到現有語音資源的詳細資訊,請參閱連線到現有的語音資源。
開始微調
自定義語音微調包括模型、定型和測試數據集,以及部署端點。 每個專案都是地區設定特有的。 例如,您可以針對美式英語進行微調。
在 Microsoft Foundry 入口網站中,你可以微調部分 Foundry 工具模型。 例如,您可以微調自定義語音的模型。 每個自訂模型都是地區特有的。 例如,您可以微調美國的英文模型。
請前往 Microsoft Foundry 入口網站中的專案。 如果你需要建立專案,請參考 「建立 Microsoft Foundry 專案」。
從左側窗格中選取 [微調]。
選取 [AI 服務微調]>[+ 微調]。
在精靈中,選取 [自訂語音 (語音轉換文字微調)] 以自訂語音。 然後選取下一步。
輸入微調作業的語言、名稱和描述。 然後選擇 [建立]。
繼續微調
請參考 Azure Speech 文件,了解如何繼續微調你的自訂語音模型:
檢視微調模型
微調之後,您可以從 微調頁面存取 自定義語音模型和部署。
從左側窗格中選取 [微調]。
選取 [AI 服務微調]。
建立自訂語音項目之後,您可以從 [ 自訂語音 ] 頁面存取自定義語音模型和部署。
登入 Speech Studio。
選取要處理的訂用帳戶和語音資源。
重要事項
如果您使用音訊數據來定型自定義模型,請在具有專用硬體的區域中選取服務資源,以定型音頻數據。 如需詳細資訊,請參閱區域資料表中的註腳。
選取 [自訂語音]>[建立新專案]。
依照精靈提供的指示建立您的專案。
依名稱選取新專案,或選取 [移至專案]。 然後,您應該會在左側面板中看到這些功能表項: 語音數據集、定型 自定義模型、 測試模型和 部署模型。
取得 REST API 的項目識別碼
當您使用語音轉換文字 REST API 進行自訂語音時,您必須將 屬性設定 project 為自定義語音專案的識別碼。 你需要設定這個 project 屬性,才能在 Microsoft Foundry 入口網站中管理微調。
重要事項
自訂語音的專案 ID 與 Microsoft Foundry 專案的 ID 不同。
選取或開始微調自定義語音模型之後,您可以在URL中找到專案識別碼。
從左側窗格中選取 [微調]。
選取 [AI 服務微調]。
從 [ 模型名稱 ] 資料行選取您想要檢查的自定義模型。
檢查瀏覽器中的 URL。 項目標識碼是 URL 的一部分。 例如,專案識別碼位於
00001111-aaaa-2222-bbbb-3333cccc4444下列 URL 中:https://ai.azure.com/build/models/aiservices/speech/customspeech/00001111-aaaa-2222-bbbb-3333cccc4444/<REDACTED_FOR_BREVITY>
當您使用語音轉換文字 REST API 進行自訂語音時,您必須將 屬性設定 project 為自定義語音專案的識別碼。 您必須設定 project 屬性,才能在 Speech Studio中管理微調。
若要在 Speech Studio 中取得自訂語音項目的項目識別碼:
登入 Speech Studio ,然後選取 [自訂語音 ] 圖格。
選取您的自定義語音專案。
檢查瀏覽器中的 URL。 項目標識碼是 URL 的一部分。 例如,專案識別碼位於
00001111-aaaa-2222-bbbb-3333cccc4444下列 URL 中:https://speech.microsoft.com/portal/<Your-Resource-ID>/customspeech/a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1