自訂神經語音精簡版 (預覽)
Speech Studio 提供兩種自定義神經語音 (CNV) 專案類型:CNV 精簡版和 CNV 專業版。
- 自定義神經語音(CNV)專業版可讓您上傳透過專業錄音室收集的訓練數據,並建立更高品質的語音,與人類樣本幾乎無法區分。 CNV 專業存取權會根據資格和使用準則而受到限制。 要求進入表單的存取權。
- 自定義神經語音 (CNV)lite 是公開預覽中的項目類型。 您可以先示範和評估自定義神經語音,再投資專業錄音來建立更高品質的語音。 不需要任何應用程式。 Microsoft 會限制並選取錄製和測試範例,以搭配 CNV 精簡版使用。 您必須申請 CNV 專業人員的完整存取權,才能部署和使用 CNV 精簡版模型做為商務用途。
透過 CNV 精簡專案,您可以閱讀 Microsoft 提供的 20-50 預先定義的腳本,在線錄製您的語音。 記錄至少 20 個範例之後,您就可以開始定型模型。 成功定型模型之後,您可以檢閱模型,並查看另一組預先定義的腳本所產生的 20 個輸出範例。
比較項目類型
下表摘要說明 CNV 精簡版與 CNV 專業專案類型之間的主要差異。
項目 | 精簡版 (預覽) | Pro |
---|---|---|
目標案例 | 示範或評估 | 聊天機器人的品牌和字元語音,或音訊內容閱讀等專業案例。 |
訓練資料 | 使用Speech Studio線上錄製 | 攜帶您自己的數據。 建議在專業工作室錄製。 |
用於錄製的腳本 | 在Speech Studio 中提供 | 使用符合使用案例的您自己的腳本。 Microsoft 提供 參考的範例腳本 。 |
必要的數據大小 | 20-50 語句 | 300-2000 語句 |
定型時間 | 少於一個計算小時 | 大約 20-40 個計算時數 |
語音品質 | 中等品質 | 高品質 |
可用性 | 任何人都可以在線記錄範例,並訓練模型以供示範和評估之用。 如果您想要部署 CNV 精簡模型以供商務使用,則需要完整存取自定義神經語音。 | 數據上傳不受限制,但您只能在核准存取後定型及部署 CNV 專業模型。 CNV 專業存取權會根據資格和使用準則而受到限制。 要求進入表單的存取權。 |
定價 | 每單位價格同樣適用於CNNV精英和CNNV專業專案。 請查看這裡的定價詳細數據。 | 每單位價格同樣適用於CNNV精英和CNNV專業專案。 請查看這裡的定價詳細數據。 |
建立自定義神經語音精簡專案
若要建立自定義神經語音精簡專案,請遵循下列步驟:
登入 Speech Studio。
選取要使用的訂用帳戶和語音資源。
重要
自定義神經語音定型目前僅適用於某些區域。 如需詳細資訊,請參閱區域數據表中的腳註。
選取 [自定義語音>建立專案]。
選取 [自定義神經語音精簡>檔] [下一步]。
注意
若要建立自定義神經語音 Pro 專案,請參閱 建立自定義神經語音的專案。
請遵循精靈所提供的指示來建立您的專案。
依名稱選取新專案,或選取 [移至專案]。 您會在左面板中看到這些功能表項: 記錄和建置、 檢閱模型和 部署模型。
CNV 精英專案在 90 天后到期,除非 提交語音人才錄製的口頭聲明 。
記錄並建置 CNV 精簡模型
使用在線提供的腳本錄製至少 20 個語音樣本(最多 50 個)。 此處錄製的語音範例可用來建立語音的合成版本。
以下是協助您錄製語音範例的一些秘訣:
- 使用良好的麥克風。 使用高品質的麥克風提高樣本的清晰度。 說出離麥克風約 8 英吋的距離,以避免嘴部噪音。
- 避免背景雜訊。 在沒有背景噪音或回音的情況下,在安靜的房間里錄製。
- 自然放鬆和說話。 讓自己在閱讀句子時表達情緒。
- 以一個擷取記錄。 若要保持一致的能量等級,請在一個會話中記錄所有句子。
- 正確發音每個字,並清楚說話。
若要記錄並建置 CNV 精簡模型,請遵循下列步驟:
- 選取 [自定義語音> 您的專案名稱 >記錄並建置]。
- 選取開始使用。
- 仔細閱讀語音人才使用規定。 選取複選框以確認使用規定。
- 選取 [ 接受]
- 按下麥克風圖示以啟動雜訊檢查。 此雜訊檢查只需要幾秒鐘的時間,您不需要在它期間說話。
- 如果偵測到雜訊,您可以再次選取 [ 檢查] 以重複雜訊檢查。 如果未偵測到雜訊,您可以選取 [完成 ] 繼續進行下一個步驟。
- 檢閱錄製秘訣,然後選取 [取得]。 為了獲得最佳結果,請在錄製語音範例之前,移至無背景噪音的安靜區域。
- 按麥克風圖示以開始錄製。
- 按下停止圖示以停止錄製。
- 檢閱品質計量。 錄製每個範例之後,請先檢查其品質計量,再繼續進行下一個範例。
- 記錄更多範例。 雖然您可以建立只有 20 個範例的模型,但建議您記錄最多 50 個,以取得更好的品質。
- 選取 [定型模型 ] 以啟動定型程式。
定型程式大約需要一個計算小時。 您可以在 [檢閱模型] 頁面中檢查定型程序的進度。
檢閱模型
若要檢閱 CNV 精簡模型並聆聽您自己的合成語音,請遵循下列步驟:
- 選取 [自定義語音> 您的項目名稱 >檢閱模型]。 您可以在這裏檢閱語音模型名稱、模型語言、範例數據大小和定型進度。 語音名稱是由附加至項目名稱的「類神經」一詞所組成。
- 選取語音模型名稱以檢閱模型詳細資料,並聆聽樣本文字轉換語音結果。
- 選取播放圖示以聽到您的語音說出每個腳本。
提交口頭陳述
語音人才錄製的口頭陳述是必要條件,您才能 為企業使用部署模型 。
若要提交語音人才口頭陳述,請遵循下列步驟:
- 選取 [自定義語音> 您的項目名稱>部署模型>管理您的語音人才]。
- 選取該模型。
- 輸入語音人才名稱和公司名稱。
- 讀取和記錄 語句。 選取麥克風圖示以開始錄製。 選取停止圖示以停止錄製。
- 選取 [ 提交 ] 以提交語句。
- 檢查儀錶板底部文本數據表中的處理狀態。 狀態為 [成功] 之後,您就可以 部署模型。
部署模型
若要部署您的語音模型,並在應用程式中使用它,您必須取得自定義神經語音的完整存取權。 要求進入表單的存取權。 在大約10個工作天內,您會收到具有核准狀態的電子郵件。 您也需要語音人才錄製的口頭陳述,才能為企業使用部署模型。
若要部署 CNV 精簡版模型,請遵循下列步驟:
- 選取 [自定義語音> 您的項目名稱>部署模型>部署模型]。
- 選取語音模型名稱,然後選取 [ 下一步]。
- 輸入端點的名稱和描述,然後選取 [ 下一步]。
- 選取複選框以同意使用規定,然後選取 [ 下一步]。
- 選取 [部署] 以部署模型。
您可以從這裡使用 CNV 精簡語音模型,就像使用 CNV 專業語音模型一樣。 例如,您可以在 建立端點之後暫停或繼續 端點,以限制花費並節省未使用的資源。 您也可以在 Speech Studio 的 音訊內容建立 工具 中存取語音。
下一步
意見反映
https://aka.ms/ContentUserFeedback。
即將推出:我們會在 2024 年淘汰 GitHub 問題,並以全新的意見反應系統取代並作為內容意見反應的渠道。 如需更多資訊,請參閱:提交及檢視以下的意見反映: