如何使用線上謄寫編輯器
線上謄寫編輯器可讓您為自訂語音建立或編輯音訊 + 人工標記的謄寫內容。 編輯器的主要使用案例如下:
- 您只有音訊資料,但想要從頭開始建置精確的音訊 + 人工標記的資料集,以便在模型定型中使用。
- 您已經有音訊 + 人工標記的資料集,但轉錄中有錯誤或瑕疵。 編輯器可讓您快速修改轉錄,以獲得最佳的定型精確度。
使用謄寫編輯器的唯一需求是要將音訊資料 (無論是否具有相對應的謄寫內容) 上傳。
您可以在主要 [語音資料集] 頁面上的 [定型和測試資料集] 索引標籤旁找到 [編輯器] 索引標籤。
無法更新 [定型和測試資料集] 索引標籤中的資料集。 您可以將定型或測試資料集的複本匯入至 [編輯器] 索引標籤,新增或編輯人工標記的謄寫內容以符合音訊,然後將編輯過的資料集匯出至 [定型和測試資料集] 索引標籤。另請注意,您無法使用編輯器中的資料集來定型或測試模型。
將資料集匯入編輯器
若要將資料集匯入編輯器,請遵循下列步驟:
- 登入 Speech Studio。
- 選取 [自訂語音]>您的專案名稱>[語音資料集]>[編輯器]。
- 選取 [匯入資料]
- 選取資料集。 您可以選取僅限音訊資料和/或音訊 + 人工標記的資料。 針對僅限音訊的資料,您可以使用預設模型,在匯入編輯器之後自動產生機器轉錄。
- 輸入新資料集的名稱和描述,然後選取 [下一步]。
- 檢閱您的設定,然後選取 [匯入並關閉] 以開始匯入流程。 成功匯入資料之後,您可以選取資料集並開始編輯。
注意
您也可以從主要語音資料集頁面選取資料集,並將其匯出至編輯器。 選取資料集,然後選取 [匯出至編輯器]。
編輯謄寫以符合音訊
一旦資料集匯入至編輯器,您就可以開始編輯資料集。 您可以新增或編輯人工標記的謄寫內容,以符合您聽到的音訊。 您不會編輯任何音訊資料。
若要在編輯器中編輯資料集的謄寫,請遵循下列步驟:
- 登入 Speech Studio。
- 選取 [自訂語音]>您的專案名稱>[語音資料集]>[編輯器]。
- 依名稱選取資料集的連結。
- 從 [音訊 + 文字檔] 資料表中,依名稱選取音訊檔案的連結。
- 進行編輯之後,請選取 [儲存]。
如果資料集中有多個檔案,您可以選取 [上一步] 和 [下一步],在檔案之間移動。 隨著您的操作編輯並儲存每個檔案的變更。
詳細資料頁面會列出每個音訊檔案中的所有區段,您可以選取所需的語句。 針對每項表達,您可以播放和比較音訊與對應的謄寫內容。 如果您發現任何插入、刪除或替代錯誤,請編輯謄寫。 如需字組錯誤類型的詳細資訊,請參閱以量化方式測試模型。
從編輯器匯出資料集
編輯器中的資料集可以匯出至 [定型和測試資料集] 索引標籤,以便用來定型或測試模型。
若要從編輯器匯出資料集,請遵循下列步驟:
- 登入 Speech Studio。
- 選取 [自訂語音]>您的專案名稱>[語音資料集]>[編輯器]。
- 依名稱選取資料集的連結。
- 從 [音訊 + 文字檔] 資料表中選取一或多個資料列。
- 選取 [匯出] 以將所有選取的檔案匯出為一個新的資料集。
檔案會匯出為新的資料集,且不會影響或取代其他定型或測試資料集。