共用方式為


如何使用線上謄寫編輯器

線上謄寫編輯器可讓您為自訂語音建立或編輯音訊 + 人工標記的謄寫內容。 編輯器的主要使用案例如下:

  • 您只有音訊資料,但想要從頭開始建置精確的音訊 + 人工標記的資料集,以便在模型定型中使用。
  • 您已經有音訊 + 人工標記的資料集,但轉錄中有錯誤或瑕疵。 編輯器可讓您快速修改轉錄,以獲得最佳的定型精確度。

使用謄寫編輯器的唯一需求是要將音訊資料 (無論是否具有相對應的謄寫內容) 上傳。

您可以在主要 [語音資料集] 頁面上的 [定型和測試資料集] 索引標籤旁找到 [編輯器] 索引標籤。

[語音資料集] 頁面的螢幕擷取畫面,其中顯示 [編輯器] 索引標籤。

無法更新 [定型和測試資料集] 索引標籤中的資料集。 您可以將定型或測試資料集的複本匯入至 [編輯器] 索引標籤,新增或編輯人工標記的謄寫內容以符合音訊,然後將編輯過的資料集匯出至 [定型和測試資料集] 索引標籤。另請注意,您無法使用編輯器中的資料集來定型或測試模型。

將資料集匯入編輯器

若要將資料集匯入編輯器,請遵循下列步驟:

  1. 登入 Speech Studio
  2. 選取 [自訂語音]>您的專案名稱>[語音資料集]>[編輯器]
  3. 選取 [匯入資料]
  4. 選取資料集。 您可以選取僅限音訊資料和/或音訊 + 人工標記的資料。 針對僅限音訊的資料,您可以使用預設模型,在匯入編輯器之後自動產生機器轉錄。
  5. 輸入新資料集的名稱和描述,然後選取 [下一步]
  6. 檢閱您的設定,然後選取 [匯入並關閉] 以開始匯入流程。 成功匯入資料之後,您可以選取資料集並開始編輯。

注意

您也可以從主要語音資料集頁面選取資料集,並將其匯出至編輯器。 選取資料集,然後選取 [匯出至編輯器]

編輯謄寫以符合音訊

一旦資料集匯入至編輯器,您就可以開始編輯資料集。 您可以新增或編輯人工標記的謄寫內容,以符合您聽到的音訊。 您不會編輯任何音訊資料。

若要在編輯器中編輯資料集的謄寫,請遵循下列步驟:

  1. 登入 Speech Studio
  2. 選取 [自訂語音]>您的專案名稱>[語音資料集]>[編輯器]
  3. 依名稱選取資料集的連結。
  4. 從 [音訊 + 文字檔] 資料表中,依名稱選取音訊檔案的連結。
  5. 進行編輯之後,請選取 [儲存]

如果資料集中有多個檔案,您可以選取 [上一步] 和 [下一步],在檔案之間移動。 隨著您的操作編輯並儲存每個檔案的變更。

詳細資料頁面會列出每個音訊檔案中的所有區段,您可以選取所需的語句。 針對每項表達,您可以播放和比較音訊與對應的謄寫內容。 如果您發現任何插入、刪除或替代錯誤,請編輯謄寫。 如需字組錯誤類型的詳細資訊,請參閱以量化方式測試模型

從編輯器匯出資料集

編輯器中的資料集可以匯出至 [定型和測試資料集] 索引標籤,以便用來定型或測試模型。

若要從編輯器匯出資料集,請遵循下列步驟:

  1. 登入 Speech Studio
  2. 選取 [自訂語音]>您的專案名稱>[語音資料集]>[編輯器]
  3. 依名稱選取資料集的連結。
  4. 從 [音訊 + 文字檔] 資料表中選取一或多個資料列。
  5. 選取 [匯出] 以將所有選取的檔案匯出為一個新的資料集。

檔案會匯出為新的資料集,且不會影響或取代其他定型或測試資料集。

下一步