分享方式:


針對語音轉換文字使用自備儲存體 (BYOS) 語音資源

自備儲存體 (BYOS) 可用於下列語音轉換文字案例:

  • 批次轉譯
  • 啟用音訊和謄寫結果記錄的即時謄寫
  • 自訂語音

一組語音資源和儲存體帳戶可以同時用於所有案例。

本文詳細說明如何在所有語音轉換文字案例中使用啟用 BYOS 的語音資源。 本文預設您擁有經過完整設定已啟用 BYOS 功能的語音資源和相關聯的儲存體帳戶

資料存放區

使用 BYOS 時,語音服務不會在資料處理 (謄寫、模型定型、模型測試) 完成之後保留任何客戶成品。 不過,部分不是衍生自使用者內容的中繼資料會儲存在語音服務內部部署內。 例如,在自訂語音案例中,服務會保留自訂端點的特定資訊,例如所使用的模型。

BYOS 相關聯的儲存體帳戶會儲存下列資料:

注意

本節中的「選用」表示可以,但不需要將特定成品儲存在 BYOS 相關聯的儲存體帳戶中。 如有需要,可以將其儲存在其他地方。

批次轉譯

  • 來源音訊 (選用)
  • 批次謄寫結果

啟用音訊和謄寫結果記錄的即時謄寫

  • 音訊和謄寫結果記錄

自訂語音

  • 模型定型和測試的資料集來源檔案 (選用)
  • 與啟用 BYOS 功能的語音資源所裝載的自訂模型相關的所有資料和中繼資料 (包括模型定型和測試的資料集複本)

批次轉譯

批次謄寫是用來謄寫儲存體中的大量音訊資料。 如果您不熟悉批次謄寫,請先參閱這篇文章

執行下列步驟,以透過啟用 BYOS 的語音資源來執行批次謄寫:

  1. 本指南所述,開始批次謄寫。

    重要

    請勿在謄寫要求中使用 destinationContainerUrl 參數。 如果您使用 BYOS,謄寫結果會自動儲存在 BYOS 相關聯的儲存體帳戶中。

    如果您使用 destinationContainerUrl 參數,此參數會運作,但由於臨時使用 SAS 而大幅降低為資料提供的安全性。 請參閱此處的詳細資料。

  2. 謄寫完成時,請依照本指南取得謄寫結果。 請考慮使用 sasValidityInSeconds 參數 (請參閱下一節)。

語音服務會在 customspeech-artifactsBYOS 相關聯的儲存體帳戶中使用 Blob 容器來儲存中繼和最終謄寫結果。

警告

語音服務依賴預先定義的 Blob 容器路徑和檔案名稱,使批次謄寫模組正確運作。 請勿移動、重新命名或以任何方式改變 customspeech-artifacts 容器的內容。

否則可能導致難以偵錯的 4xx 和 5xx 服務錯誤。

也不會建置直接使用 customspeech-artifacts 容器檔案和資料夾的解決方案。 使用標準工具與批次謄寫互動。 請參閱批次謄寫章節中的詳細資料。

透過 REST API 取得批次謄寫結果

語音轉換文字 REST API 完全支援啟用 BYOS 的語音資源。 不過,由於資料現在儲存在已啟用 BYOS 的儲存體帳戶內,因此取得謄寫檔案等要求會與 BYOS 相關聯的儲存體帳戶 Blob 儲存體互動,而不是語音服務內部資源。 這樣相同以 REST API 為基礎的程式碼便能同時用於「一般」和啟用 BYOS 的語音資源。

若要達到最大安全性,請在要求中使用 sasValidityInSeconds 參數並將值設為 0,其將傳回資料檔案 URL,例如取得謄寫檔案要求。 範例要求 URL 如下:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/3b24ca19-2eb1-4a2a-b964-35d89eca486b/files?sasValidityInSeconds=0

此要求會將直接儲存體帳戶 URL 傳回資料檔案 (不需要 SAS 或其他新增)。 例如:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/TranscriptionData/3b24ca19-2eb1-4a2a-b964-35d89eca486b_0_0.json"
      }

此格式的 URL 可確保只有具有足夠存取權限 (例如儲存體 Blob 資料讀者角色) 的 Microsoft Entra 身分識別 (使用者、服務主體、受控識別) 可從 URL 存取資料。

警告

如果 sasValidityInSeconds 參數在取得謄寫檔案要求或類似要求中遭省略,則會針對傳回的每個資料檔案 URL 產生有效期限 5 天的使用者委派 SAS。 此 SAS 由已啟用 BYOS 功能的語音資源系統指派的受控識別簽署。 因此,SAS 允許存取資料,即使停用儲存體帳戶金鑰存取也一樣。 請參閱此處的詳細資料。

啟用音訊和謄寫結果記錄的即時轉譯

您可以在使用語音轉換文字或語音翻譯時,啟用音訊輸入和辨識的語音記錄。 請參閱本文中的完整描述。

如果您使用 BYOS,則您會在 BYOS 相關聯的儲存體帳戶中的 customspeech-audiologs Blob 容器中找到記錄。

警告

記錄資料會保留 5 天。 在此期間之後,記錄會自動刪除。 這也適用於已啟用 BYOS 的語音資源。 如果您想要保留記錄較長的時間,請直接從 customspeech-audiologs Blob 容器複製對應的檔案和資料夾或使用 REST API。

透過 REST API 取得即時謄寫記錄

語音轉換文字 REST API 完全支援啟用 BYOS 的語音資源。 不過,由於資料現在儲存在已啟用 BYOS 的儲存體帳戶內,因此取得基本模型記錄等要求會與 BYOS 相關聯的儲存體帳戶 Blob 儲存體互動,而不是語音服務內部資源。 這樣相同以 REST API 為基礎的程式碼便能同時用於「一般」和啟用 BYOS 的語音資源。

若要達到最大安全性,請在要求中使用 sasValidityInSeconds 參數並將值設為 0,其將傳回資料檔案 URL,例如取得基本模型記錄要求。 範例要求 URL 如下:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/endpoints/base/en-US/files/logs?sasValidityInSeconds=0

此要求會將直接儲存體帳戶 URL 傳回資料檔案 (不需要 SAS 或其他新增)。 例如:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-audiologs/be172190e1334399852185c0addee9d6/en-US/2023-07-06/152339_fcf52189-0d3f-4415-becd-5f639fd7fd6b.v2.json"
      }

此格式的 URL 可確保只有具有足夠存取權限 (例如儲存體 Blob 資料讀者角色) 的 Microsoft Entra 身分識別 (使用者、服務主體、受控識別) 可從 URL 存取資料。

警告

如果 sasValidityInSeconds 參數在取得基本模型記錄要求或類似要求中遭省略,則會針對傳回的每個資料檔案 URL 產生有效期限 5 天的使用者委派 SAS。 此 SAS 由已啟用 BYOS 功能的語音資源系統指派的受控識別簽署。 因此,SAS 允許存取資料,即使停用儲存體帳戶金鑰存取也一樣。 請參閱此處的詳細資料。

自訂語音

有了 自訂語音,您即可評估與提高應用程式和產品的語音辨識精確度。 自訂語音模型可用於即時語音轉換文字、語音翻譯和批次謄寫。 如需詳細資訊,請參閱自訂語音概觀

關於如何使用自訂語音搭配已啟用 BYOS 的語音資源,無任何特定要求。 唯一的差異是會儲存語音服務為您收集並產生的所有自訂模型相關資料。 資料會儲存在 BYOS 相關聯儲存體帳戶的下列 Blob 容器中:

  • customspeech-models - 自訂語音模型的位置
  • customspeech-artifacts - 所有其他自訂語音相關資料的位置

Blob 容器結構僅供參考,如有變更,恕不另行通知。

警告

語音服務依賴預先定義的 Blob 容器路徑和檔案名稱,使批次謄寫模組能正確運作。 請勿移動、重新命名或以任何方式改變 customspeech-models 容器的內容和 customspeech-artifacts 容器的自訂語音相關資料夾。

否則可能導致難以偵錯的錯誤,且可能需要重新定型自訂模型。

也不會建置直接使用 customspeech-artifacts 容器檔案和資料夾的解決方案。 使用 REST API 和 Speech Studio 等標準工具與自訂語音相關資料互動。 請參閱自訂語音一節中的詳細資料。

搭配使用 REST API 與自訂語音

語音轉換文字 REST API 完全支援啟用 BYOS 的語音資源。 不過,由於資料現在儲存在已啟用 BYOS 的儲存體帳戶內,因此 Datasets_ListFiles 等要求會與 BYOS 相關聯的儲存體帳戶 Blob 儲存體互動,而不是語音服務內部資源。 這樣相同以 REST API 為基礎的程式碼便能同時用於「一般」和啟用 BYOS 的語音資源。

若要達到最大安全性,請在要求中使用 sasValidityInSeconds 參數並將值設為 0,其將傳回資料檔案 URL,例如取得資料集檔案要求。 範例要求 URL 如下:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/8427b92a-cb50-4cda-bf04-964ea1b1781b/files?sasValidityInSeconds=0

此要求會將直接儲存體帳戶 URL 傳回資料檔案 (不需要 SAS 或其他新增)。 例如:

 "links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/AcousticData/8427b92a-cb50-4cda-bf04-964ea1b1781b/4a61ddac-5b1c-4c21-b87d-22001b0f18ab.zip"
      }

此格式的 URL 可確保只有具有足夠存取權限 (例如儲存體 Blob 資料讀者角色) 的 Microsoft Entra 身分識別 (使用者、服務主體、受控識別) 可從 URL 存取資料。

警告

如果 sasValidityInSeconds 參數在取得資料集檔案要求或類似要求中遭省略,則會針對傳回的每個資料檔案 URL 產生有效期限 5 天的使用者委派 SAS。 此 SAS 由已啟用 BYOS 功能的語音資源系統指派的受控識別簽署。 因此,SAS 允許存取資料,即使停用儲存體帳戶金鑰存取也一樣。 請參閱此處的詳細資料。

下一步