分享方式:


語音轉換文字 REST API

語音轉換文字 REST API 用於 批次轉譯自訂語音

重要

語音轉換文字 REST API v3.2 是正式運作的最新版本。 2024 年 9 月將會移除預覽版 3.2-preview.13.2-preview.2*。 語音轉換文字 REST API v3.1 將在宣佈的日期淘汰。 如需升級的詳細資訊,請參閱語音轉換文字 REST API v3.1 至 v3.2 移轉指南。 語音轉換文字 REST API v3.0 將於 2026 年 4 月 1 日淘汰。 如需關於升級的詳細資訊,請參閱語音轉換文字 REST API v3.0 至 v3.1,以及 v3.1 至 v3.2 移轉指南。

使用語音轉換文字 REST API 執行下列事項:

  • 快速轉譯:以同步方式傳回結果的 Transcrib 音訊檔案,而且比即時音訊快得多。 在您需要以可預測的延遲快速錄製音訊錄製的案例中使用快速轉譯 API (/speechtotext/轉譯:transcribe),例如快速音訊或視訊轉譯或視訊翻譯。
  • 自定義語音:上傳您自己的數據、測試和定型自定義模型、比較模型之間的精確度,以及將模型部署至自定義端點。 如果您想要讓同事能夠存取您所建置的模型,或想要將模型部署到多個區域,請將模型複製到其他訂用帳戶。
  • 批次轉譯:從多個 URL 或 Azure 容器將音訊檔案轉譯為批次。

語音轉換文字 REST API 包含下列功能:

  • 如果要求該端點的記錄,請取得每個端點的記錄。
  • 要求您所建立之模型的指令清單,以設定內部部署容器。
  • 使用共用存取簽章 (SAS) URI 從 Azure 記憶體帳戶上傳數據。
  • 攜帶您自己的記憶體。 使用您自己的記憶體帳戶來記錄、轉譯檔案和其他數據。
  • 某些作業支援 Webhook 通知。 您可以註冊傳送通知的 Webhook。

批次轉譯

下列作業群組適用於 批次轉譯

作業群組 描述
模型 使用基底模型或自定義模型來轉譯音訊檔案。

您可以使用模型搭配 自訂語音批次轉譯。 例如,您可以使用以特定數據集定型的模型來轉譯音訊檔案。 如需如何定型和管理自定義語音模型的範例,請參閱 定型模型自定義語音模型生命週期
改編 使用轉譯在記憶體中轉譯大量的音訊。

當您使用批次轉譯時,每個要求會傳送多個檔案,或指向具有要轉譯之音訊檔案的 Azure Blob 儲存體 容器。 如需如何從多個音訊檔案建立轉譯的範例,請參閱 建立轉譯
Webhook 使用 Web 攔截來接收有關建立、處理、完成和刪除事件的通知。

您可以使用 Web 攔截搭配 自訂語音批次轉譯。 Web 勾點適用於 數據集端點評估模型轉譯

自訂語音

下列作業群組適用於 自訂語音

作業群組 描述
資料集 使用數據集來定型及測試自定義語音模型。

例如,您可以將定型自定義語音與特定數據集的效能與基底模型或以不同數據集定型的自定義語音模型效能進行比較。 如需如何上傳數據集的範例,請參閱 上傳定型和測試數據集
端點 將自訂語音模型部署至端點。

您必須部署自定義端點,才能使用 自訂語音 模型。 如需如何管理部署端點的範例,請參閱 部署模型
評估 使用評估來比較不同模型的效能。

例如,您可以將定型為特定數據集的 自定義語音 模型效能與基底模型的效能或以不同數據集定型的自定義模型進行比較。 如需如何測試及評估自定義語音模型的範例,請參閱測試辨識質量和測試精確度
模型 使用基底模型或自定義模型來轉譯音訊檔案。

您可以使用模型搭配 自訂語音批次轉譯。 例如,您可以使用以特定數據集定型的模型來轉譯音訊檔案。 如需如何定型和管理自定義語音模型的範例,請參閱 定型模型自定義語音模型生命週期
專案 使用專案來管理自定義語音模型、定型和測試數據集,以及部署端點。

自訂語音專案 包含模型、定型和測試數據集,以及部署端點。 每個專案都是地區設定特有的。 例如,您可能會針對美國的英語建立專案。 如需如何建立專案的範例,請參閱 建立專案
Webhook 使用 Web 攔截來接收有關建立、處理、完成和刪除事件的通知。

您可以使用 Web 攔截搭配 自訂語音批次轉譯。 Web 勾點適用於 數據集端點評估模型轉譯

服務健全狀況

服務健康情況 提供服務和子元件整體健康情況的深入解析。 如需詳細資訊,請參閱 服務健康情況

下一步