語音轉換文字 REST API

2025-05-25

語音轉換文字 REST API 用於批次轉譯和自訂語音。

重要

語音轉換文字 REST API 版本 2024-11-15 是正式運作的最新版本。

語音轉換文字 REST API 版本 2024-05-15-preview 將在宣佈的日期淘汰。
語音轉換文字 REST API v3.0、v3.1、、 v3.23.2-preview.1和 3.2-preview.2 將於 2026 年 3 月 31 日淘汰。

如需升級的詳細資訊，請參閱語音轉換文字 REST API v3.0 至 v3.1、v3.1 至 v3.2 和 v3.2 至 2024-11-15 移轉指南。

請參閱語音轉換文字 REST API 2024-11-15 參考檔

使用語音轉換文字 REST API 執行下列事項：

快速轉譯：以同步方式傳回結果的 Transcrib 音訊檔案，而且比即時音訊快得多。在您需要以可預測的延遲快速錄製音訊錄製的案例中使用快速轉譯 API （/speechtotext/轉譯：transcribe），例如快速音訊或視訊轉譯或視訊翻譯。
批次轉譯：從多個 URL 或 Azure 容器將音訊檔案轉譯為批次。在您需要在記憶體中轉譯大量音訊的案例中，使用批次轉譯 API （/speechtotext/transcriptions：submit），例如大量檔案或長音訊檔案。
自定義語音：上傳您自己的數據、測試和定型自定義模型、比較模型之間的精確度，以及將模型部署至自定義端點。如果您想要讓同事能夠存取您所建置的模型，或想要將模型部署到多個區域，請將模型複製到其他訂用帳戶。

語音轉換文字 REST API 包含下列功能：

要求每個端點的記錄。
要求您所建立之模型的指令清單，以設定內部部署容器。
使用共用存取簽章（SAS） URI 從 Azure 記憶體帳戶上傳數據。
攜帶您自己的記憶體。使用您自己的記憶體帳戶來記錄、轉譯檔案和其他數據。
某些作業支援 Webhook 通知。您可以註冊傳送通知的 Webhook。

快速轉錄

下列作業群組適用於快速轉譯。

作業群組	描述
改編	使用轉錄 - 轉錄來轉錄音訊檔案。當您使用快速轉譯時，每個要求會傳送單一檔案。如需如何從單一音訊檔案建立轉譯的範例，請參閱建立轉譯。

批次轉錄

下列作業群組適用於批次轉譯。

作業群組	描述
模型	使用基底模型或自定義模型來轉譯音訊檔案。您可以使用模型搭配自訂語音和批次轉譯。例如，您可以使用以特定數據集定型的模型來轉譯音訊檔案。如需如何定型和管理自定義語音模型的範例，請參閱定型模型和自定義語音模型生命週期。
改編	使用轉譯 - 提交以轉譯記憶體中的大量音訊。當您使用批次轉譯時，每個要求會傳送多個檔案，或指向具有要轉譯音訊檔案的 Azure Blob 儲存體容器。如需如何從多個音訊檔案建立轉譯的範例，請參閱建立轉譯。
Webhook	使用 Web 攔截來接收有關建立、處理、完成和刪除事件的通知。您可以使用 Web 攔截搭配自訂語音和批次轉譯。 Web 勾點適用於數據集、端點、評估、模型和轉譯。

自訂語音

下列作業群組適用於自訂語音。

作業群組	描述
資料集	使用數據集來定型及測試自定義語音模型。例如，您可以將定型自定義語音與特定數據集的效能與基底模型或以不同數據集定型的自定義語音模型效能進行比較。如需如何上傳數據集的範例，請參閱上傳定型和測試數據集。
端點	將自訂語音模型部署至端點。您必須部署自定義端點，才能使用自訂語音模型。如需如何管理部署端點的範例，請參閱部署模型。
評估	使用評估來比較不同模型的效能。例如，您可以將定型為特定數據集的自定義語音模型效能與基底模型的效能或以不同數據集定型的自定義模型進行比較。如需如何測試及評估自定義語音模型的範例，請參閱測試辨識質量和測試精確度。
模型	使用基底模型或自定義模型來轉譯音訊檔案。您可以使用模型搭配自訂語音和批次轉譯。例如，您可以使用以特定數據集定型的模型來轉譯音訊檔案。如需如何定型和管理自定義語音模型的範例，請參閱定型模型和自定義語音模型生命週期。
Webhook	使用 Web 攔截來接收有關建立、處理、完成和刪除事件的通知。您可以使用 Web 攔截搭配自訂語音和批次轉譯。 Web 勾點適用於數據集、端點、評估、模型和轉譯。