你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

语音转文本 REST API

语音转文本 REST API 用于批量听录自定义语音识别

重要

语音转文本 REST API v3.2 以预览版提供。 语音转文本 REST API v3.1 已正式发布。 语音转文本 REST API v3.0 将于 2026 年 4 月 1 日停用。 有关详细信息,请参阅语音转文本 REST API v3.0 到 v3.1v3.1 到 v3.2 迁移指南。

使用语音转文本 REST API:

  • 自定义语音识别:使用自定义语音识别,可以上传自己的数据、测试和训练自定义模型、比较模型之间的准确度,以及将模型部署到自定义终结点。 在希望同事有权访问你生成的模型或希望将模型部署到多个区域的情况下,将模型复制到其他订阅。
  • 批量听录:从多个 URL 或 Azure 容器批量听录音频文件。

语音转文本 REST API 包括以下功能:

  • 获取每个终结点的日志(如果已请求该终结点的日志)。
  • 请求创建的模型的清单,以便设置本地容器。
  • 使用共享访问签名 (SAS) URI 从 Azure 存储帐户上传数据。
  • 自带存储空间。 针对日志、听录文件和其他数据使用自己的存储帐户。
  • 一些操作支持 Webhook 通知。 可以在发送通知的位置注册 Webhook。

数据集

数据集适用于自定义语音识别。 可以使用数据集来训练和测试不同模型的性能。 例如,可以将使用某个数据集训练的模型的性能与使用其他数据集训练的模型的性能进行比较。

有关如何上传数据集的示例,请参阅上传训练和测试数据集。 此表包含可以对数据集执行的所有操作。

路径 方法 版本 3.1 版本 3.0
/datasets GET Datasets_List GetDatasets
/datasets POST Datasets_Create CreateDataset
/datasets/{id} DELETE Datasets_Delete DeleteDataset
/datasets/{id} GET Datasets_Get GetDataset
/datasets/{id} 修补程序 Datasets_Update UpdateDataset
/datasets/{id}/blocks:commit POST Datasets_CommitBlocks 不适用
/datasets/{id}/blocks GET Datasets_GetBlocks 不适用
/datasets/{id}/blocks PUT Datasets_UploadBlock 不适用
/datasets/{id}/files GET Datasets_ListFiles GetDatasetFiles
/datasets/{id}/files/{fileId} GET Datasets_GetFile GetDatasetFile
/datasets/locales GET Datasets_ListSupportedLocales GetSupportedLocalesForDatasets
/datasets/upload POST Datasets_Upload UploadDatasetFromForm

终结点

终结点适用于自定义语音识别。 必须部署自定义终结点才能使用自定义语音识别模型。

有关如何管理部署终结点的示例,请参阅部署模型。 此表包含可以在终结点上执行的所有操作。

路径 方法 版本 3.1 版本 3.0
/endpoints GET Endpoints_List GetEndpoints
/endpoints POST Endpoints_Create CreateEndpoint
/endpoints/{id} DELETE Endpoints_Delete DeleteEndpoint
/endpoints/{id} GET Endpoints_Get GetEndpoint
/endpoints/{id} 修补程序 Endpoints_Update UpdateEndpoint
/endpoints/{id}/files/logs DELETE Endpoints_DeleteLogs DeleteEndpointLogs
/endpoints/{id}/files/logs GET Endpoints_ListLogs GetEndpointLogs
/endpoints/{id}/files/logs/{logId} DELETE Endpoints_DeleteLog DeleteEndpointLog
/endpoints/{id}/files/logs/{logId} GET Endpoints_GetLog GetEndpointLog
/endpoints/base/{locale}/files/logs DELETE Endpoints_DeleteBaseModelLogs DeleteBaseModelLogs
/endpoints/base/{locale}/files/logs GET Endpoints_ListBaseModelLogs GetBaseModelLogs
/endpoints/base/{locale}/files/logs/{logId} DELETE Endpoints_DeleteBaseModelLog DeleteBaseModelLog
/endpoints/base/{locale}/files/logs/{logId} GET Endpoints_GetBaseModelLog GetBaseModelLog
/endpoints/locales GET Endpoints_ListSupportedLocales GetSupportedLocalesForEndpoints

评估

评估适用于自定义语音识别。 可以使用评估来比较不同模型的性能。 例如,可以将使用某个数据集训练的模型的性能与使用其他数据集训练的模型的性能进行比较。

有关如何测试和评估自定义语音识别模型的示例,请参阅测试识别质量测试准确度。 此表包含可以对评估执行的所有操作。

路径 方法 版本 3.1 版本 3.0
/evaluations GET Evaluations_List GetEvaluations
/evaluations POST Evaluations_Create CreateEvaluation
/evaluations/{id} DELETE Evaluations_Delete DeleteEvaluation
/evaluations/{id} GET Evaluations_Get GetEvaluation
/evaluations/{id} 修补程序 Evaluations_Update UpdateEvaluation
/evaluations/{id}/files GET Evaluations_ListFiles GetEvaluationFiles
/evaluations/{id}/files/{fileId} GET Evaluations_GetFile GetEvaluationFile
/evaluations/locales GET Evaluations_ListSupportedLocales GetSupportedLocalesForEvaluations

运行状况

运行状况提供有关服务和子组件的整体运行状况的见解。

路径 方法 版本 3.1 版本 3.0
/healthstatus GET HealthStatus_Get GetHealthStatus

模型

模型适用于自定义语音识别批量听录。 可以使用模型来听录音频文件。 例如,可以使用经由特定数据集训练的模型来听录音频文件。

有关如何训练和管理自定义语音识别模型的示例,请参阅训练模型自定义语音识别模型生命周期。 此表包含可以对模型执行的所有操作。

路径 方法 版本 3.1 版本 3.0
/models GET Models_ListCustomModels GetModels
/models POST Models_Create CreateModel
/models/{id}:copyto1 POST Models_CopyTo CopyModelToSubscription
/models/{id} DELETE Models_Delete DeleteModel
/models/{id} GET Models_GetCustomModel GetModel
/models/{id} 修补程序 Models_Update UpdateModel
/models/{id}/files GET Models_ListFiles 不适用
/models/{id}/files/{fileId} GET Models_GetFile 不适用
/models/{id}/manifest GET Models_GetCustomModelManifest GetModelManifest
/models/base GET Models_ListBaseModels GetBaseModels
/models/base/{id} GET Models_GetBaseModel GetBaseModel
/models/base/{id}/manifest GET Models_GetBaseModelManifest GetBaseModelManifest
/models/locales GET Models_ListSupportedLocales GetSupportedLocalesForModels

项目

项目适用于自定义语音识别。 自定义语音识别项目包含模型、训练和测试数据集,以及部署终结点。 每个项目特定于某个区域设置。 例如,你可能会在美国创建一个语言为英语的项目。

有关如何创建项目的示例,请参阅创建项目。 此表包含可以对项目执行的所有操作。

路径 方法 版本 3.1 版本 3.0
/projects GET Projects_List GetProjects
/projects POST Projects_Create CreateProject
/projects/{id} DELETE Projects_Delete DeleteProject
/projects/{id} GET Projects_Get GetProject
/projects/{id} 修补程序 Projects_Update UpdateProject
/projects/{id}/datasets GET Projects_ListDatasets GetDatasetsForProject
/projects/{id}/endpoints GET Projects_ListEndpoints GetEndpointsForProject
/projects/{id}/evaluations GET Projects_ListEvaluations GetEvaluationsForProject
/projects/{id}/models GET Projects_ListModels GetModelsForProject
/projects/{id}/transcriptions GET Projects_ListTranscriptions GetTranscriptionsForProject
/projects/locales GET Projects_ListSupportedLocales GetSupportedProjectLocales

听录

听录适用于批量听录。 批量听录用于在存储中听录大量音频。 应为每个请求发送多个文件,或指向包含要听录的音频文件的 Azure Blob 存储容器。

有关如何从多个音频文件创建听录的示例,请参阅创建听录。 此表包含可以对听录执行的所有操作。

路径 方法 版本 3.1 版本 3.0
/transcriptions GET Transcriptions_List GetTranscriptions
/transcriptions POST Transcriptions_Create CreateTranscription
/transcriptions/{id} DELETE Transcriptions_Delete DeleteTranscription
/transcriptions/{id} GET Transcriptions_Get GetTranscription
/transcriptions/{id} 修补程序 Transcriptions_Update UpdateTranscription
/transcriptions/{id}/files GET Transcriptions_ListFiles GetTranscriptionFiles
/transcriptions/{id}/files/{fileId} GET Transcriptions_GetFile GetTranscriptionFile
/transcriptions/locales GET Transcriptions_ListSupportedLocales GetSupportedLocalesForTranscriptions

Webhook

Webhook 适用于自定义语音识别批量听录。 具体而言,Webhook 适用于数据集终结点评估模型听录。 Webhook 可用于接收有关创建、处理、完成和删除事件的通知。

此表包括语音转文本 REST API 提供的所有 Webhook 操作。

路径 方法 版本 3.1 版本 3.0
/webhooks GET WebHooks_List GetHooks
/webhooks POST WebHooks_Create CreateHook
/webhooks/{id}:ping1 POST WebHooks_Ping PingHook
/webhooks/{id}:test2 POST WebHooks_Test TestHook
/webhooks/{id} DELETE WebHooks_Delete DeleteHook
/webhooks/{id} GET WebHooks_Get GetHook
/webhooks/{id} 修补程序 WebHooks_Update UpdateHook

1 版本 3.0 中的 /webhooks/{id}/ping 操作(包括“/”)替换为版本 3.1 中的 /webhooks/{id}:ping 操作(包括“:”)。

2 版本 3.0 中的 /webhooks/{id}/test 操作(包括“/”)替换为版本 3.1 中的 /webhooks/{id}:test 操作(包括“:”)。

后续步骤