你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
语音转文本 REST API
语音转文本 REST API 用于批量听录和自定义语音识别。
重要
语音转文本 REST API v3.2 以预览版提供。 语音转文本 REST API v3.1 已正式发布。 语音转文本 REST API v3.0 将于 2026 年 4 月 1 日停用。 有关详细信息,请参阅语音转文本 REST API v3.0 到 v3.1 和 v3.1 到 v3.2 迁移指南。
使用语音转文本 REST API:
- 自定义语音识别:使用自定义语音识别,可以上传自己的数据、测试和训练自定义模型、比较模型之间的准确度,以及将模型部署到自定义终结点。 在希望同事有权访问你生成的模型或希望将模型部署到多个区域的情况下,将模型复制到其他订阅。
- 批量听录:从多个 URL 或 Azure 容器批量听录音频文件。
语音转文本 REST API 包括以下功能:
- 获取每个终结点的日志(如果已请求该终结点的日志)。
- 请求创建的模型的清单,以便设置本地容器。
- 使用共享访问签名 (SAS) URI 从 Azure 存储帐户上传数据。
- 自带存储空间。 针对日志、听录文件和其他数据使用自己的存储帐户。
- 一些操作支持 Webhook 通知。 可以在发送通知的位置注册 Webhook。
数据集
数据集适用于自定义语音识别。 可以使用数据集来训练和测试不同模型的性能。 例如,可以将使用某个数据集训练的模型的性能与使用其他数据集训练的模型的性能进行比较。
有关如何上传数据集的示例,请参阅上传训练和测试数据集。 此表包含可以对数据集执行的所有操作。
路径 | 方法 | 版本 3.1 | 版本 3.0 |
---|---|---|---|
/datasets |
GET | Datasets_List | GetDatasets |
/datasets |
POST | Datasets_Create | CreateDataset |
/datasets/{id} |
DELETE | Datasets_Delete | DeleteDataset |
/datasets/{id} |
GET | Datasets_Get | GetDataset |
/datasets/{id} |
修补程序 | Datasets_Update | UpdateDataset |
/datasets/{id}/blocks:commit |
POST | Datasets_CommitBlocks | 不适用 |
/datasets/{id}/blocks |
GET | Datasets_GetBlocks | 不适用 |
/datasets/{id}/blocks |
PUT | Datasets_UploadBlock | 不适用 |
/datasets/{id}/files |
GET | Datasets_ListFiles | GetDatasetFiles |
/datasets/{id}/files/{fileId} |
GET | Datasets_GetFile | GetDatasetFile |
/datasets/locales |
GET | Datasets_ListSupportedLocales | GetSupportedLocalesForDatasets |
/datasets/upload |
POST | Datasets_Upload | UploadDatasetFromForm |
终结点
终结点适用于自定义语音识别。 必须部署自定义终结点才能使用自定义语音识别模型。
有关如何管理部署终结点的示例,请参阅部署模型。 此表包含可以在终结点上执行的所有操作。
评估
评估适用于自定义语音识别。 可以使用评估来比较不同模型的性能。 例如,可以将使用某个数据集训练的模型的性能与使用其他数据集训练的模型的性能进行比较。
有关如何测试和评估自定义语音识别模型的示例,请参阅测试识别质量和测试准确度。 此表包含可以对评估执行的所有操作。
路径 | 方法 | 版本 3.1 | 版本 3.0 |
---|---|---|---|
/evaluations |
GET | Evaluations_List | GetEvaluations |
/evaluations |
POST | Evaluations_Create | CreateEvaluation |
/evaluations/{id} |
DELETE | Evaluations_Delete | DeleteEvaluation |
/evaluations/{id} |
GET | Evaluations_Get | GetEvaluation |
/evaluations/{id} |
修补程序 | Evaluations_Update | UpdateEvaluation |
/evaluations/{id}/files |
GET | Evaluations_ListFiles | GetEvaluationFiles |
/evaluations/{id}/files/{fileId} |
GET | Evaluations_GetFile | GetEvaluationFile |
/evaluations/locales |
GET | Evaluations_ListSupportedLocales | GetSupportedLocalesForEvaluations |
运行状况
运行状况提供有关服务和子组件的整体运行状况的见解。
路径 | 方法 | 版本 3.1 | 版本 3.0 |
---|---|---|---|
/healthstatus |
GET | HealthStatus_Get | GetHealthStatus |
模型
模型适用于自定义语音识别和批量听录。 可以使用模型来听录音频文件。 例如,可以使用经由特定数据集训练的模型来听录音频文件。
有关如何训练和管理自定义语音识别模型的示例,请参阅训练模型和自定义语音识别模型生命周期。 此表包含可以对模型执行的所有操作。
路径 | 方法 | 版本 3.1 | 版本 3.0 |
---|---|---|---|
/models |
GET | Models_ListCustomModels | GetModels |
/models |
POST | Models_Create | CreateModel |
/models/{id}:copyto 1 |
POST | Models_CopyTo | CopyModelToSubscription |
/models/{id} |
DELETE | Models_Delete | DeleteModel |
/models/{id} |
GET | Models_GetCustomModel | GetModel |
/models/{id} |
修补程序 | Models_Update | UpdateModel |
/models/{id}/files |
GET | Models_ListFiles | 不适用 |
/models/{id}/files/{fileId} |
GET | Models_GetFile | 不适用 |
/models/{id}/manifest |
GET | Models_GetCustomModelManifest | GetModelManifest |
/models/base |
GET | Models_ListBaseModels | GetBaseModels |
/models/base/{id} |
GET | Models_GetBaseModel | GetBaseModel |
/models/base/{id}/manifest |
GET | Models_GetBaseModelManifest | GetBaseModelManifest |
/models/locales |
GET | Models_ListSupportedLocales | GetSupportedLocalesForModels |
项目
项目适用于自定义语音识别。 自定义语音识别项目包含模型、训练和测试数据集,以及部署终结点。 每个项目特定于某个区域设置。 例如,你可能会在美国创建一个语言为英语的项目。
有关如何创建项目的示例,请参阅创建项目。 此表包含可以对项目执行的所有操作。
路径 | 方法 | 版本 3.1 | 版本 3.0 |
---|---|---|---|
/projects |
GET | Projects_List | GetProjects |
/projects |
POST | Projects_Create | CreateProject |
/projects/{id} |
DELETE | Projects_Delete | DeleteProject |
/projects/{id} |
GET | Projects_Get | GetProject |
/projects/{id} |
修补程序 | Projects_Update | UpdateProject |
/projects/{id}/datasets |
GET | Projects_ListDatasets | GetDatasetsForProject |
/projects/{id}/endpoints |
GET | Projects_ListEndpoints | GetEndpointsForProject |
/projects/{id}/evaluations |
GET | Projects_ListEvaluations | GetEvaluationsForProject |
/projects/{id}/models |
GET | Projects_ListModels | GetModelsForProject |
/projects/{id}/transcriptions |
GET | Projects_ListTranscriptions | GetTranscriptionsForProject |
/projects/locales |
GET | Projects_ListSupportedLocales | GetSupportedProjectLocales |
听录
听录适用于批量听录。 批量听录用于在存储中听录大量音频。 应为每个请求发送多个文件,或指向包含要听录的音频文件的 Azure Blob 存储容器。
有关如何从多个音频文件创建听录的示例,请参阅创建听录。 此表包含可以对听录执行的所有操作。
路径 | 方法 | 版本 3.1 | 版本 3.0 |
---|---|---|---|
/transcriptions |
GET | Transcriptions_List | GetTranscriptions |
/transcriptions |
POST | Transcriptions_Create | CreateTranscription |
/transcriptions/{id} |
DELETE | Transcriptions_Delete | DeleteTranscription |
/transcriptions/{id} |
GET | Transcriptions_Get | GetTranscription |
/transcriptions/{id} |
修补程序 | Transcriptions_Update | UpdateTranscription |
/transcriptions/{id}/files |
GET | Transcriptions_ListFiles | GetTranscriptionFiles |
/transcriptions/{id}/files/{fileId} |
GET | Transcriptions_GetFile | GetTranscriptionFile |
/transcriptions/locales |
GET | Transcriptions_ListSupportedLocales | GetSupportedLocalesForTranscriptions |
Webhook
Webhook 适用于自定义语音识别和批量听录。 具体而言,Webhook 适用于数据集、终结点、评估、模型和听录。 Webhook 可用于接收有关创建、处理、完成和删除事件的通知。
此表包括语音转文本 REST API 提供的所有 Webhook 操作。
路径 | 方法 | 版本 3.1 | 版本 3.0 |
---|---|---|---|
/webhooks |
GET | WebHooks_List | GetHooks |
/webhooks |
POST | WebHooks_Create | CreateHook |
/webhooks/{id}:ping 1 |
POST | WebHooks_Ping | PingHook |
/webhooks/{id}:test 2 |
POST | WebHooks_Test | TestHook |
/webhooks/{id} |
DELETE | WebHooks_Delete | DeleteHook |
/webhooks/{id} |
GET | WebHooks_Get | GetHook |
/webhooks/{id} |
修补程序 | WebHooks_Update | UpdateHook |
1 版本 3.0 中的 /webhooks/{id}/ping
操作(包括“/”)替换为版本 3.1 中的 /webhooks/{id}:ping
操作(包括“:”)。
2 版本 3.0 中的 /webhooks/{id}/test
操作(包括“/”)替换为版本 3.1 中的 /webhooks/{id}:test
操作(包括“:”)。