你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Datasets - Upload
上传数据并创建新的数据集。
POST {endpoint}/speechtotext/v3.2-preview.2/datasets/upload
URI 参数
名称 | 在 | 必需 | 类型 | 说明 |
---|---|---|---|---|
display
|
formData | True |
string |
此数据集的名称。 |
kind
|
formData | True |
string |
数据集的类型。 可能的值为“Language”、“Acoustic”、“发音”、“AudioFiles”、“LanguageMarkdown”、“OutputFormatting”。 |
locale
|
formData | True |
string |
此数据集的区域设置。 |
custom
|
formData |
string |
此实体的可选自定义属性。 允许的最大密钥长度为 64 个字符,允许的最大值长度为 256 个字符,允许的条目计数为 10。 |
|
data
|
formData |
file |
对于声学数据集,一个包含音频数据的 zip 文件和一个包含音频数据听录的文本文件。 对于语言数据集,是包含语言或发音数据的文本文件。 这两种情况都是必需的。 |
|
description
|
formData |
string |
此数据集的可选说明。 |
|
email
|
formData |
string |
一个可选字符串,其中包含在操作完成时要向其发送电子邮件通知的电子邮件地址。 成功发送电子邮件后,将删除该值。 |
|
project
|
formData |
string |
项目 URL 的可选字符串表示形式。 如果设置,数据集将与该项目关联。 |
|
endpoint
|
path | True |
string |
支持的认知服务终结点 (协议和主机名,例如: https://westus.api.cognitive.microsoft.com) 。 |
响应
名称 | 类型 | 说明 |
---|---|---|
201 Created |
响应包含有关实体作为有效负载及其作为标头的位置的信息。 标头 Location: string |
|
Other Status Codes |
出现了错误。 |
安全性
Ocp-Apim-Subscription-Key
在此处提供认知服务帐户密钥。
类型:
apiKey
在:
header
Authorization
提供此区域的 STS 返回的 JWT 的访问令牌。 通过将以下查询字符串添加到 STS URL,确保将管理范围添加到令牌:?scope=speechservicesmanagement
类型:
apiKey
在:
header
示例
Upload a dataset
示例请求
POST {endpoint}/speechtotext/v3.2-preview.2/datasets/upload
示例响应
Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2,
"duration": "PT4M12S"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
定义
名称 | 说明 |
---|---|
Dataset |
数据集 |
Dataset |
DatasetKind |
Dataset |
DatasetLinks |
Dataset |
DatasetProperties |
Detailed |
DetailedErrorCode |
Entity |
EntityError |
Entity |
EntityReference |
Error |
错误 |
Error |
ErrorCode |
Inner |
InnerError |
Status |
状态 |
Text |
TextNormalizationKind |
Dataset
数据集
名称 | 类型 | 说明 |
---|---|---|
contentUrl |
string |
数据集的数据的 URL。 |
createdDateTime |
string |
创建对象时的时间戳。 时间戳编码为 ISO 8601 日期和时间格式 (“YYYY-MM-DDThh:mm:ssZ”,请参阅 https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations) 。 |
customProperties |
object |
此实体的自定义属性。 允许的最大密钥长度为 64 个字符,允许的最大值长度为 256 个字符,允许的条目计数为 10。 |
description |
string |
对象的说明。 |
displayName |
string |
对象的显示名称。 |
kind |
DatasetKind |
|
lastActionDateTime |
string |
输入当前状态时的时间戳。 时间戳编码为 ISO 8601 日期和时间格式 (“YYYY-MM-DDThh:mm:ssZ”,请参阅 https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations) 。 |
links |
DatasetLinks |
|
locale |
string |
包含数据的区域设置。 |
project |
EntityReference |
|
properties |
DatasetProperties |
|
self |
string |
此实体的位置。 |
status |
状态 |
DatasetKind
DatasetKind
名称 | 类型 | 说明 |
---|---|---|
Acoustic |
string |
声学数据集。 |
AudioFiles |
string |
音频文件数据集。 |
Language |
string |
语言数据集。 |
LanguageMarkdown |
string |
语言 markdown 数据集。 |
OutputFormatting |
string |
数据集包含用于自定义反文本规范化、大写、重整、亵渎的规则,还定义数据集验证的测试 |
Pronunciation |
string |
发音数据集。 |
DatasetLinks
DatasetLinks
名称 | 类型 | 说明 |
---|---|---|
commitBlocks |
string |
使用块上传数据集时提交块列表的位置。 有关更多详细信息,请参阅操作“Datasets_CommitBlocks”。 |
files |
string |
获取此实体的所有文件的位置。 有关更多详细信息,请参阅操作“Datasets_ListFiles”。 |
listBlocks |
string |
使用块上传数据集时列出此实体已上载块的位置。 有关更多详细信息,请参阅操作“Datasets_GetBlocks”。 |
uploadBlocks |
string |
使用块上传数据集时要将块上传到的位置。 有关更多详细信息,请参阅操作“Datasets_UploadBlock”。 |
DatasetProperties
DatasetProperties
名称 | 类型 | 说明 |
---|---|---|
acceptedLineCount |
integer |
此数据集接受的行数。 |
duration |
string |
数据集包含音频文件时的总持续时间。 持续时间编码为 ISO 8601 持续时间 (“PnYnMnDTnHnMnS”,请参阅 https://en.wikipedia.org/wiki/ISO_8601#Durations) 。 |
string |
要向其发送电子邮件通知的电子邮件地址,以防操作完成。 成功发送电子邮件后,将删除该值。 |
|
error |
EntityError |
|
rejectedLineCount |
integer |
此数据集拒绝的行数。 |
textNormalizationKind |
TextNormalizationKind |
DetailedErrorCode
DetailedErrorCode
名称 | 类型 | 说明 |
---|---|---|
DataImportFailed |
string |
数据导入失败。 |
DeleteNotAllowed |
string |
不允许删除。 |
DeployNotAllowed |
string |
不允许部署。 |
DeployingFailedModel |
string |
部署失败的模型。 |
EmptyRequest |
string |
空请求。 |
EndpointCannotBeDefault |
string |
终结点不能为默认值。 |
EndpointNotUpdatable |
string |
终结点不可更新。 |
EndpointWithoutLogging |
string |
没有日志记录的终结点。 |
ExceededNumberOfRecordingsUris |
string |
已超出录制 URI 数。 |
FailedDataset |
string |
失败的数据集。 |
Forbidden |
string |
已禁止。 |
InUseViolation |
string |
在使用中冲突。 |
InaccessibleCustomerStorage |
string |
无法访问的客户存储。 |
InvalidAdaptationMapping |
string |
无效的适应映射。 |
InvalidBaseModel |
string |
基本模型无效。 |
InvalidCallbackUri |
string |
回调 URI 无效。 |
InvalidCollection |
string |
集合无效。 |
InvalidDataset |
string |
数据集无效。 |
InvalidDocument |
string |
无效的文档。 |
InvalidDocumentBatch |
string |
无效的文档批处理。 |
InvalidLocale |
string |
区域设置无效。 |
InvalidLogDate |
string |
日志日期无效。 |
InvalidLogEndTime |
string |
日志结束时间无效。 |
InvalidLogId |
string |
日志 ID 无效。 |
InvalidLogStartTime |
string |
日志开始时间无效。 |
InvalidModel |
string |
无效的模型。 |
InvalidModelUri |
string |
无效的模型 URI。 |
InvalidParameter |
string |
参数无效。 |
InvalidParameterValue |
string |
参数值无效。 |
InvalidPayload |
string |
有效负载无效。 |
InvalidPermissions |
string |
权限无效。 |
InvalidPrerequisite |
string |
先决条件无效。 |
InvalidProductId |
string |
产品 ID 无效。 |
InvalidProject |
string |
无效的项目。 |
InvalidProjectKind |
string |
无效的项目类型。 |
InvalidRecordingsUri |
string |
录制 URI 无效。 |
InvalidRequestBodyFormat |
string |
请求正文格式无效。 |
InvalidSasValidityDuration |
string |
sas 有效性持续时间无效。 |
InvalidSkipTokenForLogs |
string |
日志的跳过令牌无效。 |
InvalidSourceAzureResourceId |
string |
源 Azure 资源 ID 无效。 |
InvalidSubscription |
string |
订阅无效。 |
InvalidTest |
string |
测试无效。 |
InvalidTimeToLive |
string |
生存时间无效。 |
InvalidTopForLogs |
string |
日志顶部无效。 |
InvalidTranscription |
string |
听录无效。 |
InvalidWebHookEventKind |
string |
Web 挂钩事件类型无效。 |
MissingInputRecords |
string |
缺少输入记录。 |
ModelCopyOperationExists |
string |
模型复制操作存在。 |
ModelDeploymentNotCompleteState |
string |
模型部署未完成状态。 |
ModelDeprecated |
string |
模型已弃用。 |
ModelExists |
string |
模型存在。 |
ModelMismatch |
string |
模型不匹配。 |
ModelNotDeployable |
string |
模型不可部署。 |
ModelVersionIncorrect |
string |
模型版本不正确。 |
NoUtf8WithBom |
string |
没有带有 bom 的 utf8。 |
OnlyOneOfUrlsOrContainerOrDataset |
string |
只有一个 URL 或容器或数据集。 |
ProjectGenderMismatch |
string |
项目性别不匹配。 |
QuotaViolation |
string |
配额冲突。 |
SingleDefaultEndpoint |
string |
单个默认终结点。 |
SkuLimitsExist |
string |
存在 SKU 限制。 |
SubscriptionNotFound |
string |
找不到订阅。 |
UnexpectedError |
string |
意外错误。 |
UnsupportedClassBasedAdaptation |
string |
不支持的基于类的适应。 |
UnsupportedDelta |
string |
不支持的增量。 |
UnsupportedDynamicConfiguration |
string |
不支持的动态配置。 |
UnsupportedFilter |
string |
不支持的筛选器。 |
UnsupportedLanguageCode |
string |
不支持的语言代码。 |
UnsupportedOrderBy |
string |
不支持的订单依据。 |
UnsupportedPagination |
string |
不支持的分页。 |
UnsupportedTimeRange |
string |
不支持的时间范围。 |
EntityError
EntityError
名称 | 类型 | 说明 |
---|---|---|
code |
string |
此错误的代码。 |
message |
string |
此错误的消息。 |
EntityReference
EntityReference
名称 | 类型 | 说明 |
---|---|---|
self |
string |
引用的实体的位置。 |
Error
错误
名称 | 类型 | 说明 |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
有关错误和/或预期策略的其他支持详细信息。 |
innerError |
InnerError |
|
message |
string |
高级错误消息。 |
target |
string |
错误的源。 例如,如果文档无效,应为“文档”或“文档 ID”。 |
ErrorCode
ErrorCode
名称 | 类型 | 说明 |
---|---|---|
Conflict |
string |
表示冲突错误代码。 |
Forbidden |
string |
表示禁止的错误代码。 |
InternalCommunicationFailed |
string |
表示内部通信失败的错误代码。 |
InternalServerError |
string |
表示内部服务器错误代码。 |
InvalidArgument |
string |
表示无效的参数错误代码。 |
InvalidRequest |
string |
表示无效的请求错误代码。 |
NotAllowed |
string |
表示不允许的错误代码。 |
NotFound |
string |
表示找不到的错误代码。 |
PipelineError |
string |
表示管道错误代码。 |
ServiceUnavailable |
string |
表示服务不可用的错误代码。 |
TooManyRequests |
string |
表示请求过多的错误代码。 |
Unauthorized |
string |
表示未经授权的错误代码。 |
UnprocessableEntity |
string |
表示不可处理的实体错误代码。 |
UnsupportedMediaType |
string |
表示不受支持的媒体类型错误代码。 |
InnerError
InnerError
名称 | 类型 | 说明 |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
有关错误和/或预期策略的其他支持详细信息。 |
innerError |
InnerError |
|
message |
string |
高级错误消息。 |
target |
string |
错误的源。 例如,如果文档无效,应为“文档”或“文档 ID”。 |
Status
状态
名称 | 类型 | 说明 |
---|---|---|
Failed |
string |
长时间运行的操作失败。 |
NotStarted |
string |
长时间运行的操作尚未启动。 |
Running |
string |
长时间运行的操作当前正在处理中。 |
Succeeded |
string |
长时间运行的操作已成功完成。 |
TextNormalizationKind
TextNormalizationKind
名称 | 类型 | 说明 |
---|---|---|
Default |
string |
在 en-US) 中,默认文本规范化 (例如“2 to 3”将替换为“2 到 3”。 |
None |
string |
不会对输入文本应用任何文本规范化。 这是一个重写选项,仅在上传前规范化文本时才应使用。 |