Partilhar via


Datasets - Create

Carrega e cria um novo conjunto de dados ao obter os dados de um URL especificado ou começa a aguardar que os blocos de dados sejam carregados.

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

Parâmetros do URI

Name Em Necessário Tipo Description
endpoint
path True

string

Pontos finais dos Serviços Cognitivos suportados (protocolo e nome do anfitrião, por exemplo: https://westus.api.cognitive.microsoft.com).

Corpo do Pedido

Name Necessário Tipo Description
displayName True

string

O nome a apresentar do objeto.

kind True

DatasetKind

DatasetKind
Tipo de importação de dados.

locale True

string

A região dos dados contidos.

contentUrl

string

O URL dos dados do conjunto de dados.

customProperties

object

As propriedades personalizadas desta entidade. O comprimento máximo permitido da chave é de 64 carateres, o comprimento máximo permitido do valor é de 256 carateres e a contagem de entradas permitidas é de 10.

description

string

A descrição do objeto.

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

Respostas

Name Tipo Description
201 Created

Dataset

A resposta contém informações sobre a entidade como payload e a respetiva localização como cabeçalho.

Cabeçalhos

Location: string

Other Status Codes

Error

Ocorreu um erro.

Segurança

Ocp-Apim-Subscription-Key

Forneça a sua chave de conta dos serviços cognitivos aqui.

Tipo: apiKey
Em: header

Authorization

Forneça um token de acesso do JWT devolvido pelo STS desta região. Confirme que adiciona o âmbito de gestão ao token ao adicionar a seguinte cadeia de consulta ao URL de STS: ?scope=speechservicesmanagement

Tipo: apiKey
Em: header

Exemplos

Create a dataset with content url
Create dataset from data blocks

Create a dataset with content url

Pedido de amostra

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/location",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Resposta da amostra

Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
  },
  "properties": {
    "textNormalizationKind": "Default",
    "acceptedLineCount": 11,
    "rejectedLineCount": 2,
    "duration": "PT4M12S"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "Succeeded",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Create dataset from data blocks

Pedido de amostra

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Resposta da amostra

{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
    "commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
    "listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
    "uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "NotStarted",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Definições

Name Description
Dataset

Conjunto de dados

DatasetKind

DatasetKind

DatasetLinks

DatasetLinks

DatasetProperties

DatasetProperties

DetailedErrorCode

DetailedErrorCode

EntityError

EntityError

EntityReference

EntityReference

Error

Erro

ErrorCode

CódigoDoErro

InnerError

InnerError

Status

Estado

TextNormalizationKind

TextNormalizationKind

Dataset

Conjunto de dados

Name Tipo Description
contentUrl

string

O URL dos dados do conjunto de dados.

createdDateTime

string

O carimbo de data/hora quando o objeto foi criado. O carimbo de data/hora é codificado como formato de data e hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", consulte https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

customProperties

object

As propriedades personalizadas desta entidade. O comprimento máximo permitido da chave é de 64 carateres, o comprimento máximo permitido do valor é de 256 carateres e a contagem de entradas permitidas é de 10.

description

string

A descrição do objeto.

displayName

string

O nome a apresentar do objeto.

kind

DatasetKind

DatasetKind
Tipo de importação de dados.

lastActionDateTime

string

O carimbo de data/hora em que o estado atual foi introduzido. O carimbo de data/hora é codificado como formato de data e hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", consulte https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

links

DatasetLinks

DatasetLinks

locale

string

A região dos dados contidos.

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

self

string

A localização desta entidade.

status

Status

Estado
Descrever o estado atual da API

DatasetKind

DatasetKind

Name Tipo Description
Acoustic

string

Um conjunto de dados acústico.

AudioFiles

string

Um conjunto de dados de ficheiros de áudio.

Language

string

Um conjunto de dados de linguagem.

LanguageMarkdown

string

Um conjunto de dados de markdown de linguagem.

OutputFormatting

string

Conjunto de dados que contém regras para personalizar a normalização inversa de texto, a capitalização, a reformulação, a profanidade e também define testes para validação de conjuntos de dados

Pronunciation

string

Um conjunto de dados de pronúncia.

DatasetLinks

Name Tipo Description
commitBlocks

string

A localização para consolidar a lista de blocos ao carregar um conjunto de dados com blocos. Veja a operação "Datasets_CommitBlocks" para obter mais detalhes.

files

string

A localização para obter todos os ficheiros desta entidade. Veja a operação "Datasets_ListFiles" para obter mais detalhes.

listBlocks

string

A localização para listar os blocos já carregados desta entidade ao carregar um conjunto de dados com blocos. Veja a operação "Datasets_GetBlocks" para obter mais detalhes.

uploadBlocks

string

A localização para onde carregar blocos ao carregar um conjunto de dados com blocos. Veja a operação "Datasets_UploadBlock" para obter mais detalhes.

DatasetProperties

DatasetProperties

Name Tipo Description
acceptedLineCount

integer

O número de linhas aceites para este conjunto de dados.

duration

string

A duração total dos conjuntos de dados, se contiver ficheiros de áudio. A duração é codificada como duração ISO 8601 ("PnYnMnDTnHnMnS", consulte https://en.wikipedia.org/wiki/ISO_8601#Durations).

email

string

O endereço de e-mail para o qual enviar notificações por e-mail, caso a operação seja concluída. O valor será removido depois de enviar o e-mail com êxito.

error

EntityError

EntityError

rejectedLineCount

integer

O número de linhas rejeitadas para este conjunto de dados.

textNormalizationKind

TextNormalizationKind

TextNormalizationKind
O tipo de normalização de texto.

DetailedErrorCode

DetailedErrorCode

Name Tipo Description
DataImportFailed

string

Falha na importação de dados.

DeleteNotAllowed

string

A eliminação não é permitida.

DeployNotAllowed

string

A implementação não é permitida.

DeployingFailedModel

string

A implementar o modelo com falhas.

EmptyRequest

string

Pedido Vazio.

EndpointCannotBeDefault

string

O ponto final não pode ser predefinido.

EndpointNotUpdatable

string

Ponto final não atualizável.

EndpointWithoutLogging

string

Ponto final sem registo.

ExceededNumberOfRecordingsUris

string

Número excedido de uris de gravações.

FailedDataset

string

Conjunto de dados com falha.

Forbidden

string

Proibido.

InUseViolation

string

Violação de utilização.

InaccessibleCustomerStorage

string

Armazenamento inacessível do cliente.

InvalidAdaptationMapping

string

Mapeamento de adaptação inválido.

InvalidBaseModel

string

Modelo base inválido.

InvalidCallbackUri

string

URI de chamada de retorno inválido.

InvalidCollection

string

Coleção inválida.

InvalidDataset

string

Conjunto de dados inválido.

InvalidDocument

string

Documento inválido.

InvalidDocumentBatch

string

Lote de Documento inválido.

InvalidLocale

string

Região inválida.

InvalidLogDate

string

Data de registo inválida.

InvalidLogEndTime

string

Hora de fim de registo inválida.

InvalidLogId

string

ID de registo inválido.

InvalidLogStartTime

string

Hora de início de registo inválida.

InvalidModel

string

Modelo inválido.

InvalidModelUri

string

URI de modelo inválido.

InvalidParameter

string

Parâmetro inválido.

InvalidParameterValue

string

Valor de parâmetro inválido.

InvalidPayload

string

Payload inválido.

InvalidPermissions

string

Permissões inválidas.

InvalidPrerequisite

string

Pré-requisito inválido.

InvalidProductId

string

ID de produto inválido.

InvalidProject

string

Projeto inválido.

InvalidProjectKind

string

Tipo de projeto inválido.

InvalidRecordingsUri

string

URI de gravações inválido.

InvalidRequestBodyFormat

string

Formato de corpo do pedido inválido.

InvalidSasValidityDuration

string

Duração de validade sas inválida.

InvalidSkipTokenForLogs

string

Token de ignorar inválido para registos.

InvalidSourceAzureResourceId

string

ID de recurso do Azure de origem inválido.

InvalidSubscription

string

Subscrição inválida.

InvalidTest

string

Teste inválido.

InvalidTimeToLive

string

Tempo de vida inválido.

InvalidTopForLogs

string

Top inválido para registos.

InvalidTranscription

string

Transcrição inválida.

InvalidWebHookEventKind

string

Tipo de evento de web hook inválido.

MissingInputRecords

string

Registos de Entrada em Falta.

ModelCopyOperationExists

string

A operação de cópia de modelo existe.

ModelDeploymentNotCompleteState

string

A implementação do modelo não está concluída.

ModelDeprecated

string

Modelo preterido.

ModelExists

string

O modelo existe.

ModelMismatch

string

Erro de correspondência do modelo.

ModelNotDeployable

string

Modelo não implementável.

ModelVersionIncorrect

string

Versão do Modelo Incorreta.

NoUtf8WithBom

string

Não utf8 com bom.

OnlyOneOfUrlsOrContainerOrDataset

string

Apenas um dos URLs, contentor ou conjunto de dados.

ProjectGenderMismatch

string

Erro de correspondência de género do projeto.

QuotaViolation

string

Violação de quota.

SingleDefaultEndpoint

string

Ponto final predefinido único.

SkuLimitsExist

string

Existem limites de SKU.

SubscriptionNotFound

string

Subscrição não encontrada.

UnexpectedError

string

Erro inesperado.

UnsupportedClassBasedAdaptation

string

Adaptação baseada em classes não suportada.

UnsupportedDelta

string

Delta não suportado.

UnsupportedDynamicConfiguration

string

Configuração dinâmica não suportada.

UnsupportedFilter

string

Filtro não suportado.

UnsupportedLanguageCode

string

Código de idioma não suportado.

UnsupportedOrderBy

string

Encomenda não suportada por.

UnsupportedPagination

string

Paginação não suportada.

UnsupportedTimeRange

string

Intervalo de tempo não suportado.

EntityError

EntityError

Name Tipo Description
code

string

O código deste erro.

message

string

A mensagem para este erro.

EntityReference

EntityReference

Name Tipo Description
self

string

A localização da entidade referenciada.

Error

Erro

Name Tipo Description
code

ErrorCode

CódigoDoErro
Códigos de erro de alto nível.

details

Error[]

Detalhes de suporte adicionais sobre o erro e/ou as políticas esperadas.

innerError

InnerError

InnerError
Novo formato de Erro Interno em conformidade com as Diretrizes da API dos Serviços Cognitivos que estão disponíveis em https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Contém as propriedades necessárias ErrorCode, destino de mensagens e propriedades opcionais, detalhes (par de valores chave), erro interno (isto pode ser aninhado).

message

string

Mensagem de erro de alto nível.

target

string

A origem do erro. Por exemplo, seria "documentos" ou "ID do documento" em caso de documento inválido.

ErrorCode

CódigoDoErro

Name Tipo Description
Conflict

string

Representa o código de erro de conflito.

Forbidden

string

Representa o código de erro proibido.

InternalCommunicationFailed

string

A representação do código de erro falha na comunicação interna.

InternalServerError

string

Representa o código de erro interno do servidor.

InvalidArgument

string

Representa o código de erro de argumento inválido.

InvalidRequest

string

Representa o código de erro de pedido inválido.

NotAllowed

string

Representa o código de erro não permitido.

NotFound

string

Representa o código de erro não encontrado.

PipelineError

string

Representa o código de erro do pipeline.

ServiceUnavailable

string

Representa o código de erro serviço indisponível.

TooManyRequests

string

Representa o código de erro demasiados pedidos.

Unauthorized

string

Representa o código de erro não autorizado.

UnprocessableEntity

string

Representa o código de erro de entidade não processada.

UnsupportedMediaType

string

Representa o código de erro do tipo de suporte de dados não suportado.

InnerError

InnerError

Name Tipo Description
code

DetailedErrorCode

DetailedErrorCode
Enumeração detalhada do código de erro.

details

object

Detalhes de suporte adicionais sobre o erro e/ou as políticas esperadas.

innerError

InnerError

InnerError
Novo formato de Erro Interno em conformidade com as Diretrizes da API dos Serviços Cognitivos que estão disponíveis em https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Contém as propriedades necessárias ErrorCode, destino de mensagens e propriedades opcionais, detalhes (par de valores chave), erro interno (isto pode ser aninhado).

message

string

Mensagem de erro de alto nível.

target

string

A origem do erro. Por exemplo, seria "documentos" ou "ID do documento" em caso de documento inválido.

Status

Estado

Name Tipo Description
Failed

string

A operação de execução prolongada falhou.

NotStarted

string

A operação de execução prolongada ainda não foi iniciada.

Running

string

A operação de execução prolongada está atualmente a ser processada.

Succeeded

string

A operação de execução prolongada foi concluída com êxito.

TextNormalizationKind

TextNormalizationKind

Name Tipo Description
Default

string

A normalização de texto predefinida (por exemplo, "2 a 3" é substituída por "dois a três" em en-US).

None

string

Não será aplicada normalização de texto ao texto de entrada. Esta é uma opção de substituição que só deve ser utilizada quando o texto é normalizado antes do carregamento.