Delen via


Datasets - Upload

Hiermee worden gegevens geüpload en wordt een nieuwe gegevensset gemaakt.

POST {endpoint}/speechtotext/v3.2/datasets/upload

URI-parameters

Name In Vereist Type Description
displayName
formData True

string

De naam van deze gegevensset.

kind
formData True

string

Het type gegevensset. Mogelijke waarden zijn 'Language', 'Acoustic', 'Pronunciation', 'AudioFiles', 'LanguageMarkdown', 'OutputFormatting'.

locale
formData True

string

De landinstelling van deze gegevensset.

customProperties
formData

string

De optionele aangepaste eigenschappen van deze entiteit. De maximaal toegestane sleutellengte is 64 tekens, de maximaal toegestane waardelengte is 256 tekens en het aantal toegestane vermeldingen is 10.

data
formData

file

Voor akoestische gegevenssets: een zip-bestand met de audiogegevens en een tekstbestand met de transcripties voor de audiogegevens. Voor taalgegevenssets: een tekstbestand met de taal- of uitspraakgegevens. In beide gevallen vereist.

description
formData

string

Optionele beschrijving van deze gegevensset.

email
formData

string

Een optionele tekenreeks met het e-mailadres waarnaar e-mailmeldingen moeten worden verzonden voor het geval de bewerking is voltooid. De waarde wordt verwijderd nadat het e-mailbericht is verzonden.

project
formData

string

De optionele tekenreeksweergave van de URL van een project. Als dit is ingesteld, wordt de gegevensset gekoppeld aan dat project.

endpoint
path True

string

Ondersteunde Cognitive Services-eindpunten (protocol en hostnaam, bijvoorbeeld: https://westus.api.cognitive.microsoft.com).

Antwoorden

Name Type Description
201 Created

Dataset

Het antwoord bevat informatie over de entiteit als nettolading en de locatie als header.

Kopteksten

Location: string

Other Status Codes

Error

Er is een fout opgetreden.

Beveiliging

Ocp-Apim-Subscription-Key

Geef hier de sleutel van uw Cognitive Services-account op.

Type: apiKey
In: header

Authorization

Geef een toegangstoken op van de JWT die wordt geretourneerd door de STS van deze regio. Zorg ervoor dat u het beheerbereik toevoegt aan het token door de volgende querytekenreeks toe te voegen aan de STS-URL: ?scope=speechservicesmanagement

Type: apiKey
In: header

Voorbeelden

Upload a dataset

Voorbeeldaanvraag

POST {endpoint}/speechtotext/v3.2/datasets/upload

Voorbeeldrespons

Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
  },
  "properties": {
    "textNormalizationKind": "Default",
    "acceptedLineCount": 11,
    "rejectedLineCount": 2,
    "duration": "PT4M12S"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "Succeeded",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Definities

Name Description
Dataset

Gegevensset

DatasetKind

DatasetKind

DatasetLinks

DatasetLinks

DatasetProperties

GegevenssetEigenschappen

DetailedErrorCode

DetailedErrorCode

EntityError

EntityError

EntityReference

EntityReference

Error

Fout

ErrorCode

ErrorCode

InnerError

InnerError

Status

Status

TextNormalizationKind

TextNormalizationKind

Dataset

Gegevensset

Name Type Description
contentUrl

string

De URL van de gegevens voor de gegevensset.

createdDateTime

string

De tijdstempel waarop het object is gemaakt. De tijdstempel is gecodeerd als ISO 8601-datum- en tijdnotatie ('JJJJ-MM-DDThh:mm:ssZ', zie https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

customProperties

object

De aangepaste eigenschappen van deze entiteit. De maximaal toegestane sleutellengte is 64 tekens, de maximaal toegestane waardelengte is 256 tekens en het aantal toegestane vermeldingen is 10.

description

string

De beschrijving van het object.

displayName

string

De weergavenaam van het object.

kind

DatasetKind

DatasetKind
Type gegevensimport.

lastActionDateTime

string

Het tijdstempel waarop de huidige status is ingevoerd. De tijdstempel is gecodeerd als ISO 8601-datum- en tijdnotatie ('JJJJ-MM-DDThh:mm:ssZ', zie https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

links

DatasetLinks

DatasetLinks

locale

string

De landinstelling van de ingesloten gegevens.

project

EntityReference

EntityReference

properties

DatasetProperties

GegevenssetEigenschappen

self

string

De locatie van deze entiteit.

status

Status

Status
Beschrijf de huidige status van de API.

DatasetKind

DatasetKind

Name Type Description
Acoustic

string

Een akoestische gegevensset.

AudioFiles

string

Een gegevensset met audiobestanden.

Language

string

Een taalgegevensset.

LanguageMarkdown

string

Een Markdown-gegevensset voor de taal.

OutputFormatting

string

Gegevensset met regels voor het aanpassen van inverse tekstnormalisatie, hoofdlettergebruik, herformulering, scheldwoorden en definieert ook tests voor gegevenssetvalidatie

Pronunciation

string

Een uitspraakgegevensset.

DatasetLinks

Name Type Description
commitBlocks

string

De locatie voor het doorvoeren van de lijst met blokken bij het uploaden van een gegevensset met behulp van blokken. Zie bewerking 'Datasets_CommitBlocks' voor meer informatie.

files

string

De locatie voor het ophalen van alle bestanden van deze entiteit. Zie bewerking 'Datasets_ListFiles' voor meer informatie.

listBlocks

string

De locatie voor het weergeven van de reeds geüploade blokken van deze entiteit bij het uploaden van een gegevensset met behulp van blokken. Zie bewerking 'Datasets_GetBlocks' voor meer informatie.

uploadBlocks

string

De locatie waarnaar u blokken wilt uploaden bij het uploaden van een gegevensset met behulp van blokken. Zie bewerking 'Datasets_UploadBlock' voor meer informatie.

DatasetProperties

GegevenssetEigenschappen

Name Type Description
acceptedLineCount

integer

Het aantal regels dat voor deze gegevensset is geaccepteerd.

duration

string

De totale duur van de gegevenssets als deze audiobestanden bevatten. De duur is gecodeerd als ISO 8601-duur ('PnYnMnDTnHnMnS', zie https://en.wikipedia.org/wiki/ISO_8601#Durations).

email

string

Het e-mailadres waarnaar u e-mailmeldingen wilt verzenden als de bewerking is voltooid. De waarde wordt verwijderd nadat het e-mailbericht is verzonden.

error

EntityError

EntityError

rejectedLineCount

integer

Het aantal regels dat is geweigerd voor deze gegevensset.

textNormalizationKind

TextNormalizationKind

TextNormalizationKind
Het soort tekstnormalisatie.

DetailedErrorCode

DetailedErrorCode

Name Type Description
DataImportFailed

string

Het importeren van gegevens is mislukt.

DeleteNotAllowed

string

Verwijderen is niet toegestaan.

DeployNotAllowed

string

Implementeren is niet toegestaan.

DeployingFailedModel

string

Het implementeren van een mislukt model.

EmptyRequest

string

Lege aanvraag.

EndpointCannotBeDefault

string

Eindpunt kan niet standaard zijn.

EndpointNotUpdatable

string

Eindpunt kan niet worden bijgewerkt.

EndpointWithoutLogging

string

Eindpunt zonder logboekregistratie.

ExceededNumberOfRecordingsUris

string

Het aantal opnamen is overschreden.

FailedDataset

string

Mislukte gegevensset.

Forbidden

string

Verboden.

InUseViolation

string

In gebruiksovertreding.

InaccessibleCustomerStorage

string

Niet-toegankelijke klantopslag.

InvalidAdaptationMapping

string

Ongeldige aanpassingstoewijzing.

InvalidBaseModel

string

Ongeldig basismodel.

InvalidCallbackUri

string

Ongeldige callback-URI.

InvalidChannels

string

Ongeldige kanalen.

InvalidCollection

string

Ongeldige verzameling.

InvalidDataset

string

Ongeldige gegevensset.

InvalidDocument

string

Ongeldig document.

InvalidDocumentBatch

string

Ongeldige documentbatch.

InvalidLocale

string

Ongeldige landinstelling.

InvalidLogDate

string

Ongeldige logboekdatum.

InvalidLogEndTime

string

Ongeldige eindtijd van logboek.

InvalidLogId

string

Ongeldige logboek-id.

InvalidLogStartTime

string

Ongeldige begintijd van logboek.

InvalidModel

string

Ongeldig model.

InvalidModelUri

string

Ongeldige model-URI.

InvalidParameter

string

Ongeldige parameter.

InvalidParameterValue

string

Ongeldige parameterwaarde.

InvalidPayload

string

Ongeldige nettolading.

InvalidPermissions

string

Ongeldige machtigingen.

InvalidPrerequisite

string

Ongeldige vereiste.

InvalidProductId

string

Ongeldige product-id.

InvalidProject

string

Ongeldig project.

InvalidProjectKind

string

Ongeldige projectsoort.

InvalidRecordingsUri

string

Ongeldige URI voor opnamen.

InvalidRequestBodyFormat

string

Ongeldige indeling van aanvraagbody.

InvalidSasValidityDuration

string

Ongeldige geldigheidsduur sas.

InvalidSkipTokenForLogs

string

Ongeldig token voor overslaan voor logboeken.

InvalidSourceAzureResourceId

string

Ongeldige bron-id van Azure-resource.

InvalidSubscription

string

Ongeldig abonnement.

InvalidTest

string

Ongeldige test.

InvalidTimeToLive

string

Ongeldige time to live.

InvalidTopForLogs

string

Ongeldige bovenkant voor logboeken.

InvalidTranscription

string

Ongeldige transcriptie.

InvalidWebHookEventKind

string

Ongeldig soort webhook gebeurtenis.

MissingInputRecords

string

Ontbrekende invoerrecords.

ModelCopyAuthorizationExpired

string

Verlopen ModelCopyAuthorization.

ModelDeploymentNotCompleteState

string

De status modelimplementatie is niet voltooid.

ModelDeprecated

string

Het model is afgeschaft.

ModelExists

string

Het model bestaat.

ModelMismatch

string

Model komt niet overeen.

ModelNotDeployable

string

Het model kan niet worden geïmplementeerd.

ModelVersionIncorrect

string

Modelversie onjuist.

NoUtf8WithBom

string

Geen utf8 met bom.

OnlyOneOfUrlsOrContainerOrDataset

string

Slechts één van de URL's of container of gegevensset.

ProjectGenderMismatch

string

Het geslacht van het project komt niet overeen.

QuotaViolation

string

Quotumschending.

SingleDefaultEndpoint

string

Eén standaardeindpunt.

SkuLimitsExist

string

Er bestaan SKU-limieten.

SubscriptionNotFound

string

Kan het abonnement niet vinden.

UnexpectedError

string

Onverwachte fout.

UnsupportedClassBasedAdaptation

string

Niet-ondersteunde aanpassing op basis van klassen.

UnsupportedDelta

string

Niet-ondersteunde delta.

UnsupportedDynamicConfiguration

string

Niet-ondersteunde dynamische configuratie.

UnsupportedFilter

string

Niet-ondersteund filter.

UnsupportedLanguageCode

string

Niet-ondersteunde taalcode.

UnsupportedOrderBy

string

Niet-ondersteunde bestelling door.

UnsupportedPagination

string

Niet-ondersteunde paginering.

UnsupportedTimeRange

string

Niet-ondersteund tijdsbereik.

EntityError

EntityError

Name Type Description
code

string

De code van deze fout.

message

string

Het bericht voor deze fout.

EntityReference

EntityReference

Name Type Description
self

string

De locatie van de entiteit waarnaar wordt verwezen.

Error

Fout

Name Type Description
code

ErrorCode

ErrorCode
Foutcodes op hoog niveau.

details

Error[]

Aanvullende ondersteunende informatie met betrekking tot de fout en/of het verwachte beleid.

innerError

InnerError

InnerError
Nieuwe indeling voor interne fouten die voldoet aan de Api-richtlijnen voor Cognitive Services die beschikbaar zijn op https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Dit bevat de vereiste eigenschappen ErrorCode, bericht en optionele eigenschappen doel, details (sleutelwaardepaar), interne fout (dit kan worden genest).

message

string

Foutbericht op hoog niveau.

target

string

De bron van de fout. Dit is bijvoorbeeld 'documenten' of 'document-id' in het geval van een ongeldig document.

ErrorCode

ErrorCode

Name Type Description
Conflict

string

Vertegenwoordigt de conflictfoutcode.

Forbidden

string

Vertegenwoordigt de verboden foutcode.

InternalCommunicationFailed

string

De foutcode voor de interne communicatie is mislukt.

InternalServerError

string

Vertegenwoordigt de foutcode van de interne serverfout.

InvalidArgument

string

Vertegenwoordigt de foutcode van het ongeldige argument.

InvalidRequest

string

Vertegenwoordigt de ongeldige aanvraagfoutcode.

NotAllowed

string

Vertegenwoordigt de niet-toegestane foutcode.

NotFound

string

Deze vertegenwoordigt de foutcode niet gevonden.

PipelineError

string

Vertegenwoordigt de foutcode van de pijplijnfout.

ServiceUnavailable

string

De foutcode voor de service is niet beschikbaar.

TooManyRequests

string

Vertegenwoordigt de foutcode voor te veel aanvragen.

Unauthorized

string

Vertegenwoordigt de foutcode voor onbevoegden.

UnprocessableEntity

string

Vertegenwoordigt de foutcode van de niet-verwerkbare entiteit.

UnsupportedMediaType

string

Vertegenwoordigt de foutcode van het niet-ondersteunde mediatype.

InnerError

InnerError

Name Type Description
code

DetailedErrorCode

DetailedErrorCode
Gedetailleerde foutcode- enum.

details

object

Aanvullende ondersteunende informatie met betrekking tot de fout en/of het verwachte beleid.

innerError

InnerError

InnerError
Nieuwe indeling voor interne fouten die voldoet aan de Api-richtlijnen voor Cognitive Services die beschikbaar zijn op https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Dit bevat de vereiste eigenschappen ErrorCode, bericht en optionele eigenschappen doel, details (sleutelwaardepaar), interne fout (dit kan worden genest).

message

string

Foutbericht op hoog niveau.

target

string

De bron van de fout. Dit is bijvoorbeeld 'documenten' of 'document-id' in het geval van een ongeldig document.

Status

Status

Name Type Description
Failed

string

De langdurige bewerking is mislukt.

NotStarted

string

De langdurige bewerking is nog niet gestart.

Running

string

De langdurige bewerking wordt momenteel verwerkt.

Succeeded

string

De langdurige bewerking is voltooid.

TextNormalizationKind

TextNormalizationKind

Name Type Description
Default

string

Standaardtekstnormalisatie (bijvoorbeeld '2 tot 3' wordt vervangen door 'twee tot drie' in en-US).

None

string

Er wordt geen tekstnormalisatie toegepast op de invoertekst. Dit is een onderdrukkingsoptie die alleen moet worden gebruikt wanneer tekst vóór het uploaden wordt genormaliseerd.