Datasets - Create
Lädt ein neues Dataset hoch und erstellt es, indem die Daten aus einer angegebenen URL abgerufen oder gestartet werden, bis Datenblöcke hochgeladen werden.
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
URI-Parameter
| Name | In | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
Unterstützte Cognitive Services-Endpunkte (Protokoll und Hostname, z. B. https://westus.api.cognitive.microsoft.com). |
Anforderungstext
| Name | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| displayName | True |
string minLength: 1 |
Der Anzeigename des Objekts. |
| kind | True |
DatasetKind |
|
| locale | True |
string minLength: 1 |
Das Gebietsschema der enthaltenen Daten. |
| contentUrl |
string (uri) |
Die URL der Daten für das Dataset. |
|
| customProperties |
object |
Die benutzerdefinierten Eigenschaften dieser Entität. Die maximal zulässige Schlüssellänge beträgt 64 Zeichen, die maximal zulässige Wertlänge beträgt 256 Zeichen und die Anzahl zulässiger Einträge beträgt 10. |
|
| description |
string |
Die Beschreibung des Objekts. |
|
| project |
EntityReference |
||
| properties |
DatasetProperties |
Antworten
| Name | Typ | Beschreibung |
|---|---|---|
| 201 Created |
Die Antwort enthält Informationen zur Entität als Nutzlast und deren Position als Header. Header Location: string |
|
| Other Status Codes |
Ein Fehler ist aufgetreten. |
Sicherheit
Ocp-Apim-Subscription-Key
Stellen Sie hier Ihren kognitiven Leistungskontoschlüssel bereit.
Typ:
apiKey
In:
header
Authorization
Stellen Sie ein Zugriffstoken von JWT bereit, das vom STS dieser Region zurückgegeben wird. Stellen Sie sicher, dass Sie dem Token den Verwaltungsbereich hinzufügen, indem Sie der STS-URL die folgende Abfragezeichenfolge hinzufügen: ?scope=speechservicesmanagement
Typ:
apiKey
In:
header
Beispiele
| Create a dataset with content url |
| Create dataset from data blocks |
Create a dataset with content url
Beispielanforderung
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
{
"kind": "Acoustic",
"contentUrl": "https://contoso.com/location",
"locale": "en-US",
"displayName": "My speech dataset name",
"description": "My speech dataset description"
}
Beispiel für eine Antwort
Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2,
"duration": "PT4M12S"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Create dataset from data blocks
Beispielanforderung
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
{
"kind": "Acoustic",
"locale": "en-US",
"displayName": "My speech dataset name",
"description": "My speech dataset description"
}
Beispiel für eine Antwort
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
"commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
"listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
"uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "NotStarted",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Definitionen
| Name | Beschreibung |
|---|---|
| Dataset |
Datensatz |
|
Dataset |
DatasetKind |
|
Dataset |
DatasetLinks |
|
Dataset |
DatasetProperties |
|
Detailed |
DetailedErrorCode |
|
Entity |
EntityError |
|
Entity |
EntityReference |
| Error |
Fehler |
|
Error |
Fehlercode |
|
Inner |
InnerError |
| Status |
Status |
|
Text |
TextNormalizationKind |
Dataset
Datensatz
| Name | Typ | Beschreibung |
|---|---|---|
| contentUrl |
string (uri) |
Die URL der Daten für das Dataset. |
| createdDateTime |
string (date-time) |
Der Zeitstempel, zu dem das Objekt erstellt wurde. Der Zeitstempel wird als ISO 8601-Datums- und Uhrzeitformat codiert ("JJJJ-MM-DDThh:mm:ssZ", siehe https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
| customProperties |
object |
Die benutzerdefinierten Eigenschaften dieser Entität. Die maximal zulässige Schlüssellänge beträgt 64 Zeichen, die maximal zulässige Wertlänge beträgt 256 Zeichen und die Anzahl zulässiger Einträge beträgt 10. |
| description |
string |
Die Beschreibung des Objekts. |
| displayName |
string minLength: 1 |
Der Anzeigename des Objekts. |
| kind |
DatasetKind |
|
| lastActionDateTime |
string (date-time) |
Der Zeitstempel, zu dem der aktuelle Status eingegeben wurde. Der Zeitstempel wird als ISO 8601-Datums- und Uhrzeitformat codiert ("JJJJ-MM-DDThh:mm:ssZ", siehe https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
| links |
DatasetLinks |
|
| locale |
string minLength: 1 |
Das Gebietsschema der enthaltenen Daten. |
| project |
EntityReference |
|
| properties |
DatasetProperties |
|
| self |
string (uri) |
Der Speicherort dieser Entität. |
| status |
Status |
DatasetKind
DatasetKind
| Wert | Beschreibung |
|---|---|
| Language |
Ein Sprachdatensatz. |
| Acoustic |
Ein akustisches Dataset. |
| Pronunciation |
Ein Aussprache-Dataset. |
| AudioFiles |
Ein Dataset für Audiodateien. |
| LanguageMarkdown |
Ein Sprachmarkdown-Dataset. |
| OutputFormatting |
Dataset mit Regeln zum Anpassen umgekehrter Textnormalisierung, Groß-/Kleinschreibung, Reformierung, Profanität und definiert auch Tests für die Datasetvalidierung |
DatasetLinks
DatasetLinks
| Name | Typ | Beschreibung |
|---|---|---|
| commitBlocks |
string (uri) |
Der Speicherort zum Commit der Liste der Blöcke beim Hochladen eines Datasets mithilfe von Blöcken. Weitere Informationen finden Sie unter Operation "Datasets_CommitBlocks". |
| files |
string (uri) |
Der Speicherort zum Abrufen aller Dateien dieser Entität. Weitere Informationen finden Sie unter Operation "Datasets_ListFiles". |
| listBlocks |
string (uri) |
Der Speicherort zum Auflisten der bereits hochgeladenen Blöcke dieser Entität beim Hochladen eines Datasets mit Blöcken. Weitere Informationen finden Sie unter Operation "Datasets_GetBlocks". |
| uploadBlocks |
string (uri) |
Der Speicherort zum Hochladen von Blöcken beim Hochladen eines Datasets mithilfe von Blöcken. Weitere Informationen finden Sie unter Operation "Datasets_UploadBlock". |
DatasetProperties
DatasetProperties
| Name | Typ | Beschreibung |
|---|---|---|
| acceptedLineCount |
integer (int32) |
Die Anzahl der Zeilen, die für diesen Datensatz akzeptiert werden. |
| duration |
string |
Die Gesamtdauer der Datasets, wenn sie Audiodateien enthält. Die Dauer wird als ISO 8601-Dauer codiert ("PnYnMnDTnHnMnS", siehe https://en.wikipedia.org/wiki/ISO_8601#Durations). |
|
string |
Die E-Mail-Adresse, an die E-Mail-Benachrichtigungen gesendet werden sollen, falls der Vorgang abgeschlossen ist. Der Wert wird nach dem erfolgreichen Senden der E-Mail entfernt. |
|
| error |
EntityError |
|
| rejectedLineCount |
integer (int32) |
Die Anzahl der für diesen Datensatz abgelehnten Zeilen. |
| textNormalizationKind |
TextNormalizationKind |
DetailedErrorCode
DetailedErrorCode
| Wert | Beschreibung |
|---|---|
| InvalidParameterValue |
Ungültiger Parameterwert. |
| InvalidRequestBodyFormat |
Ungültiges Anforderungstextformat. |
| EmptyRequest |
Leere Anforderung. |
| MissingInputRecords |
Fehlende Eingabedatensätze. |
| InvalidDocument |
Ungültiges Dokument. |
| ModelVersionIncorrect |
Modellversion falsch. |
| InvalidDocumentBatch |
Ungültiger Dokumentbatch. |
| UnsupportedLanguageCode |
Nicht unterstützter Sprachcode. |
| DataImportFailed |
Fehler beim Datenimport. |
| InUseViolation |
Verletzung des Einsatzes. |
| InvalidLocale |
Ungültiges Gebietsschema. |
| InvalidBaseModel |
Ungültiges Basismodell. |
| InvalidAdaptationMapping |
Ungültige Anpassungszuordnung. |
| InvalidDataset |
Ungültiges Dataset. |
| InvalidTest |
Ungültiger Test. |
| FailedDataset |
Fehler beim Dataset. |
| InvalidModel |
Ungültiges Modell. |
| InvalidTranscription |
Ungültige Transkription. |
| InvalidPayload |
Ungültige Nutzlast. |
| InvalidParameter |
Ungültiger Parameter. |
| EndpointWithoutLogging |
Endpunkt ohne Protokollierung. |
| InvalidPermissions |
Ungültige Berechtigungen. |
| InvalidPrerequisite |
Ungültige Voraussetzung. |
| InvalidProductId |
Ungültige Produkt-ID. |
| InvalidSubscription |
Ungültiges Abonnement. |
| InvalidProject |
Ungültiges Projekt. |
| InvalidProjectKind |
Ungültige Projektart. |
| InvalidRecordingsUri |
Ungültiger Aufzeichnungs-URI. |
| OnlyOneOfUrlsOrContainerOrDataset |
Nur eine url oder ein Container oder Dataset. |
| ExceededNumberOfRecordingsUris |
Die Anzahl der Aufzeichnungs-URIs wurde überschritten. |
| ModelMismatch |
Modellkonflikt. |
| ProjectGenderMismatch |
Projekt Gender-Mismatch. |
| ModelDeprecated |
Das Modell ist veraltet. |
| ModelExists |
Das Modell ist vorhanden. |
| ModelNotDeployable |
Das Modell kann nicht bereitgestellt werden. |
| EndpointNotUpdatable |
Endpunkt nicht aktualisierbar. |
| SingleDefaultEndpoint |
Einzelner Standardendpunkt. |
| EndpointCannotBeDefault |
Der Endpunkt kann nicht standardmäßig sein. |
| InvalidModelUri |
Ungültiger Modell-URI. |
| SubscriptionNotFound |
Das Abonnement wurde nicht gefunden. |
| QuotaViolation |
Kontingentverletzung. |
| UnsupportedDelta |
Nicht unterstütztes Delta. |
| UnsupportedFilter |
Nicht unterstützter Filter. |
| UnsupportedPagination |
Nicht unterstützte Paginierung. |
| UnsupportedDynamicConfiguration |
Nicht unterstützte dynamische Konfiguration. |
| UnsupportedOrderBy |
Nicht unterstützte Reihenfolge nach. |
| NoUtf8WithBom |
Kein utf8 mit bom. |
| ModelDeploymentNotCompleteState |
Der Status der Modellbereitstellung ist nicht abgeschlossen. |
| SkuLimitsExist |
Sku-Grenzwerte sind vorhanden. |
| DeployingFailedModel |
Fehler beim Bereitstellen des Modells. |
| UnsupportedTimeRange |
Nicht unterstützter Zeitraum. |
| InvalidLogDate |
Ungültiges Protokolldatum. |
| InvalidLogId |
Ungültige Protokoll-ID. |
| InvalidLogStartTime |
Ungültige Startzeit des Protokolls. |
| InvalidLogEndTime |
Ungültige Protokollendzeit. |
| InvalidTopForLogs |
Ungültiger Anfang für Protokolle. |
| InvalidSkipTokenForLogs |
Ungültiges Skip-Token für Protokolle. |
| DeleteNotAllowed |
Löschen nicht zulässig. |
| Forbidden |
Verboten. |
| DeployNotAllowed |
Bereitstellen nicht zulässig. |
| UnexpectedError |
Unerwarteter Fehler. |
| InvalidCollection |
Ungültige Auflistung. |
| InvalidCallbackUri |
Ungültiger Rückruf-URI. |
| InvalidSasValidityDuration |
Ungültige Gültigkeitsdauer für sas. |
| InaccessibleCustomerStorage |
Nicht zugänglicher Kundenspeicher. |
| UnsupportedClassBasedAdaptation |
Nicht unterstützte klassenbasierte Anpassung. |
| InvalidWebHookEventKind |
Ungültiger Web hook-Ereignistyp. |
| InvalidTimeToLive |
Ungültige Zeit für live. |
| InvalidSourceAzureResourceId |
Ungültige Azure-Quellressourcen-ID. |
| ModelCopyOperationExists |
Der Modellkopievorgang ist vorhanden. |
EntityError
EntityError
| Name | Typ | Beschreibung |
|---|---|---|
| code |
string |
Der Code dieses Fehlers. |
| message |
string |
Die Meldung für diesen Fehler. |
EntityReference
EntityReference
| Name | Typ | Beschreibung |
|---|---|---|
| self |
string (uri) |
Der Speicherort der Entität, auf die verwiesen wird. |
Error
Fehler
| Name | Typ | Beschreibung |
|---|---|---|
| code |
Fehlercode |
|
| details |
Error[] |
Zusätzliche unterstützende Details zu den Fehler- und/oder erwarteten Richtlinien. |
| innerError |
InnerError |
|
| message |
string |
Fehlermeldung auf hoher Ebene. |
| target |
string |
Die Quelle des Fehlers. Bei ungültigen Dokumenten wäre es z. B. "Dokumente" oder "Dokument-ID". |
ErrorCode
Fehlercode
| Wert | Beschreibung |
|---|---|
| InvalidRequest |
Stellt den ungültigen Anforderungsfehlercode dar. |
| InvalidArgument |
Stellt den fehlercode für ungültiges Argument dar. |
| InternalServerError |
Stellt den internen Fehlercode des Servers dar. |
| ServiceUnavailable |
Stellt den dienst nicht verfügbaren Fehlercode dar. |
| NotFound |
Stellt den nicht gefundenen Fehlercode dar. |
| PipelineError |
Stellt den Pipelinefehlerfehlercode dar. |
| Conflict |
Stellt den Konfliktfehlercode dar. |
| InternalCommunicationFailed |
Fehlercode für die interne Kommunikation. |
| Forbidden |
Stellt den verbotenen Fehlercode dar. |
| NotAllowed |
Stellt den nicht zulässigen Fehlercode dar. |
| Unauthorized |
Stellt den nicht autorisierten Fehlercode dar. |
| UnsupportedMediaType |
Stellt den Fehlercode für den nicht unterstützten Medientyp dar. |
| TooManyRequests |
Stellt den Fehlercode für zu viele Anforderungen dar. |
| UnprocessableEntity |
Stellt den nicht verarbeiteten Entitätsfehlercode dar. |
InnerError
InnerError
| Name | Typ | Beschreibung |
|---|---|---|
| code |
DetailedErrorCode |
|
| details |
object |
Zusätzliche unterstützende Details zu den Fehler- und/oder erwarteten Richtlinien. |
| innerError |
InnerError |
|
| message |
string |
Fehlermeldung auf hoher Ebene. |
| target |
string |
Die Quelle des Fehlers. Bei ungültigen Dokumenten wäre es z. B. "Dokumente" oder "Dokument-ID". |
Status
Status
| Wert | Beschreibung |
|---|---|
| NotStarted |
Der lange ausgeführte Vorgang wurde noch nicht gestartet. |
| Running |
Der lange ausgeführte Vorgang wird zurzeit verarbeitet. |
| Succeeded |
Der lange ausgeführte Vorgang wurde erfolgreich abgeschlossen. |
| Failed |
Fehler beim vorgang mit langer Ausführung. |
TextNormalizationKind
TextNormalizationKind
| Wert | Beschreibung |
|---|---|
| Default |
Standardtextnormalisierung (z. B. "2 bis 3" wird in en-USdurch "zwei bis drei" ersetzt). |
| None |
Auf den Eingabetext wird keine Textnormalisierung angewendet. Dies ist eine Außerkraftsetzungsoption, die nur verwendet werden soll, wenn Text vor dem Upload normalisiert wird. |