Partager via


Datasets - Create

Charge et crée un jeu de données en obtenant les données à partir d’une URL spécifiée ou commence à attendre que les blocs de données soient chargés.

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

Paramètres URI

Nom Dans Obligatoire Type Description
endpoint
path True

string

Points de terminaison Cognitive Services pris en charge (protocole et nom d’hôte, par exemple : https://westus.api.cognitive.microsoft.com).

Corps de la demande

Nom Obligatoire Type Description
displayName True

string

Nom complet de l’objet.

kind True

DatasetKind

DatasetKind
Type d’importation de données.

locale True

string

Paramètres régionaux des données contenues.

contentUrl

string

URL des données du jeu de données.

customProperties

object

Propriétés personnalisées de cette entité. La longueur maximale autorisée de la clé est de 64 caractères, la longueur maximale de la valeur autorisée est de 256 caractères et le nombre d’entrées autorisées est de 10.

description

string

Description de l'objet .

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

Réponses

Nom Type Description
201 Created

Dataset

La réponse contient des informations sur l’entité en tant que charge utile et son emplacement en tant qu’en-tête.

En-têtes

Location: string

Other Status Codes

Error

Une erreur est survenue.

Sécurité

Ocp-Apim-Subscription-Key

Fournissez la clé de votre compte Cognitive Services ici.

Type: apiKey
Dans: header

Authorization

Fournissez un jeton d’accès à partir du JWT retourné par le STS de cette région. Veillez à ajouter l’étendue de gestion au jeton en ajoutant la chaîne de requête suivante à l’URL STS : ?scope=speechservicesmanagement

Type: apiKey
Dans: header

Exemples

Create a dataset with content url
Create dataset from data blocks

Create a dataset with content url

Exemple de requête

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/location",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Exemple de réponse

Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
  },
  "properties": {
    "textNormalizationKind": "Default",
    "acceptedLineCount": 11,
    "rejectedLineCount": 2,
    "duration": "PT4M12S"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "Succeeded",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Create dataset from data blocks

Exemple de requête

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Exemple de réponse

{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
    "commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
    "listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
    "uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "NotStarted",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Définitions

Nom Description
Dataset

Dataset

DatasetKind

DatasetKind

DatasetLinks

DatasetLinks

DatasetProperties

DatasetProperties

DetailedErrorCode

DetailedErrorCode

EntityError

EntityError

EntityReference

EntityReference

Error

Erreur

ErrorCode

ErrorCode

InnerError

InnerError

Status

Statut

TextNormalizationKind

TextNormalizationKind

Dataset

Dataset

Nom Type Description
contentUrl

string

URL des données du jeu de données.

createdDateTime

string

Horodatage lors de la création de l’objet. L’horodatage est encodé au format de date et d’heure ISO 8601 (« AAAA-MM-JJThh :mm :ssZ », voir https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

customProperties

object

Propriétés personnalisées de cette entité. La longueur de clé maximale autorisée est de 64 caractères, la longueur maximale de la valeur autorisée est de 256 caractères et le nombre d’entrées autorisées est de 10.

description

string

Description de l'objet .

displayName

string

Nom complet de l’objet.

kind

DatasetKind

DatasetKind
Type d’importation de données.

lastActionDateTime

string

Horodatage lorsque le status actuel a été entré. L’horodatage est encodé au format de date et d’heure ISO 8601 (« AAAA-MM-JJThh :mm :ssZ », voir https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

links

DatasetLinks

DatasetLinks

locale

string

Paramètres régionaux des données contenues.

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

self

string

Emplacement de cette entité.

status

Status

Statut
Décrire l’état actuel de l’API

DatasetKind

DatasetKind

Nom Type Description
Acoustic

string

Jeu de données acoustique.

AudioFiles

string

Jeu de données de fichiers audio.

Language

string

Jeu de données de langage.

LanguageMarkdown

string

Jeu de données markdown de langage.

OutputFormatting

string

Jeu de données qui contient des règles pour personnaliser la normalisation du texte inverse, la mise en majuscule, la reformulation, les blasphèmes et définit également des tests pour la validation du jeu de données

Pronunciation

string

Jeu de données de prononciation.

DatasetLinks

Nom Type Description
commitBlocks

string

Emplacement de validation de la liste des blocs lors du chargement d’un jeu de données à l’aide de blocs. Pour plus d’informations, consultez l’opération « Datasets_CommitBlocks ».

files

string

Emplacement permettant d’obtenir tous les fichiers de cette entité. Pour plus d’informations, consultez l’opération « Datasets_ListFiles ».

listBlocks

string

Emplacement permettant de répertorier les blocs déjà chargés de cette entité lors du chargement d’un jeu de données à l’aide de blocs. Pour plus d’informations, consultez l’opération « Datasets_GetBlocks ».

uploadBlocks

string

L’emplacement vers lequel charger des blocs lors du chargement d’un jeu de données à l’aide de blocs. Pour plus d’informations, consultez l’opération « Datasets_UploadBlock ».

DatasetProperties

DatasetProperties

Nom Type Description
acceptedLineCount

integer

Nombre de lignes acceptées pour ce jeu de données.

duration

string

Durée totale des jeux de données s’ils contiennent des fichiers audio. La durée est encodée en tant que durée ISO 8601 (« PnYnMnDTnHnMnS », voir https://en.wikipedia.org/wiki/ISO_8601#Durations).

email

string

Adresse e-mail à laquelle envoyer Notifications par e-mail au cas où l’opération se terminerait. La valeur sera supprimée après l’envoi de l’e-mail.

error

EntityError

EntityError

rejectedLineCount

integer

Nombre de lignes rejetées pour ce jeu de données.

textNormalizationKind

TextNormalizationKind

TextNormalizationKind
Type de normalisation de texte.

DetailedErrorCode

DetailedErrorCode

Nom Type Description
DataImportFailed

string

Échec de l’importation des données.

DeleteNotAllowed

string

Supprimer non autorisé.

DeployNotAllowed

string

Déploiement non autorisé.

DeployingFailedModel

string

Déploiement d’un modèle ayant échoué.

EmptyRequest

string

Requête vide.

EndpointCannotBeDefault

string

Le point de terminaison ne peut pas être par défaut.

EndpointNotUpdatable

string

Point de terminaison non modifiable.

EndpointWithoutLogging

string

Point de terminaison sans journalisation.

ExceededNumberOfRecordingsUris

string

Dépassement du nombre d’URI d’enregistrements.

FailedDataset

string

Échec du jeu de données.

Forbidden

string

Interdit.

InUseViolation

string

Violation en cours d’utilisation.

InaccessibleCustomerStorage

string

Stockage client inaccessible.

InvalidAdaptationMapping

string

Mappage d’adaptation non valide.

InvalidBaseModel

string

Modèle de base non valide.

InvalidCallbackUri

string

URI de rappel non valide.

InvalidCollection

string

Collection non valide.

InvalidDataset

string

Jeu de données non valide.

InvalidDocument

string

Document non valide.

InvalidDocumentBatch

string

Lot de documents non valide.

InvalidLocale

string

Paramètres régionaux non valides.

InvalidLogDate

string

Date de journal non valide.

InvalidLogEndTime

string

Heure de fin du journal non valide.

InvalidLogId

string

ID de journal non valide.

InvalidLogStartTime

string

Heure de début du journal non valide.

InvalidModel

string

Modèle non valide.

InvalidModelUri

string

URI de modèle non valide.

InvalidParameter

string

Paramètre non valide.

InvalidParameterValue

string

Valeur de paramètre non valide.

InvalidPayload

string

Charge utile non valide.

InvalidPermissions

string

Autorisations non valides.

InvalidPrerequisite

string

Prérequis non valides.

InvalidProductId

string

ID de produit non valide.

InvalidProject

string

Projet non valide.

InvalidProjectKind

string

Type de projet non valide.

InvalidRecordingsUri

string

Uri des enregistrements non valides.

InvalidRequestBodyFormat

string

Format du corps de la demande non valide.

InvalidSasValidityDuration

string

Durée de validité de sas non valide.

InvalidSkipTokenForLogs

string

Jeton d’ignorer non valide pour les journaux.

InvalidSourceAzureResourceId

string

ID de ressource Azure source non valide.

InvalidSubscription

string

Abonnement non valide.

InvalidTest

string

Test non valide.

InvalidTimeToLive

string

Durée de vie non valide.

InvalidTopForLogs

string

Top non valide pour les journaux.

InvalidTranscription

string

Transcription non valide.

InvalidWebHookEventKind

string

Type d’événement web hook non valide.

MissingInputRecords

string

Enregistrements d’entrée manquants.

ModelCopyOperationExists

string

L’opération de copie de modèle existe.

ModelDeploymentNotCompleteState

string

État non terminé du déploiement du modèle.

ModelDeprecated

string

Modèle déconseillé.

ModelExists

string

Le modèle existe.

ModelMismatch

string

Incompatibilité de modèle.

ModelNotDeployable

string

Modèle non déployable.

ModelVersionIncorrect

string

Version du modèle incorrecte.

NoUtf8WithBom

string

Pas de utf8 avec bom.

OnlyOneOfUrlsOrContainerOrDataset

string

Une seule url ou conteneur ou jeu de données.

ProjectGenderMismatch

string

Projet d’incompatibilité entre les sexes.

QuotaViolation

string

Violation de quota.

SingleDefaultEndpoint

string

Point de terminaison par défaut unique.

SkuLimitsExist

string

Des limites de référence SKU existent.

SubscriptionNotFound

string

Abonnement introuvable.

UnexpectedError

string

Erreur inattendue.

UnsupportedClassBasedAdaptation

string

Adaptation basée sur les classes non prise en charge.

UnsupportedDelta

string

Delta non pris en charge.

UnsupportedDynamicConfiguration

string

Configuration dynamique non prise en charge.

UnsupportedFilter

string

Filtre non pris en charge.

UnsupportedLanguageCode

string

Code de langue non pris en charge.

UnsupportedOrderBy

string

Commande non prise en charge par.

UnsupportedPagination

string

Pagination non prise en charge.

UnsupportedTimeRange

string

Intervalle de temps non pris en charge.

EntityError

EntityError

Nom Type Description
code

string

Code de cette erreur.

message

string

Message correspondant à cette erreur.

EntityReference

EntityReference

Nom Type Description
self

string

Emplacement de l’entité référencée.

Error

Erreur

Nom Type Description
code

ErrorCode

ErrorCode
Codes d’erreur de haut niveau.

details

Error[]

Détails supplémentaires concernant l’erreur et/ou les stratégies attendues.

innerError

InnerError

InnerError
Nouveau format d’erreur interne conforme aux instructions de l’API Cognitive Services, disponible à l’adresse https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Ce format contient les propriétés obligatoires ErrorCode, message et les propriétés facultatives target, details (paire clé-valeur), et l’erreur interne (qui peut être imbriquée).

message

string

Message d’erreur de haut niveau.

target

string

Source de l’erreur. Par exemple, « documents » ou « document id » en présence d’un document non valide.

ErrorCode

ErrorCode

Nom Type Description
Conflict

string

Représentant le code d’erreur de conflit.

Forbidden

string

Représentant le code d’erreur interdit.

InternalCommunicationFailed

string

Représentant le code d’erreur d’échec de la communication interne.

InternalServerError

string

Représentant le code d’erreur du serveur interne.

InvalidArgument

string

Représentant le code d’erreur de l’argument non valide.

InvalidRequest

string

Représentant le code d’erreur de requête non valide.

NotAllowed

string

Représentant le code d’erreur non autorisé.

NotFound

string

Représentant le code d’erreur introuvable.

PipelineError

string

Représentant le code d’erreur du pipeline.

ServiceUnavailable

string

Représentant le code d’erreur du service indisponible.

TooManyRequests

string

Représentant le code d’erreur trop grand nombre de requêtes.

Unauthorized

string

Représentant le code d’erreur non autorisé.

UnprocessableEntity

string

Représentant le code d’erreur d’entité non traité.

UnsupportedMediaType

string

Représentant le code d’erreur du type de média non pris en charge.

InnerError

InnerError

Nom Type Description
code

DetailedErrorCode

DetailedErrorCode
Énumération détaillée du code d’erreur.

details

object

Détails supplémentaires concernant l’erreur et/ou les stratégies attendues.

innerError

InnerError

InnerError
Nouveau format d’erreur interne conforme aux instructions de l’API Cognitive Services, disponible à l’adresse https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Ce format contient les propriétés obligatoires ErrorCode, message et les propriétés facultatives target, details (paire clé-valeur), et l’erreur interne (qui peut être imbriquée).

message

string

Message d’erreur de haut niveau.

target

string

Source de l’erreur. Par exemple, « documents » ou « document id » en présence d’un document non valide.

Status

Statut

Nom Type Description
Failed

string

L’opération de longue durée a échoué.

NotStarted

string

L’opération de longue durée n’a pas encore démarré.

Running

string

L’opération de longue durée est en cours de traitement.

Succeeded

string

L’opération de longue durée s’est terminée avec succès.

TextNormalizationKind

TextNormalizationKind

Nom Type Description
Default

string

Normalisation du texte par défaut (par exemple, « 2 à 3 » est remplacé par « deux à trois » en-US).

None

string

Aucune normalisation de texte n’est appliquée au texte d’entrée. Il s’agit d’une option de remplacement qui ne doit être utilisée que lorsque le texte est normalisé avant le chargement.