Transcriptions - Transcribe
Transcription synchrone d’un fichier audio.
POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2025-10-15
Paramètres URI
| Nom | Dans | Obligatoire | Type | Description |
|---|---|---|---|---|
|
audio
|
formData |
file (binary) |
Le contenu du fichier audio à transcrire. La durée audio du fichier audio doit être inférieure à 2 heures et inférieure à 250 Mo. |
|
|
definition
|
formData |
string |
Métadonnées pour une demande de transcription. Ce champ contient un objet sérialisé JSON de type |
|
|
endpoint
|
path | True |
string |
Points de terminaison Cognitive Services pris en charge (protocole et nom d’hôte, par exemple : https://westus.api.cognitive.microsoft.com). |
|
api-version
|
query | True |
string |
La version de l’API demandée. |
En-tête de la demande
Media Types: "multipart/form-data"
| Nom | Obligatoire | Type | Description |
|---|---|---|---|
| Ocp-Apim-Subscription-Key | True |
string |
Fournissez votre clé de compte Cognitive Services ici. |
Réponses
| Nom | Type | Description |
|---|---|---|
| 200 OK |
Ok |
|
| Other Status Codes |
Une erreur est survenue. |
Sécurité
Ocp-Apim-Subscription-Key
Fournissez votre clé de compte Cognitive Services ici.
Type:
apiKey
Dans:
header
Exemples
Transcribe an audio file
Exemple de requête
POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2025-10-15
Exemple de réponse
{
"durationMilliseconds": 2000,
"combinedPhrases": [
{
"text": "Weather"
}
],
"phrases": [
{
"offsetMilliseconds": 40,
"durationMilliseconds": 320,
"text": "Weather",
"words": [
{
"text": "weather",
"offsetMilliseconds": 40,
"durationMilliseconds": 320
}
],
"locale": "en-US",
"confidence": 0.78983736
}
]
}
Définitions
| Nom | Description |
|---|---|
|
Channel |
La transcription complète par chaîne. |
|
Detailed |
DetailedErrorCode |
| Error |
Erreur |
|
Error |
ErrorCode |
|
Inner |
InnerError |
| Phrase |
Une phrase transcrite. |
|
Transcribe |
Résultat de l’opération de transcription. |
| Word |
Mot horodaté dans le formulaire d’affichage. |
ChannelCombinedPhrases
La transcription complète par chaîne.
| Nom | Type | Description |
|---|---|---|
| channel |
integer (int32) |
L’index de canal basé sur 0. Présent uniquement si la séparation des canaux est activée. |
| text |
string |
Texte transcrit. |
DetailedErrorCode
DetailedErrorCode
| Valeur | Description |
|---|---|
| InvalidParameterValue |
Valeur de paramètre non valide. |
| InvalidRequestBodyFormat |
Format du corps de la demande non valide. |
| EmptyRequest |
Demande vide. |
| MissingInputRecords |
Enregistrements d’entrée manquants. |
| InvalidDocument |
Document non valide. |
| ModelVersionIncorrect |
Version du modèle incorrecte. |
| InvalidDocumentBatch |
Lot de documents non valide. |
| UnsupportedLanguageCode |
Code de langue non pris en charge. |
| DataImportFailed |
Echec de l’importation des données. |
| InUseViolation |
En violation d’utilisation. |
| InvalidLocale |
Paramètres régionaux non valides. |
| InvalidBaseModel |
Modèle de base non valide. |
| InvalidAdaptationMapping |
Mappage d’adaptation non valide. |
| InvalidDataset |
Jeu de données non valide. |
| InvalidTest |
Test non valide. |
| FailedDataset |
Jeu de données ayant échoué. |
| InvalidModel |
Modèle non valide. |
| InvalidTranscription |
Transcription incorrecte. |
| InvalidPayload |
Charge utile non valide. |
| InvalidParameter |
Paramètre non valide. |
| EndpointWithoutLogging |
Point de terminaison sans journalisation. |
| InvalidPermissions |
Autorisations non valides. |
| InvalidPrerequisite |
Prérequis non valide. |
| InvalidProductId |
L’identifiant du produit n’est pas valide. |
| InvalidSubscription |
Abonnement non valide. |
| InvalidProject |
Projet non valide. |
| InvalidProjectKind |
Type de projet non valide. |
| InvalidRecordingsUri |
Uri d’enregistrement non valide. |
| OnlyOneOfUrlsOrContainerOrDataset |
Une seule des URL, du conteneur ou du jeu de données. |
| ExceededNumberOfRecordingsUris |
Dépassement du nombre d’uri d’enregistrement. |
| InvalidChannels |
Canaux non valides. |
| ModelMismatch |
Incompatibilité des modèles. |
| ProjectGenderMismatch |
Projeter l’inadéquation entre les sexes. |
| ModelDeprecated |
Modèle obsolète. |
| ModelExists |
Le modèle existe. |
| ModelNotDeployable |
Modèle non déployable. |
| EndpointNotUpdatable |
Le point de terminaison ne peut pas être mis à jour. |
| SingleDefaultEndpoint |
Point de terminaison unique par défaut. |
| EndpointCannotBeDefault |
Le point de terminaison ne peut pas être défini par défaut. |
| InvalidModelUri |
Uri de modèle non valide. |
| SubscriptionNotFound |
Abonnement introuvable. |
| QuotaViolation |
Violation des quotas. |
| UnsupportedDelta |
Delta non pris en charge. |
| UnsupportedFilter |
Filtre non pris en charge. |
| UnsupportedPagination |
Pagination non prise en charge. |
| UnsupportedDynamicConfiguration |
Configuration dynamique non prise en charge. |
| UnsupportedOrderBy |
Commande non prise en charge par. |
| NoUtf8WithBom |
Pas de utf8 avec bom. |
| ModelDeploymentNotCompleteState |
État non complet du déploiement du modèle. |
| SkuLimitsExist |
Il existe des limites de références. |
| DeployingFailedModel |
Déploiement du modèle ayant échoué. |
| UnsupportedTimeRange |
Plage horaire non prise en charge. |
| InvalidLogDate |
Date de journal non valide. |
| InvalidLogId |
ID de journal non valide. |
| InvalidLogStartTime |
Heure de début du journal non valide. |
| InvalidLogEndTime |
Heure de fin du journal non valide. |
| InvalidTopForLogs |
Tête non valide pour les journaux. |
| InvalidSkipTokenForLogs |
Jeton de saut non valide pour les journaux. |
| DeleteNotAllowed |
Supprimer non autorisé. |
| Forbidden |
Interdit. |
| DeployNotAllowed |
Déploiement non autorisé. |
| UnexpectedError |
Erreur inattendue. |
| InvalidCollection |
Collection non valide. |
| InvalidCallbackUri |
Uri de rappel non valide. |
| InvalidSasValidityDuration |
Durée de validité sas invalide. |
| InaccessibleCustomerStorage |
Stockage client inaccessible. |
| UnsupportedClassBasedAdaptation |
Adaptation basée sur la classe non prise en charge. |
| InvalidWebHookEventKind |
Type d’événement de webhook non valide. |
| InvalidTimeToLive |
Temps de vie invalide. |
| InvalidSourceAzureResourceId |
ID de ressource Azure source non valide. |
| ModelCopyAuthorizationExpired |
ModelCopyAuthorization expiré. |
| EndpointLoggingNotSupported |
La journalisation des points de terminaison n’est pas prise en charge. |
| NoLanguageIdentified |
L’identification de la langue n’a reconnu aucune langue. |
| MultipleLanguagesIdentified |
L’identification de la langue reconnaît plusieurs langues. Aucune langue dominante n’a pu être déterminée. |
| InvalidAudioFormat |
Le format de l’audio d’entrée n’est pas pris en charge. |
| BadChannelConfiguration |
Il y a une incompatibilité entre les canaux audio dans les données, dans la configuration ou les exigences de l’application. |
| InvalidChannelSpecification |
La sélection des canaux dans la demande de transcription n’est pas prise en charge (par exemple, ni 0 ni 1 n’ont été sélectionnés). |
| AudioLengthLimitExceeded |
La durée du fichier audio est supérieure à la durée maximale autorisée. |
| EmptyAudioFile |
Le fichier audio est vide. |
Error
Erreur
| Nom | Type | Description |
|---|---|---|
| code |
ErrorCode |
|
| details |
Error[] |
Détails supplémentaires concernant l’erreur et/ou les politiques prévues. |
| innerError |
InnerError |
|
| message |
string |
Message d’erreur de haut niveau. |
| target |
string |
Source de l’erreur. Par exemple, il s’agirait de « documents » ou « document id » en cas de document invalide. |
ErrorCode
ErrorCode
| Valeur | Description |
|---|---|
| InvalidRequest |
Représentant le code d’erreur de demande non valide. |
| InvalidArgument |
Représentation du code d’erreur de l’argument invalide. |
| InternalServerError |
Représentant le code d’erreur interne du serveur. |
| ServiceUnavailable |
Représentant le code d’erreur du service indisponible. |
| NotFound |
Représentant le code d’erreur introuvable. |
| PipelineError |
Représentant le code d’erreur du pipeline. |
| Conflict |
Représentant le code d’erreur de conflit. |
| InternalCommunicationFailed |
Représentation du code d’erreur d’échec de la communication interne. |
| Forbidden |
Représentant le code d’erreur interdit. |
| NotAllowed |
Représentant le code d’erreur non autorisé. |
| Unauthorized |
Représentant le code d’erreur non autorisé. |
| UnsupportedMediaType |
Représentant le code d’erreur de type de support non pris en charge. |
| TooManyRequests |
Représentant le code d’erreur trop de demandes. |
| UnprocessableEntity |
Représentant le code d’erreur de l’entité non traitable. |
InnerError
InnerError
| Nom | Type | Description |
|---|---|---|
| code |
DetailedErrorCode |
|
| details |
object |
Détails supplémentaires concernant l’erreur et/ou les politiques prévues. |
| innerError |
InnerError |
|
| message |
string |
Message d’erreur de haut niveau. |
| target |
string |
Source de l’erreur. Par exemple, il s’agirait de « documents » ou « document id » en cas de document invalide. |
Phrase
Une phrase transcrite.
| Nom | Type | Description |
|---|---|---|
| channel |
integer (int32) |
L’index de canal basé sur 0. Présent uniquement si la séparation des canaux est activée. |
| confidence |
number (float) |
Valeur de confiance de l’expression. |
| durationMilliseconds |
integer (int32) |
Durée de la phrase en millisecondes. |
| locale |
string |
Paramètre régional de l’expression. |
| offsetMilliseconds |
integer (int32) |
Décalage de début de la phrase en millisecondes. |
| speaker |
integer (int32) |
Numéro entier unique attribué à chaque haut-parleur détecté dans l’audio sans ordre particulier. Présent uniquement si la diarisation du locuteur est activée. |
| text |
string |
Le texte transcrit de la phrase. |
| words |
Word[] |
Les mots qui composent la phrase. Présent uniquement si les horodatages au niveau du mot sont activés. |
TranscribeResult
Résultat de l’opération de transcription.
| Nom | Type | Description |
|---|---|---|
| combinedPhrases |
La transcription complète de chaque chaîne. |
|
| durationMilliseconds |
integer (int32) |
Durée de l’audio en millisecondes. |
| phrases |
Phrase[] |
Les résultats de la transcription sont segmentés en phrases. |
Word
Mot horodaté dans le formulaire d’affichage.
| Nom | Type | Description |
|---|---|---|
| durationMilliseconds |
integer (int32) |
Durée du mot en millisecondes. |
| offsetMilliseconds |
integer (int32) |
Décalage de début du mot en millisecondes. |
| text |
string |
Le mot reconnu, y compris la ponctuation. |