Transcriptions - Transcribe

Service:: Azure AI Services

Version d'API:: 2025-10-15

Transcription synchrone d’un fichier audio.

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2025-10-15

Paramètres URI

Nom	Dans	Obligatoire	Type	Description
audio	formData		file (binary)	Le contenu du fichier audio à transcrire. La durée audio du fichier audio doit être inférieure à 2 heures et inférieure à 250 Mo.
definition	formData		string	Métadonnées pour une demande de transcription. Ce champ contient un objet sérialisé JSON de type `TranscribeDefinition`.
endpoint	path	True	string	Points de terminaison Cognitive Services pris en charge (protocole et nom d’hôte, par exemple : https://westus.api.cognitive.microsoft.com).
api-version	query	True	string	La version de l’API demandée.

En-tête de la demande

Media Types: "multipart/form-data"

Nom	Obligatoire	Type	Description
Ocp-Apim-Subscription-Key	True	string	Fournissez votre clé de compte Cognitive Services ici.

Réponses

Nom	Type	Description
200 OK	TranscribeResult	Ok
Other Status Codes	Error	Une erreur est survenue.

Sécurité

Ocp-Apim-Subscription-Key

Fournissez votre clé de compte Cognitive Services ici.

Type: apiKey
Dans: header

Exemples

Transcribe an audio file

Exemple de requête

HTTP

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2025-10-15

Exemple de réponse

Code d’état:: 200

{
  "durationMilliseconds": 2000,
  "combinedPhrases": [
    {
      "text": "Weather"
    }
  ],
  "phrases": [
    {
      "offsetMilliseconds": 40,
      "durationMilliseconds": 320,
      "text": "Weather",
      "words": [
        {
          "text": "weather",
          "offsetMilliseconds": 40,
          "durationMilliseconds": 320
        }
      ],
      "locale": "en-US",
      "confidence": 0.78983736
    }
  ]
}

Définitions

Nom	Description
ChannelCombinedPhrases	La transcription complète par chaîne.
DetailedErrorCode	DetailedErrorCode
Error	Erreur
ErrorCode	ErrorCode
InnerError	InnerError
Phrase	Une phrase transcrite.
TranscribeResult	Résultat de l’opération de transcription.
Word	Mot horodaté dans le formulaire d’affichage.

ChannelCombinedPhrases

Object

La transcription complète par chaîne.

Nom	Type	Description
channel	integer (int32)	L’index de canal basé sur 0. Présent uniquement si la séparation des canaux est activée.
text	string	Texte transcrit.

DetailedErrorCode

Énumération

DetailedErrorCode

Valeur	Description
InvalidParameterValue	Valeur de paramètre non valide.
InvalidRequestBodyFormat	Format du corps de la demande non valide.
EmptyRequest	Demande vide.
MissingInputRecords	Enregistrements d’entrée manquants.
InvalidDocument	Document non valide.
ModelVersionIncorrect	Version du modèle incorrecte.
InvalidDocumentBatch	Lot de documents non valide.
UnsupportedLanguageCode	Code de langue non pris en charge.
DataImportFailed	Echec de l’importation des données.
InUseViolation	En violation d’utilisation.
InvalidLocale	Paramètres régionaux non valides.
InvalidBaseModel	Modèle de base non valide.
InvalidAdaptationMapping	Mappage d’adaptation non valide.
InvalidDataset	Jeu de données non valide.
InvalidTest	Test non valide.
FailedDataset	Jeu de données ayant échoué.
InvalidModel	Modèle non valide.
InvalidTranscription	Transcription incorrecte.
InvalidPayload	Charge utile non valide.
InvalidParameter	Paramètre non valide.
EndpointWithoutLogging	Point de terminaison sans journalisation.
InvalidPermissions	Autorisations non valides.
InvalidPrerequisite	Prérequis non valide.
InvalidProductId	L’identifiant du produit n’est pas valide.
InvalidSubscription	Abonnement non valide.
InvalidProject	Projet non valide.
InvalidProjectKind	Type de projet non valide.
InvalidRecordingsUri	Uri d’enregistrement non valide.
OnlyOneOfUrlsOrContainerOrDataset	Une seule des URL, du conteneur ou du jeu de données.
ExceededNumberOfRecordingsUris	Dépassement du nombre d’uri d’enregistrement.
InvalidChannels	Canaux non valides.
ModelMismatch	Incompatibilité des modèles.
ProjectGenderMismatch	Projeter l’inadéquation entre les sexes.
ModelDeprecated	Modèle obsolète.
ModelExists	Le modèle existe.
ModelNotDeployable	Modèle non déployable.
EndpointNotUpdatable	Le point de terminaison ne peut pas être mis à jour.
SingleDefaultEndpoint	Point de terminaison unique par défaut.
EndpointCannotBeDefault	Le point de terminaison ne peut pas être défini par défaut.
InvalidModelUri	Uri de modèle non valide.
SubscriptionNotFound	Abonnement introuvable.
QuotaViolation	Violation des quotas.
UnsupportedDelta	Delta non pris en charge.
UnsupportedFilter	Filtre non pris en charge.
UnsupportedPagination	Pagination non prise en charge.
UnsupportedDynamicConfiguration	Configuration dynamique non prise en charge.
UnsupportedOrderBy	Commande non prise en charge par.
NoUtf8WithBom	Pas de utf8 avec bom.
ModelDeploymentNotCompleteState	État non complet du déploiement du modèle.
SkuLimitsExist	Il existe des limites de références.
DeployingFailedModel	Déploiement du modèle ayant échoué.
UnsupportedTimeRange	Plage horaire non prise en charge.
InvalidLogDate	Date de journal non valide.
InvalidLogId	ID de journal non valide.
InvalidLogStartTime	Heure de début du journal non valide.
InvalidLogEndTime	Heure de fin du journal non valide.
InvalidTopForLogs	Tête non valide pour les journaux.
InvalidSkipTokenForLogs	Jeton de saut non valide pour les journaux.
DeleteNotAllowed	Supprimer non autorisé.
Forbidden	Interdit.
DeployNotAllowed	Déploiement non autorisé.
UnexpectedError	Erreur inattendue.
InvalidCollection	Collection non valide.
InvalidCallbackUri	Uri de rappel non valide.
InvalidSasValidityDuration	Durée de validité sas invalide.
InaccessibleCustomerStorage	Stockage client inaccessible.
UnsupportedClassBasedAdaptation	Adaptation basée sur la classe non prise en charge.
InvalidWebHookEventKind	Type d’événement de webhook non valide.
InvalidTimeToLive	Temps de vie invalide.
InvalidSourceAzureResourceId	ID de ressource Azure source non valide.
ModelCopyAuthorizationExpired	ModelCopyAuthorization expiré.
EndpointLoggingNotSupported	La journalisation des points de terminaison n’est pas prise en charge.
NoLanguageIdentified	L’identification de la langue n’a reconnu aucune langue.
MultipleLanguagesIdentified	L’identification de la langue reconnaît plusieurs langues. Aucune langue dominante n’a pu être déterminée.
InvalidAudioFormat	Le format de l’audio d’entrée n’est pas pris en charge.
BadChannelConfiguration	Il y a une incompatibilité entre les canaux audio dans les données, dans la configuration ou les exigences de l’application.
InvalidChannelSpecification	La sélection des canaux dans la demande de transcription n’est pas prise en charge (par exemple, ni 0 ni 1 n’ont été sélectionnés).
AudioLengthLimitExceeded	La durée du fichier audio est supérieure à la durée maximale autorisée.
EmptyAudioFile	Le fichier audio est vide.

Error

Object

Erreur

Nom	Type	Description
code	ErrorCode	ErrorCode Codes d’erreur de haut niveau.
details	Error[]	Détails supplémentaires concernant l’erreur et/ou les politiques prévues.
innerError	InnerError	InnerError Nouveau format d’erreur interne conforme aux instructions de l’API Cognitive Services, disponible à l’adresse https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Cela contient les propriétés obligatoires ErrorCode, message et propriétés facultatives target, details (paire clé-valeur), inner error (cela peut être imbriqué).
message	string	Message d’erreur de haut niveau.
target	string	Source de l’erreur. Par exemple, il s’agirait de « documents » ou « document id » en cas de document invalide.

ErrorCode

Énumération

ErrorCode

Valeur	Description
InvalidRequest	Représentant le code d’erreur de demande non valide.
InvalidArgument	Représentation du code d’erreur de l’argument invalide.
InternalServerError	Représentant le code d’erreur interne du serveur.
ServiceUnavailable	Représentant le code d’erreur du service indisponible.
NotFound	Représentant le code d’erreur introuvable.
PipelineError	Représentant le code d’erreur du pipeline.
Conflict	Représentant le code d’erreur de conflit.
InternalCommunicationFailed	Représentation du code d’erreur d’échec de la communication interne.
Forbidden	Représentant le code d’erreur interdit.
NotAllowed	Représentant le code d’erreur non autorisé.
Unauthorized	Représentant le code d’erreur non autorisé.
UnsupportedMediaType	Représentant le code d’erreur de type de support non pris en charge.
TooManyRequests	Représentant le code d’erreur trop de demandes.
UnprocessableEntity	Représentant le code d’erreur de l’entité non traitable.

InnerError

Object

InnerError

Nom	Type	Description
code	DetailedErrorCode	DetailedErrorCode Code d’erreur détaillé enum.
details	object	Détails supplémentaires concernant l’erreur et/ou les politiques prévues.
innerError	InnerError	InnerError Nouveau format d’erreur interne conforme aux instructions de l’API Cognitive Services, disponible à l’adresse https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Cela contient les propriétés obligatoires ErrorCode, message et propriétés facultatives target, details (paire clé-valeur), inner error (cela peut être imbriqué).
message	string	Message d’erreur de haut niveau.
target	string	Source de l’erreur. Par exemple, il s’agirait de « documents » ou « document id » en cas de document invalide.

Phrase

Object

Une phrase transcrite.

Nom	Type	Description
channel	integer (int32)	L’index de canal basé sur 0. Présent uniquement si la séparation des canaux est activée.
confidence	number (float)	Valeur de confiance de l’expression.
durationMilliseconds	integer (int32)	Durée de la phrase en millisecondes.
locale	string	Paramètre régional de l’expression.
offsetMilliseconds	integer (int32)	Décalage de début de la phrase en millisecondes.
speaker	integer (int32)	Numéro entier unique attribué à chaque haut-parleur détecté dans l’audio sans ordre particulier. Présent uniquement si la diarisation du locuteur est activée.
text	string	Le texte transcrit de la phrase.
words	Word[]	Les mots qui composent la phrase. Présent uniquement si les horodatages au niveau du mot sont activés.

TranscribeResult

Object

Résultat de l’opération de transcription.

Nom	Type	Description
combinedPhrases	ChannelCombinedPhrases[]	La transcription complète de chaque chaîne.
durationMilliseconds	integer (int32)	Durée de l’audio en millisecondes.
phrases	Phrase[]	Les résultats de la transcription sont segmentés en phrases.

Word

Object

Mot horodaté dans le formulaire d’affichage.

Nom	Type	Description
durationMilliseconds	integer (int32)	Durée du mot en millisecondes.
offsetMilliseconds	integer (int32)	Décalage de début du mot en millisecondes.
text	string	Le mot reconnu, y compris la ponctuation.