Transcriptions - Transcribe

Transcription synchrone d’un fichier audio.

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2025-10-15

Paramètres URI

Nom Dans Obligatoire Type Description
audio
formData

file (binary)

Le contenu du fichier audio à transcrire. La durée audio du fichier audio doit être inférieure à 2 heures et inférieure à 250 Mo.

definition
formData

string

Métadonnées pour une demande de transcription. Ce champ contient un objet sérialisé JSON de type TranscribeDefinition.

endpoint
path True

string

Points de terminaison Cognitive Services pris en charge (protocole et nom d’hôte, par exemple : https://westus.api.cognitive.microsoft.com).

api-version
query True

string

La version de l’API demandée.

En-tête de la demande

Media Types: "multipart/form-data"

Nom Obligatoire Type Description
Ocp-Apim-Subscription-Key True

string

Fournissez votre clé de compte Cognitive Services ici.

Réponses

Nom Type Description
200 OK

TranscribeResult

Ok

Other Status Codes

Error

Une erreur est survenue.

Sécurité

Ocp-Apim-Subscription-Key

Fournissez votre clé de compte Cognitive Services ici.

Type: apiKey
Dans: header

Exemples

Transcribe an audio file

Exemple de requête

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2025-10-15

Exemple de réponse

{
  "durationMilliseconds": 2000,
  "combinedPhrases": [
    {
      "text": "Weather"
    }
  ],
  "phrases": [
    {
      "offsetMilliseconds": 40,
      "durationMilliseconds": 320,
      "text": "Weather",
      "words": [
        {
          "text": "weather",
          "offsetMilliseconds": 40,
          "durationMilliseconds": 320
        }
      ],
      "locale": "en-US",
      "confidence": 0.78983736
    }
  ]
}

Définitions

Nom Description
ChannelCombinedPhrases

La transcription complète par chaîne.

DetailedErrorCode

DetailedErrorCode

Error

Erreur

ErrorCode

ErrorCode

InnerError

InnerError

Phrase

Une phrase transcrite.

TranscribeResult

Résultat de l’opération de transcription.

Word

Mot horodaté dans le formulaire d’affichage.

ChannelCombinedPhrases

La transcription complète par chaîne.

Nom Type Description
channel

integer (int32)

L’index de canal basé sur 0. Présent uniquement si la séparation des canaux est activée.

text

string

Texte transcrit.

DetailedErrorCode

DetailedErrorCode

Valeur Description
InvalidParameterValue

Valeur de paramètre non valide.

InvalidRequestBodyFormat

Format du corps de la demande non valide.

EmptyRequest

Demande vide.

MissingInputRecords

Enregistrements d’entrée manquants.

InvalidDocument

Document non valide.

ModelVersionIncorrect

Version du modèle incorrecte.

InvalidDocumentBatch

Lot de documents non valide.

UnsupportedLanguageCode

Code de langue non pris en charge.

DataImportFailed

Echec de l’importation des données.

InUseViolation

En violation d’utilisation.

InvalidLocale

Paramètres régionaux non valides.

InvalidBaseModel

Modèle de base non valide.

InvalidAdaptationMapping

Mappage d’adaptation non valide.

InvalidDataset

Jeu de données non valide.

InvalidTest

Test non valide.

FailedDataset

Jeu de données ayant échoué.

InvalidModel

Modèle non valide.

InvalidTranscription

Transcription incorrecte.

InvalidPayload

Charge utile non valide.

InvalidParameter

Paramètre non valide.

EndpointWithoutLogging

Point de terminaison sans journalisation.

InvalidPermissions

Autorisations non valides.

InvalidPrerequisite

Prérequis non valide.

InvalidProductId

L’identifiant du produit n’est pas valide.

InvalidSubscription

Abonnement non valide.

InvalidProject

Projet non valide.

InvalidProjectKind

Type de projet non valide.

InvalidRecordingsUri

Uri d’enregistrement non valide.

OnlyOneOfUrlsOrContainerOrDataset

Une seule des URL, du conteneur ou du jeu de données.

ExceededNumberOfRecordingsUris

Dépassement du nombre d’uri d’enregistrement.

InvalidChannels

Canaux non valides.

ModelMismatch

Incompatibilité des modèles.

ProjectGenderMismatch

Projeter l’inadéquation entre les sexes.

ModelDeprecated

Modèle obsolète.

ModelExists

Le modèle existe.

ModelNotDeployable

Modèle non déployable.

EndpointNotUpdatable

Le point de terminaison ne peut pas être mis à jour.

SingleDefaultEndpoint

Point de terminaison unique par défaut.

EndpointCannotBeDefault

Le point de terminaison ne peut pas être défini par défaut.

InvalidModelUri

Uri de modèle non valide.

SubscriptionNotFound

Abonnement introuvable.

QuotaViolation

Violation des quotas.

UnsupportedDelta

Delta non pris en charge.

UnsupportedFilter

Filtre non pris en charge.

UnsupportedPagination

Pagination non prise en charge.

UnsupportedDynamicConfiguration

Configuration dynamique non prise en charge.

UnsupportedOrderBy

Commande non prise en charge par.

NoUtf8WithBom

Pas de utf8 avec bom.

ModelDeploymentNotCompleteState

État non complet du déploiement du modèle.

SkuLimitsExist

Il existe des limites de références.

DeployingFailedModel

Déploiement du modèle ayant échoué.

UnsupportedTimeRange

Plage horaire non prise en charge.

InvalidLogDate

Date de journal non valide.

InvalidLogId

ID de journal non valide.

InvalidLogStartTime

Heure de début du journal non valide.

InvalidLogEndTime

Heure de fin du journal non valide.

InvalidTopForLogs

Tête non valide pour les journaux.

InvalidSkipTokenForLogs

Jeton de saut non valide pour les journaux.

DeleteNotAllowed

Supprimer non autorisé.

Forbidden

Interdit.

DeployNotAllowed

Déploiement non autorisé.

UnexpectedError

Erreur inattendue.

InvalidCollection

Collection non valide.

InvalidCallbackUri

Uri de rappel non valide.

InvalidSasValidityDuration

Durée de validité sas invalide.

InaccessibleCustomerStorage

Stockage client inaccessible.

UnsupportedClassBasedAdaptation

Adaptation basée sur la classe non prise en charge.

InvalidWebHookEventKind

Type d’événement de webhook non valide.

InvalidTimeToLive

Temps de vie invalide.

InvalidSourceAzureResourceId

ID de ressource Azure source non valide.

ModelCopyAuthorizationExpired

ModelCopyAuthorization expiré.

EndpointLoggingNotSupported

La journalisation des points de terminaison n’est pas prise en charge.

NoLanguageIdentified

L’identification de la langue n’a reconnu aucune langue.

MultipleLanguagesIdentified

L’identification de la langue reconnaît plusieurs langues. Aucune langue dominante n’a pu être déterminée.

InvalidAudioFormat

Le format de l’audio d’entrée n’est pas pris en charge.

BadChannelConfiguration

Il y a une incompatibilité entre les canaux audio dans les données, dans la configuration ou les exigences de l’application.

InvalidChannelSpecification

La sélection des canaux dans la demande de transcription n’est pas prise en charge (par exemple, ni 0 ni 1 n’ont été sélectionnés).

AudioLengthLimitExceeded

La durée du fichier audio est supérieure à la durée maximale autorisée.

EmptyAudioFile

Le fichier audio est vide.

Error

Erreur

Nom Type Description
code

ErrorCode

ErrorCode
Codes d’erreur de haut niveau.

details

Error[]

Détails supplémentaires concernant l’erreur et/ou les politiques prévues.

innerError

InnerError

InnerError
Nouveau format d’erreur interne conforme aux instructions de l’API Cognitive Services, disponible à l’adresse https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Cela contient les propriétés obligatoires ErrorCode, message et propriétés facultatives target, details (paire clé-valeur), inner error (cela peut être imbriqué).

message

string

Message d’erreur de haut niveau.

target

string

Source de l’erreur. Par exemple, il s’agirait de « documents » ou « document id » en cas de document invalide.

ErrorCode

ErrorCode

Valeur Description
InvalidRequest

Représentant le code d’erreur de demande non valide.

InvalidArgument

Représentation du code d’erreur de l’argument invalide.

InternalServerError

Représentant le code d’erreur interne du serveur.

ServiceUnavailable

Représentant le code d’erreur du service indisponible.

NotFound

Représentant le code d’erreur introuvable.

PipelineError

Représentant le code d’erreur du pipeline.

Conflict

Représentant le code d’erreur de conflit.

InternalCommunicationFailed

Représentation du code d’erreur d’échec de la communication interne.

Forbidden

Représentant le code d’erreur interdit.

NotAllowed

Représentant le code d’erreur non autorisé.

Unauthorized

Représentant le code d’erreur non autorisé.

UnsupportedMediaType

Représentant le code d’erreur de type de support non pris en charge.

TooManyRequests

Représentant le code d’erreur trop de demandes.

UnprocessableEntity

Représentant le code d’erreur de l’entité non traitable.

InnerError

InnerError

Nom Type Description
code

DetailedErrorCode

DetailedErrorCode
Code d’erreur détaillé enum.

details

object

Détails supplémentaires concernant l’erreur et/ou les politiques prévues.

innerError

InnerError

InnerError
Nouveau format d’erreur interne conforme aux instructions de l’API Cognitive Services, disponible à l’adresse https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Cela contient les propriétés obligatoires ErrorCode, message et propriétés facultatives target, details (paire clé-valeur), inner error (cela peut être imbriqué).

message

string

Message d’erreur de haut niveau.

target

string

Source de l’erreur. Par exemple, il s’agirait de « documents » ou « document id » en cas de document invalide.

Phrase

Une phrase transcrite.

Nom Type Description
channel

integer (int32)

L’index de canal basé sur 0. Présent uniquement si la séparation des canaux est activée.

confidence

number (float)

Valeur de confiance de l’expression.

durationMilliseconds

integer (int32)

Durée de la phrase en millisecondes.

locale

string

Paramètre régional de l’expression.

offsetMilliseconds

integer (int32)

Décalage de début de la phrase en millisecondes.

speaker

integer (int32)

Numéro entier unique attribué à chaque haut-parleur détecté dans l’audio sans ordre particulier. Présent uniquement si la diarisation du locuteur est activée.

text

string

Le texte transcrit de la phrase.

words

Word[]

Les mots qui composent la phrase. Présent uniquement si les horodatages au niveau du mot sont activés.

TranscribeResult

Résultat de l’opération de transcription.

Nom Type Description
combinedPhrases

ChannelCombinedPhrases[]

La transcription complète de chaque chaîne.

durationMilliseconds

integer (int32)

Durée de l’audio en millisecondes.

phrases

Phrase[]

Les résultats de la transcription sont segmentés en phrases.

Word

Mot horodaté dans le formulaire d’affichage.

Nom Type Description
durationMilliseconds

integer (int32)

Durée du mot en millisecondes.

offsetMilliseconds

integer (int32)

Décalage de début du mot en millisecondes.

text

string

Le mot reconnu, y compris la ponctuation.