Transcriptions - Transcribe

Referenz

Dienst:: Azure AI Services

API-Version:: 2024-11-15

Synchrone Transkription einer Audiodatei.

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
audio	formData	True	file binary	Der Inhalt der audiodatei, die transkribiert werden soll. Die Audiodatei muss kürzer als 2 Stunden in der Audiodauer und kleiner als 250 MB sein.
definition	formData		string	Metadaten für eine Transkriptionsanforderung. Dieses Feld enthält ein JSON-serialisiertes Objekt vom Typ `TranscribeDefinition`.
endpoint	path	True	string	Unterstützte Cognitive Services-Endpunkte (Protokoll und Hostname, z. B. https://westus.api.cognitive.microsoft.com).
api-version	query	True	string	Die angeforderte API-Version.

Anforderungsheader

Media Types: "multipart/form-data"

Name	Erforderlich	Typ	Beschreibung
Ocp-Apim-Subscription-Key	True	string	Stellen Sie hier Ihren kognitiven Leistungskontoschlüssel bereit.

Antworten

Name	Typ	Beschreibung
200 OK	TranscribeResult	OKAY
Other Status Codes	Error	Fehler.

Sicherheit

Ocp-Apim-Subscription-Key

Stellen Sie hier Ihren kognitiven Leistungskontoschlüssel bereit.

Typ: apiKey
In: header

Beispiele

Transcribe an audio file

Beispielanforderung

HTTP

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Beispiel für eine Antwort

Statuscode:: 200

{
  "durationMilliseconds": 2000,
  "combinedPhrases": [
    {
      "text": "Weather"
    }
  ],
  "phrases": [
    {
      "offsetMilliseconds": 40,
      "durationMilliseconds": 320,
      "text": "Weather",
      "words": [
        {
          "text": "weather",
          "offsetMilliseconds": 40,
          "durationMilliseconds": 320
        }
      ],
      "locale": "en-US",
      "confidence": 0.78983736
    }
  ]
}

Definitionen

Name	Beschreibung
ChannelCombinedPhrases	Die vollständige Transkription pro Kanal.
DetailedErrorCode	DetailedErrorCode
Error	Fehler
ErrorCode	ErrorCode
InnerError	InnerError
Phrase	Ein transkribierter Ausdruck.
TranscribeResult	Das Ergebnis des Transcribe-Vorgangs.
Word	Zeitstempelwort im Anzeigeformular.

ChannelCombinedPhrases

Die vollständige Transkription pro Kanal.

Name	Typ	Beschreibung
channel	integer	Der 0-basierte Kanalindex. Nur vorhanden, wenn die Kanaltrennung aktiviert ist.
text	string	Der transkribierte Text.

DetailedErrorCode

Name	Typ	Beschreibung
AudioLengthLimitExceeded	string	Die Audiodatei ist länger als die maximal zulässige Dauer.
BadChannelConfiguration	string	Es besteht ein Konflikt zwischen Audiokanälen in den Daten, in der Konfiguration oder den Anforderungen der Anwendung.
DataImportFailed	string	Fehler beim Datenimport.
DeleteNotAllowed	string	Löschen nicht zulässig.
DeployNotAllowed	string	Bereitstellen nicht zulässig.
DeployingFailedModel	string	Fehler beim Bereitstellen des Modells.
EmptyAudioFile	string	Die Audiodatei ist leer.
EmptyRequest	string	Leere Anforderung.
EndpointCannotBeDefault	string	Der Endpunkt kann nicht standardmäßig sein.
EndpointLoggingNotSupported	string	Die Endpunktprotokollierung wird nicht unterstützt.
EndpointNotUpdatable	string	Endpunkt nicht aktualisierbar.
EndpointWithoutLogging	string	Endpunkt ohne Protokollierung.
ExceededNumberOfRecordingsUris	string	Die Anzahl der Aufzeichnungs-URIs wurde überschritten.
FailedDataset	string	Fehler beim Dataset.
Forbidden	string	Verboten.
InUseViolation	string	Verletzung des Einsatzes.
InaccessibleCustomerStorage	string	Nicht zugänglicher Kundenspeicher.
InvalidAdaptationMapping	string	Ungültige Anpassungszuordnung.
InvalidAudioFormat	string	Das Format der Eingabeaudio wird nicht unterstützt.
InvalidBaseModel	string	Ungültiges Basismodell.
InvalidCallbackUri	string	Ungültiger Rückruf-URI.
InvalidChannelSpecification	string	Die Auswahl von Kanälen in der Transkriptionsanforderung wird nicht unterstützt (z. B. wurden weder 0 noch 1 ausgewählt.)
InvalidChannels	string	Ungültige Kanäle.
InvalidCollection	string	Ungültige Auflistung.
InvalidDataset	string	Ungültiges Dataset.
InvalidDocument	string	Ungültiges Dokument.
InvalidDocumentBatch	string	Ungültiger Dokumentbatch.
InvalidLocale	string	Ungültiges Gebietsschema.
InvalidLogDate	string	Ungültiges Protokolldatum.
InvalidLogEndTime	string	Ungültige Protokollendzeit.
InvalidLogId	string	Ungültige Protokoll-ID.
InvalidLogStartTime	string	Ungültige Startzeit des Protokolls.
InvalidModel	string	Ungültiges Modell.
InvalidModelUri	string	Ungültiger Modell-URI.
InvalidParameter	string	Ungültiger Parameter.
InvalidParameterValue	string	Ungültiger Parameterwert.
InvalidPayload	string	Ungültige Nutzlast.
InvalidPermissions	string	Ungültige Berechtigungen.
InvalidPrerequisite	string	Ungültige Voraussetzung.
InvalidProductId	string	Ungültige Produkt-ID.
InvalidProject	string	Ungültiges Projekt.
InvalidProjectKind	string	Ungültige Projektart.
InvalidRecordingsUri	string	Ungültiger Aufzeichnungs-URI.
InvalidRequestBodyFormat	string	Ungültiges Anforderungstextformat.
InvalidSasValidityDuration	string	Ungültige Gültigkeitsdauer für sas.
InvalidSkipTokenForLogs	string	Ungültiges Skip-Token für Protokolle.
InvalidSourceAzureResourceId	string	Ungültige Azure-Quellressourcen-ID.
InvalidSubscription	string	Ungültiges Abonnement.
InvalidTest	string	Ungültiger Test.
InvalidTimeToLive	string	Ungültige Zeit für live.
InvalidTopForLogs	string	Ungültiger Anfang für Protokolle.
InvalidTranscription	string	Ungültige Transkription.
InvalidWebHookEventKind	string	Ungültiger Web hook-Ereignistyp.
MissingInputRecords	string	Fehlende Eingabedatensätze.
ModelCopyAuthorizationExpired	string	Abgelaufene ModelCopyAuthorization.
ModelDeploymentNotCompleteState	string	Der Status der Modellbereitstellung ist nicht abgeschlossen.
ModelDeprecated	string	Das Modell ist veraltet.
ModelExists	string	Das Modell ist vorhanden.
ModelMismatch	string	Modellkonflikt.
ModelNotDeployable	string	Das Modell kann nicht bereitgestellt werden.
ModelVersionIncorrect	string	Modellversion falsch.
MultipleLanguagesIdentified	string	Sprachidentifikation hat mehrere Sprachen erkannt. Es konnte keine dominante Sprache bestimmt werden.
NoLanguageIdentified	string	Die Sprachidentifikation hat keine Sprache erkannt.
NoUtf8WithBom	string	No utf8 with bom.
OnlyOneOfUrlsOrContainerOrDataset	string	Nur eine url oder ein Container oder Dataset.
ProjectGenderMismatch	string	Project gender mismatch.
QuotaViolation	string	Kontingentverletzung.
SingleDefaultEndpoint	string	Einzelner Standardendpunkt.
SkuLimitsExist	string	Sku-Grenzwerte sind vorhanden.
SubscriptionNotFound	string	Das Abonnement wurde nicht gefunden.
UnexpectedError	string	Unerwarteter Fehler.
UnsupportedClassBasedAdaptation	string	Nicht unterstützte klassenbasierte Anpassung.
UnsupportedDelta	string	Nicht unterstütztes Delta.
UnsupportedDynamicConfiguration	string	Nicht unterstützte dynamische Konfiguration.
UnsupportedFilter	string	Nicht unterstützter Filter.
UnsupportedLanguageCode	string	Nicht unterstützter Sprachcode.
UnsupportedOrderBy	string	Nicht unterstützte Reihenfolge nach.
UnsupportedPagination	string	Nicht unterstützte Paginierung.
UnsupportedTimeRange	string	Nicht unterstützter Zeitraum.

Error

Fehler

Name	Typ	Beschreibung
code	ErrorCode	ErrorCode Fehlercodes auf hoher Ebene.
details	Error[]	Zusätzliche unterstützende Details zu den Fehler- und/oder erwarteten Richtlinien.
innerError	InnerError	InnerError Neues inneres Fehlerformat, das den Cognitive Services-API-Richtlinien entspricht, die unter https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8owverfügbar sind. Dies enthält die erforderlichen Eigenschaften ErrorCode, Meldung und optionale Eigenschaftenziel, Details(Schlüsselwertpaar), inneren Fehler(dies kann geschachtelt werden).
message	string	Fehlermeldung auf hoher Ebene.
target	string	Die Quelle des Fehlers. Bei ungültigen Dokumenten wäre es z. B. "Dokumente" oder "Dokument-ID".

ErrorCode

Name	Typ	Beschreibung
Conflict	string	Stellt den Konfliktfehlercode dar.
Forbidden	string	Stellt den verbotenen Fehlercode dar.
InternalCommunicationFailed	string	Fehlercode für die interne Kommunikation.
InternalServerError	string	Stellt den internen Fehlercode des Servers dar.
InvalidArgument	string	Stellt den fehlercode für ungültiges Argument dar.
InvalidRequest	string	Stellt den ungültigen Anforderungsfehlercode dar.
NotAllowed	string	Stellt den nicht zulässigen Fehlercode dar.
NotFound	string	Stellt den nicht gefundenen Fehlercode dar.
PipelineError	string	Stellt den Pipelinefehlerfehlercode dar.
ServiceUnavailable	string	Stellt den dienst nicht verfügbaren Fehlercode dar.
TooManyRequests	string	Stellt den Fehlercode für zu viele Anforderungen dar.
Unauthorized	string	Stellt den nicht autorisierten Fehlercode dar.
UnprocessableEntity	string	Stellt den nicht verarbeiteten Entitätsfehlercode dar.
UnsupportedMediaType	string	Stellt den Fehlercode für den nicht unterstützten Medientyp dar.

InnerError

Name	Typ	Beschreibung
code	DetailedErrorCode	DetailedErrorCode Detaillierte Fehlercode-Enumeration.
details	object	Zusätzliche unterstützende Details zu den Fehler- und/oder erwarteten Richtlinien.
innerError	InnerError	InnerError Neues inneres Fehlerformat, das den Cognitive Services-API-Richtlinien entspricht, die unter https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8owverfügbar sind. Dies enthält die erforderlichen Eigenschaften ErrorCode, Meldung und optionale Eigenschaftenziel, Details(Schlüsselwertpaar), inneren Fehler(dies kann geschachtelt werden).
message	string	Fehlermeldung auf hoher Ebene.
target	string	Die Quelle des Fehlers. Bei ungültigen Dokumenten wäre es z. B. "Dokumente" oder "Dokument-ID".

Phrase

Ein transkribierter Ausdruck.

Name	Typ	Beschreibung
channel	integer	Der 0-basierte Kanalindex. Nur vorhanden, wenn die Kanaltrennung aktiviert ist.
confidence	number	Der Konfidenzwert für den Ausdruck.
durationMilliseconds	integer	Die Dauer des Ausdrucks in Millisekunden.
locale	string	Das Gebietsschema des Ausdrucks.
offsetMilliseconds	integer	Der Anfangsoffset des Ausdrucks in Millisekunden.
speaker	integer	Eine eindeutige ganzzahlige Zahl, die jedem Lautsprecher zugewiesen ist, der in der Audiowiedergabe ohne bestimmte Reihenfolge erkannt wird. Nur vorhanden, wenn die Diarisierung des Lautsprechers aktiviert ist.
text	string	Der transkribierte Text des Ausdrucks.
words	Word[]	Die Wörter, aus denen der Ausdruck besteht. Nur vorhanden, wenn Zeitstempel auf Wortebene aktiviert sind.

TranscribeResult

Das Ergebnis des Transcribe-Vorgangs.

Name	Typ	Beschreibung
combinedPhrases	ChannelCombinedPhrases[]	Das vollständige Transkript für jeden Kanal.
durationMilliseconds	integer	Die Dauer des Audiosignals in Millisekunden.
phrases	Phrase[]	Die Transkription führt zu Ausdrücken segmentiert.

Word

Zeitstempelwort im Anzeigeformular.

Name	Typ	Beschreibung
durationMilliseconds	integer	Die Dauer des Worts in Millisekunden.
offsetMilliseconds	integer	Der Anfangsoffset des Worts in Millisekunden.
text	string	Das erkannte Wort, einschließlich Interpunktion.

Freigeben über