Freigeben über


Transcriptions - Transcribe

Synchrone Transkription einer Audiodatei.

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

URI-Parameter

Name In Erforderlich Typ Beschreibung
audio
formData True

file

binary

Der Inhalt der audiodatei, die transkribiert werden soll. Die Audiodatei muss kürzer als 2 Stunden in der Audiodauer und kleiner als 250 MB sein.

definition
formData

string

Metadaten für eine Transkriptionsanforderung. Dieses Feld enthält ein JSON-serialisiertes Objekt vom Typ TranscribeDefinition.

endpoint
path True

string

Unterstützte Cognitive Services-Endpunkte (Protokoll und Hostname, z. B. https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Die angeforderte API-Version.

Anforderungsheader

Media Types: "multipart/form-data"

Name Erforderlich Typ Beschreibung
Ocp-Apim-Subscription-Key True

string

Stellen Sie hier Ihren kognitiven Leistungskontoschlüssel bereit.

Antworten

Name Typ Beschreibung
200 OK

TranscribeResult

OKAY

Other Status Codes

Error

Fehler.

Sicherheit

Ocp-Apim-Subscription-Key

Stellen Sie hier Ihren kognitiven Leistungskontoschlüssel bereit.

Typ: apiKey
In: header

Beispiele

Transcribe an audio file

Beispielanforderung

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Beispiel für eine Antwort

{
  "durationMilliseconds": 2000,
  "combinedPhrases": [
    {
      "text": "Weather"
    }
  ],
  "phrases": [
    {
      "offsetMilliseconds": 40,
      "durationMilliseconds": 320,
      "text": "Weather",
      "words": [
        {
          "text": "weather",
          "offsetMilliseconds": 40,
          "durationMilliseconds": 320
        }
      ],
      "locale": "en-US",
      "confidence": 0.78983736
    }
  ]
}

Definitionen

Name Beschreibung
ChannelCombinedPhrases

Die vollständige Transkription pro Kanal.

DetailedErrorCode

DetailedErrorCode

Error

Fehler

ErrorCode

ErrorCode

InnerError

InnerError

Phrase

Ein transkribierter Ausdruck.

TranscribeResult

Das Ergebnis des Transcribe-Vorgangs.

Word

Zeitstempelwort im Anzeigeformular.

ChannelCombinedPhrases

Die vollständige Transkription pro Kanal.

Name Typ Beschreibung
channel

integer

Der 0-basierte Kanalindex. Nur vorhanden, wenn die Kanaltrennung aktiviert ist.

text

string

Der transkribierte Text.

DetailedErrorCode

DetailedErrorCode

Name Typ Beschreibung
AudioLengthLimitExceeded

string

Die Audiodatei ist länger als die maximal zulässige Dauer.

BadChannelConfiguration

string

Es besteht ein Konflikt zwischen Audiokanälen in den Daten, in der Konfiguration oder den Anforderungen der Anwendung.

DataImportFailed

string

Fehler beim Datenimport.

DeleteNotAllowed

string

Löschen nicht zulässig.

DeployNotAllowed

string

Bereitstellen nicht zulässig.

DeployingFailedModel

string

Fehler beim Bereitstellen des Modells.

EmptyAudioFile

string

Die Audiodatei ist leer.

EmptyRequest

string

Leere Anforderung.

EndpointCannotBeDefault

string

Der Endpunkt kann nicht standardmäßig sein.

EndpointLoggingNotSupported

string

Die Endpunktprotokollierung wird nicht unterstützt.

EndpointNotUpdatable

string

Endpunkt nicht aktualisierbar.

EndpointWithoutLogging

string

Endpunkt ohne Protokollierung.

ExceededNumberOfRecordingsUris

string

Die Anzahl der Aufzeichnungs-URIs wurde überschritten.

FailedDataset

string

Fehler beim Dataset.

Forbidden

string

Verboten.

InUseViolation

string

Verletzung des Einsatzes.

InaccessibleCustomerStorage

string

Nicht zugänglicher Kundenspeicher.

InvalidAdaptationMapping

string

Ungültige Anpassungszuordnung.

InvalidAudioFormat

string

Das Format der Eingabeaudio wird nicht unterstützt.

InvalidBaseModel

string

Ungültiges Basismodell.

InvalidCallbackUri

string

Ungültiger Rückruf-URI.

InvalidChannelSpecification

string

Die Auswahl von Kanälen in der Transkriptionsanforderung wird nicht unterstützt (z. B. wurden weder 0 noch 1 ausgewählt.)

InvalidChannels

string

Ungültige Kanäle.

InvalidCollection

string

Ungültige Auflistung.

InvalidDataset

string

Ungültiges Dataset.

InvalidDocument

string

Ungültiges Dokument.

InvalidDocumentBatch

string

Ungültiger Dokumentbatch.

InvalidLocale

string

Ungültiges Gebietsschema.

InvalidLogDate

string

Ungültiges Protokolldatum.

InvalidLogEndTime

string

Ungültige Protokollendzeit.

InvalidLogId

string

Ungültige Protokoll-ID.

InvalidLogStartTime

string

Ungültige Startzeit des Protokolls.

InvalidModel

string

Ungültiges Modell.

InvalidModelUri

string

Ungültiger Modell-URI.

InvalidParameter

string

Ungültiger Parameter.

InvalidParameterValue

string

Ungültiger Parameterwert.

InvalidPayload

string

Ungültige Nutzlast.

InvalidPermissions

string

Ungültige Berechtigungen.

InvalidPrerequisite

string

Ungültige Voraussetzung.

InvalidProductId

string

Ungültige Produkt-ID.

InvalidProject

string

Ungültiges Projekt.

InvalidProjectKind

string

Ungültige Projektart.

InvalidRecordingsUri

string

Ungültiger Aufzeichnungs-URI.

InvalidRequestBodyFormat

string

Ungültiges Anforderungstextformat.

InvalidSasValidityDuration

string

Ungültige Gültigkeitsdauer für sas.

InvalidSkipTokenForLogs

string

Ungültiges Skip-Token für Protokolle.

InvalidSourceAzureResourceId

string

Ungültige Azure-Quellressourcen-ID.

InvalidSubscription

string

Ungültiges Abonnement.

InvalidTest

string

Ungültiger Test.

InvalidTimeToLive

string

Ungültige Zeit für live.

InvalidTopForLogs

string

Ungültiger Anfang für Protokolle.

InvalidTranscription

string

Ungültige Transkription.

InvalidWebHookEventKind

string

Ungültiger Web hook-Ereignistyp.

MissingInputRecords

string

Fehlende Eingabedatensätze.

ModelCopyAuthorizationExpired

string

Abgelaufene ModelCopyAuthorization.

ModelDeploymentNotCompleteState

string

Der Status der Modellbereitstellung ist nicht abgeschlossen.

ModelDeprecated

string

Das Modell ist veraltet.

ModelExists

string

Das Modell ist vorhanden.

ModelMismatch

string

Modellkonflikt.

ModelNotDeployable

string

Das Modell kann nicht bereitgestellt werden.

ModelVersionIncorrect

string

Modellversion falsch.

MultipleLanguagesIdentified

string

Sprachidentifikation hat mehrere Sprachen erkannt. Es konnte keine dominante Sprache bestimmt werden.

NoLanguageIdentified

string

Die Sprachidentifikation hat keine Sprache erkannt.

NoUtf8WithBom

string

No utf8 with bom.

OnlyOneOfUrlsOrContainerOrDataset

string

Nur eine url oder ein Container oder Dataset.

ProjectGenderMismatch

string

Project gender mismatch.

QuotaViolation

string

Kontingentverletzung.

SingleDefaultEndpoint

string

Einzelner Standardendpunkt.

SkuLimitsExist

string

Sku-Grenzwerte sind vorhanden.

SubscriptionNotFound

string

Das Abonnement wurde nicht gefunden.

UnexpectedError

string

Unerwarteter Fehler.

UnsupportedClassBasedAdaptation

string

Nicht unterstützte klassenbasierte Anpassung.

UnsupportedDelta

string

Nicht unterstütztes Delta.

UnsupportedDynamicConfiguration

string

Nicht unterstützte dynamische Konfiguration.

UnsupportedFilter

string

Nicht unterstützter Filter.

UnsupportedLanguageCode

string

Nicht unterstützter Sprachcode.

UnsupportedOrderBy

string

Nicht unterstützte Reihenfolge nach.

UnsupportedPagination

string

Nicht unterstützte Paginierung.

UnsupportedTimeRange

string

Nicht unterstützter Zeitraum.

Error

Fehler

Name Typ Beschreibung
code

ErrorCode

ErrorCode
Fehlercodes auf hoher Ebene.

details

Error[]

Zusätzliche unterstützende Details zu den Fehler- und/oder erwarteten Richtlinien.

innerError

InnerError

InnerError
Neues inneres Fehlerformat, das den Cognitive Services-API-Richtlinien entspricht, die unter https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8owverfügbar sind. Dies enthält die erforderlichen Eigenschaften ErrorCode, Meldung und optionale Eigenschaftenziel, Details(Schlüsselwertpaar), inneren Fehler(dies kann geschachtelt werden).

message

string

Fehlermeldung auf hoher Ebene.

target

string

Die Quelle des Fehlers. Bei ungültigen Dokumenten wäre es z. B. "Dokumente" oder "Dokument-ID".

ErrorCode

ErrorCode

Name Typ Beschreibung
Conflict

string

Stellt den Konfliktfehlercode dar.

Forbidden

string

Stellt den verbotenen Fehlercode dar.

InternalCommunicationFailed

string

Fehlercode für die interne Kommunikation.

InternalServerError

string

Stellt den internen Fehlercode des Servers dar.

InvalidArgument

string

Stellt den fehlercode für ungültiges Argument dar.

InvalidRequest

string

Stellt den ungültigen Anforderungsfehlercode dar.

NotAllowed

string

Stellt den nicht zulässigen Fehlercode dar.

NotFound

string

Stellt den nicht gefundenen Fehlercode dar.

PipelineError

string

Stellt den Pipelinefehlerfehlercode dar.

ServiceUnavailable

string

Stellt den dienst nicht verfügbaren Fehlercode dar.

TooManyRequests

string

Stellt den Fehlercode für zu viele Anforderungen dar.

Unauthorized

string

Stellt den nicht autorisierten Fehlercode dar.

UnprocessableEntity

string

Stellt den nicht verarbeiteten Entitätsfehlercode dar.

UnsupportedMediaType

string

Stellt den Fehlercode für den nicht unterstützten Medientyp dar.

InnerError

InnerError

Name Typ Beschreibung
code

DetailedErrorCode

DetailedErrorCode
Detaillierte Fehlercode-Enumeration.

details

object

Zusätzliche unterstützende Details zu den Fehler- und/oder erwarteten Richtlinien.

innerError

InnerError

InnerError
Neues inneres Fehlerformat, das den Cognitive Services-API-Richtlinien entspricht, die unter https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8owverfügbar sind. Dies enthält die erforderlichen Eigenschaften ErrorCode, Meldung und optionale Eigenschaftenziel, Details(Schlüsselwertpaar), inneren Fehler(dies kann geschachtelt werden).

message

string

Fehlermeldung auf hoher Ebene.

target

string

Die Quelle des Fehlers. Bei ungültigen Dokumenten wäre es z. B. "Dokumente" oder "Dokument-ID".

Phrase

Ein transkribierter Ausdruck.

Name Typ Beschreibung
channel

integer

Der 0-basierte Kanalindex. Nur vorhanden, wenn die Kanaltrennung aktiviert ist.

confidence

number

Der Konfidenzwert für den Ausdruck.

durationMilliseconds

integer

Die Dauer des Ausdrucks in Millisekunden.

locale

string

Das Gebietsschema des Ausdrucks.

offsetMilliseconds

integer

Der Anfangsoffset des Ausdrucks in Millisekunden.

speaker

integer

Eine eindeutige ganzzahlige Zahl, die jedem Lautsprecher zugewiesen ist, der in der Audiowiedergabe ohne bestimmte Reihenfolge erkannt wird. Nur vorhanden, wenn die Diarisierung des Lautsprechers aktiviert ist.

text

string

Der transkribierte Text des Ausdrucks.

words

Word[]

Die Wörter, aus denen der Ausdruck besteht. Nur vorhanden, wenn Zeitstempel auf Wortebene aktiviert sind.

TranscribeResult

Das Ergebnis des Transcribe-Vorgangs.

Name Typ Beschreibung
combinedPhrases

ChannelCombinedPhrases[]

Das vollständige Transkript für jeden Kanal.

durationMilliseconds

integer

Die Dauer des Audiosignals in Millisekunden.

phrases

Phrase[]

Die Transkription führt zu Ausdrücken segmentiert.

Word

Zeitstempelwort im Anzeigeformular.

Name Typ Beschreibung
durationMilliseconds

integer

Die Dauer des Worts in Millisekunden.

offsetMilliseconds

integer

Der Anfangsoffset des Worts in Millisekunden.

text

string

Das erkannte Wort, einschließlich Interpunktion.