Transcriptions - Transcribe
Synchrone Transkription einer Audiodatei.
POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15
URI-Parameter
Name | In | Erforderlich | Typ | Beschreibung |
---|---|---|---|---|
audio
|
formData | True |
file binary |
Der Inhalt der audiodatei, die transkribiert werden soll. Die Audiodatei muss kürzer als 2 Stunden in der Audiodauer und kleiner als 250 MB sein. |
definition
|
formData |
string |
Metadaten für eine Transkriptionsanforderung. Dieses Feld enthält ein JSON-serialisiertes Objekt vom Typ |
|
endpoint
|
path | True |
string |
Unterstützte Cognitive Services-Endpunkte (Protokoll und Hostname, z. B. https://westus.api.cognitive.microsoft.com). |
api-version
|
query | True |
string |
Die angeforderte API-Version. |
Anforderungsheader
Media Types: "multipart/form-data"
Name | Erforderlich | Typ | Beschreibung |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Stellen Sie hier Ihren kognitiven Leistungskontoschlüssel bereit. |
Antworten
Name | Typ | Beschreibung |
---|---|---|
200 OK |
OKAY |
|
Other Status Codes |
Fehler. |
Sicherheit
Ocp-Apim-Subscription-Key
Stellen Sie hier Ihren kognitiven Leistungskontoschlüssel bereit.
Typ:
apiKey
In:
header
Beispiele
Transcribe an audio file
Beispielanforderung
POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15
Beispiel für eine Antwort
{
"durationMilliseconds": 2000,
"combinedPhrases": [
{
"text": "Weather"
}
],
"phrases": [
{
"offsetMilliseconds": 40,
"durationMilliseconds": 320,
"text": "Weather",
"words": [
{
"text": "weather",
"offsetMilliseconds": 40,
"durationMilliseconds": 320
}
],
"locale": "en-US",
"confidence": 0.78983736
}
]
}
Definitionen
Name | Beschreibung |
---|---|
Channel |
Die vollständige Transkription pro Kanal. |
Detailed |
DetailedErrorCode |
Error |
Fehler |
Error |
ErrorCode |
Inner |
InnerError |
Phrase |
Ein transkribierter Ausdruck. |
Transcribe |
Das Ergebnis des Transcribe-Vorgangs. |
Word |
Zeitstempelwort im Anzeigeformular. |
ChannelCombinedPhrases
Die vollständige Transkription pro Kanal.
Name | Typ | Beschreibung |
---|---|---|
channel |
integer |
Der 0-basierte Kanalindex. Nur vorhanden, wenn die Kanaltrennung aktiviert ist. |
text |
string |
Der transkribierte Text. |
DetailedErrorCode
DetailedErrorCode
Name | Typ | Beschreibung |
---|---|---|
AudioLengthLimitExceeded |
string |
Die Audiodatei ist länger als die maximal zulässige Dauer. |
BadChannelConfiguration |
string |
Es besteht ein Konflikt zwischen Audiokanälen in den Daten, in der Konfiguration oder den Anforderungen der Anwendung. |
DataImportFailed |
string |
Fehler beim Datenimport. |
DeleteNotAllowed |
string |
Löschen nicht zulässig. |
DeployNotAllowed |
string |
Bereitstellen nicht zulässig. |
DeployingFailedModel |
string |
Fehler beim Bereitstellen des Modells. |
EmptyAudioFile |
string |
Die Audiodatei ist leer. |
EmptyRequest |
string |
Leere Anforderung. |
EndpointCannotBeDefault |
string |
Der Endpunkt kann nicht standardmäßig sein. |
EndpointLoggingNotSupported |
string |
Die Endpunktprotokollierung wird nicht unterstützt. |
EndpointNotUpdatable |
string |
Endpunkt nicht aktualisierbar. |
EndpointWithoutLogging |
string |
Endpunkt ohne Protokollierung. |
ExceededNumberOfRecordingsUris |
string |
Die Anzahl der Aufzeichnungs-URIs wurde überschritten. |
FailedDataset |
string |
Fehler beim Dataset. |
Forbidden |
string |
Verboten. |
InUseViolation |
string |
Verletzung des Einsatzes. |
InaccessibleCustomerStorage |
string |
Nicht zugänglicher Kundenspeicher. |
InvalidAdaptationMapping |
string |
Ungültige Anpassungszuordnung. |
InvalidAudioFormat |
string |
Das Format der Eingabeaudio wird nicht unterstützt. |
InvalidBaseModel |
string |
Ungültiges Basismodell. |
InvalidCallbackUri |
string |
Ungültiger Rückruf-URI. |
InvalidChannelSpecification |
string |
Die Auswahl von Kanälen in der Transkriptionsanforderung wird nicht unterstützt (z. B. wurden weder 0 noch 1 ausgewählt.) |
InvalidChannels |
string |
Ungültige Kanäle. |
InvalidCollection |
string |
Ungültige Auflistung. |
InvalidDataset |
string |
Ungültiges Dataset. |
InvalidDocument |
string |
Ungültiges Dokument. |
InvalidDocumentBatch |
string |
Ungültiger Dokumentbatch. |
InvalidLocale |
string |
Ungültiges Gebietsschema. |
InvalidLogDate |
string |
Ungültiges Protokolldatum. |
InvalidLogEndTime |
string |
Ungültige Protokollendzeit. |
InvalidLogId |
string |
Ungültige Protokoll-ID. |
InvalidLogStartTime |
string |
Ungültige Startzeit des Protokolls. |
InvalidModel |
string |
Ungültiges Modell. |
InvalidModelUri |
string |
Ungültiger Modell-URI. |
InvalidParameter |
string |
Ungültiger Parameter. |
InvalidParameterValue |
string |
Ungültiger Parameterwert. |
InvalidPayload |
string |
Ungültige Nutzlast. |
InvalidPermissions |
string |
Ungültige Berechtigungen. |
InvalidPrerequisite |
string |
Ungültige Voraussetzung. |
InvalidProductId |
string |
Ungültige Produkt-ID. |
InvalidProject |
string |
Ungültiges Projekt. |
InvalidProjectKind |
string |
Ungültige Projektart. |
InvalidRecordingsUri |
string |
Ungültiger Aufzeichnungs-URI. |
InvalidRequestBodyFormat |
string |
Ungültiges Anforderungstextformat. |
InvalidSasValidityDuration |
string |
Ungültige Gültigkeitsdauer für sas. |
InvalidSkipTokenForLogs |
string |
Ungültiges Skip-Token für Protokolle. |
InvalidSourceAzureResourceId |
string |
Ungültige Azure-Quellressourcen-ID. |
InvalidSubscription |
string |
Ungültiges Abonnement. |
InvalidTest |
string |
Ungültiger Test. |
InvalidTimeToLive |
string |
Ungültige Zeit für live. |
InvalidTopForLogs |
string |
Ungültiger Anfang für Protokolle. |
InvalidTranscription |
string |
Ungültige Transkription. |
InvalidWebHookEventKind |
string |
Ungültiger Web hook-Ereignistyp. |
MissingInputRecords |
string |
Fehlende Eingabedatensätze. |
ModelCopyAuthorizationExpired |
string |
Abgelaufene ModelCopyAuthorization. |
ModelDeploymentNotCompleteState |
string |
Der Status der Modellbereitstellung ist nicht abgeschlossen. |
ModelDeprecated |
string |
Das Modell ist veraltet. |
ModelExists |
string |
Das Modell ist vorhanden. |
ModelMismatch |
string |
Modellkonflikt. |
ModelNotDeployable |
string |
Das Modell kann nicht bereitgestellt werden. |
ModelVersionIncorrect |
string |
Modellversion falsch. |
MultipleLanguagesIdentified |
string |
Sprachidentifikation hat mehrere Sprachen erkannt. Es konnte keine dominante Sprache bestimmt werden. |
NoLanguageIdentified |
string |
Die Sprachidentifikation hat keine Sprache erkannt. |
NoUtf8WithBom |
string |
No utf8 with bom. |
OnlyOneOfUrlsOrContainerOrDataset |
string |
Nur eine url oder ein Container oder Dataset. |
ProjectGenderMismatch |
string |
Project gender mismatch. |
QuotaViolation |
string |
Kontingentverletzung. |
SingleDefaultEndpoint |
string |
Einzelner Standardendpunkt. |
SkuLimitsExist |
string |
Sku-Grenzwerte sind vorhanden. |
SubscriptionNotFound |
string |
Das Abonnement wurde nicht gefunden. |
UnexpectedError |
string |
Unerwarteter Fehler. |
UnsupportedClassBasedAdaptation |
string |
Nicht unterstützte klassenbasierte Anpassung. |
UnsupportedDelta |
string |
Nicht unterstütztes Delta. |
UnsupportedDynamicConfiguration |
string |
Nicht unterstützte dynamische Konfiguration. |
UnsupportedFilter |
string |
Nicht unterstützter Filter. |
UnsupportedLanguageCode |
string |
Nicht unterstützter Sprachcode. |
UnsupportedOrderBy |
string |
Nicht unterstützte Reihenfolge nach. |
UnsupportedPagination |
string |
Nicht unterstützte Paginierung. |
UnsupportedTimeRange |
string |
Nicht unterstützter Zeitraum. |
Error
Fehler
Name | Typ | Beschreibung |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
Zusätzliche unterstützende Details zu den Fehler- und/oder erwarteten Richtlinien. |
innerError |
InnerError |
|
message |
string |
Fehlermeldung auf hoher Ebene. |
target |
string |
Die Quelle des Fehlers. Bei ungültigen Dokumenten wäre es z. B. "Dokumente" oder "Dokument-ID". |
ErrorCode
ErrorCode
Name | Typ | Beschreibung |
---|---|---|
Conflict |
string |
Stellt den Konfliktfehlercode dar. |
Forbidden |
string |
Stellt den verbotenen Fehlercode dar. |
InternalCommunicationFailed |
string |
Fehlercode für die interne Kommunikation. |
InternalServerError |
string |
Stellt den internen Fehlercode des Servers dar. |
InvalidArgument |
string |
Stellt den fehlercode für ungültiges Argument dar. |
InvalidRequest |
string |
Stellt den ungültigen Anforderungsfehlercode dar. |
NotAllowed |
string |
Stellt den nicht zulässigen Fehlercode dar. |
NotFound |
string |
Stellt den nicht gefundenen Fehlercode dar. |
PipelineError |
string |
Stellt den Pipelinefehlerfehlercode dar. |
ServiceUnavailable |
string |
Stellt den dienst nicht verfügbaren Fehlercode dar. |
TooManyRequests |
string |
Stellt den Fehlercode für zu viele Anforderungen dar. |
Unauthorized |
string |
Stellt den nicht autorisierten Fehlercode dar. |
UnprocessableEntity |
string |
Stellt den nicht verarbeiteten Entitätsfehlercode dar. |
UnsupportedMediaType |
string |
Stellt den Fehlercode für den nicht unterstützten Medientyp dar. |
InnerError
InnerError
Name | Typ | Beschreibung |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
Zusätzliche unterstützende Details zu den Fehler- und/oder erwarteten Richtlinien. |
innerError |
InnerError |
|
message |
string |
Fehlermeldung auf hoher Ebene. |
target |
string |
Die Quelle des Fehlers. Bei ungültigen Dokumenten wäre es z. B. "Dokumente" oder "Dokument-ID". |
Phrase
Ein transkribierter Ausdruck.
Name | Typ | Beschreibung |
---|---|---|
channel |
integer |
Der 0-basierte Kanalindex. Nur vorhanden, wenn die Kanaltrennung aktiviert ist. |
confidence |
number |
Der Konfidenzwert für den Ausdruck. |
durationMilliseconds |
integer |
Die Dauer des Ausdrucks in Millisekunden. |
locale |
string |
Das Gebietsschema des Ausdrucks. |
offsetMilliseconds |
integer |
Der Anfangsoffset des Ausdrucks in Millisekunden. |
speaker |
integer |
Eine eindeutige ganzzahlige Zahl, die jedem Lautsprecher zugewiesen ist, der in der Audiowiedergabe ohne bestimmte Reihenfolge erkannt wird. Nur vorhanden, wenn die Diarisierung des Lautsprechers aktiviert ist. |
text |
string |
Der transkribierte Text des Ausdrucks. |
words |
Word[] |
Die Wörter, aus denen der Ausdruck besteht. Nur vorhanden, wenn Zeitstempel auf Wortebene aktiviert sind. |
TranscribeResult
Das Ergebnis des Transcribe-Vorgangs.
Name | Typ | Beschreibung |
---|---|---|
combinedPhrases |
Das vollständige Transkript für jeden Kanal. |
|
durationMilliseconds |
integer |
Die Dauer des Audiosignals in Millisekunden. |
phrases |
Phrase[] |
Die Transkription führt zu Ausdrücken segmentiert. |
Word
Zeitstempelwort im Anzeigeformular.
Name | Typ | Beschreibung |
---|---|---|
durationMilliseconds |
integer |
Die Dauer des Worts in Millisekunden. |
offsetMilliseconds |
integer |
Der Anfangsoffset des Worts in Millisekunden. |
text |
string |
Das erkannte Wort, einschließlich Interpunktion. |