Freigeben über


Sprach- und Stimmunterstützung für den Speech-Dienst

In den folgenden Tabellen wird die Sprachunterstützung für Spracherkennung, Sprachsynthese, Aussprachebewertung, Sprachübersetzung, Sprecher*innenerkennung und weitere Dienstfeatures zusammengefasst.

Eine vollständige Liste der Gebietsschemas und Stimmen, die für jede Region bzw. jeden Endpunkt unterstützt werden, finden Sie unter:

Unterstützte Sprachen

Die Sprachunterstützung ist abhängig von der Funktion des Speech-Diensts.

Hinweis

Die unterstützten Sprachen finden Sie separat in der Dokumentation für Speech-Container und Eingebettete Sprache.

Wählen Sie eine Speech-Funktion aus

In der Tabelle in diesem Abschnitt werden die Gebietsschemas zusammengefasst, die für die Echtzeit-Spracherkennung, schnelle Transkription und Batchtranskription unterstützt werden.

Weitere Anmerkungen zu Gebietsschemas für die Spracherkennung sind im Abschnitt Custom Speech dieses Artikels enthalten.

Tipp

Probieren Sie das Azure KI Speech-Toolkit aus, um einfach Beispiele in Visual Studio Code zu erstellen und auszuführen.

Gebietsschema (BCP-47) Sprache Unterstützung für schnelle Transkriptionen Custom Speech-Unterstützung
af-ZA Afrikaans (Südafrika) Nein Nur-Text
am-ET Amharisch (Äthiopien) Nein Nur-Text
ar-AE Arabisch (Vereinigte Arabische Emirate) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-BH Arabisch (Bahrain) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-DZ Arabisch (Algerien) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-EG Arabisch (Ägypten) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text
ar-IL Arabisch (Israel) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-IQ Arabisch (Irak) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-JO Arabisch (Jordanien) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-KW Arabisch (Kuwait) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-LB Arabisch (Libanon) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-LY Arabisch (Libyen) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-MA Arabisch (Marokko) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-OM Arabisch (Oman) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-PS Arabisch (Palästinensische Autonomiebehörde) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-QA Arabisch (Katar) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-SA Arabisch (Saudi-Arabien) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausdrucksliste
ar-SY Arabisch (Syrien) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-TN Arabisch (Tunesien) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ar-YE Arabisch (Jemen) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
as-IN Assamisch (Indien) Nein Audiodaten + von Menschen bezeichnetes Transkript
az-AZ Aserbaidschanisch (lateinisch, Aserbaidschan) Nein Nur-Text
bg-BG Bulgarisch (Bulgarien) Nein Nur-Text
bn-IN Bangla (Indien) Nein Nur-Text
bs-BA Bosnien (Bosnien und Herzegowina) Nein Nur-Text
ca-ES Katalanisch Nein Nur-Text

Aussprache
cs-CZ Tschechisch (Tschechien) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
cy-GB Walisisch (Großbritannien) Nein Nur-Text
da-DK Dänisch (Dänemark) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache
de-AT Deutsch (Österreich) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
de-CH Deutsch (Schweiz) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Aussprache

Ausdrucksliste
de-DE Deutsch (Deutschland) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
el-GR Griechisch (Griechenland) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text
en-AU Englisch (Australien) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
en-CA Englisch (Kanada) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
en-GB Walisisch (Großbritannien) Ja Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
en-GH Englisch (Ghana) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Aussprache
en-HK Englisch (Hongkong SAR) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache
en-IE Englisch (Irland) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
en-IN Englisch (Indien) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
en-KE Englisch (Kenia) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Aussprache
en-NG Englisch (Nigeria) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache
en-NZ Englisch (Neuseeland) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache
en-PH Englisch (Philippinen) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache
en-SG Englisch (Singapur) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache
en-TZ Englisch (Tansania) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Aussprache
en-US Englisch (Vereinigte Staaten) Ja Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
en-ZA Englisch (Südafrika) Nein Audiodaten + von Menschen bezeichnetes Transkript

Audio

Nur-Text

Strukturierter Text

Aussprache

Ausdrucksliste
es-AR Spanisch (Argentinien) Nein Nur-Text

Strukturierter Text

Aussprache
es-BO Spanisch (Bolivien) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-CL Spanisch (Chile) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-CO Spanisch (Kolumbien) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-CR Spanisch (Costa Rica) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-CU Spanisch (Kuba) Nein Nur-Text

Strukturierter Text

Aussprache
es-DO Spanisch (Dominikanische Republik) Nein Nur-Text

Strukturierter Text

Aussprache
es-EC Spanisch (Ecuador) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-ES Spanisch (Spanien) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
es-GQ Spanisch (Äquatorialguinea) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text
es-GT Spanisch (Guatemala) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-HN Spanisch (Honduras) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-MX Spanisch (Mexiko) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
es-NI Spanisch (Nicaragua) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-PA Spanisch (Panama) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-PE Spanisch (Peru) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-PR Spanisch (Puerto Rico) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-PY Spanisch (Paraguay) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-SV Spanisch (El Salvador) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-US Spanisch (USA)1 Nein Nur-Text

Strukturierter Text

Aussprache

Ausdrucksliste
es-UY Spanisch (Uruguay) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
es-VE Spanisch (Venezuela) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
et-EE Estnisch (Estland) Nein Nur-Text

Aussprache
eu-ES Baskisch Nein Nur-Text
fa-IR Persisch (Iran) Nein Nur-Text
fi-FI Finnisch (Finnland) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache
fil-PH Philippinisch (Philippinen) Nein Nur-Text

Aussprache
fr-BE Französisch (Belgien) Nein Nur-Text
fr-CA Französisch (Kanada)1 Nein Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
fr-CH Französisch (Schweiz) Nein Nur-Text

Aussprache
fr-FR Französisch (Frankreich) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
ga-IE Irisch (Irland) Nein Nur-Text

Aussprache
gl-ES Galizisch Nein Nur-Text
gu-IN Gujarati (Indien) Nein Nur-Text
he-IL Hebräisch (Israel) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
hi-IN Hindi (Indien) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Ausdrucksliste
hr-HR Kroatisch (Kroatien) Nein Nur-Text

Aussprache
hu-HU Ungarisch (Ungarn) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache
hy-AM Armenisch (Armenien) Nein Nur-Text
id-ID Indonesisch (Indonesien) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Aussprache

Ausdrucksliste
is-IS Isländisch (Island) Nein Nur-Text
it-CH Italienisch (Schweiz) Nein Nur-Text
it-IT Italienisch (Italien) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
ja-JP Japanisch (Japan) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Ausdrucksliste
jv-ID Javanisch (Latein, Indonesien) Nein Nur-Text
ka-GE Georgisch (Georgien) Nein Nur-Text
kk-KZ Kasachisch (Kasachstan) Nein Nur-Text
km-KH Khmer (Kambodscha) Nein Nur-Text
kn-IN Kannada (Indien) Nein Nur-Text
ko-KR Koreanisch (Korea) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Ausdrucksliste
lo-LA Laotisch (Laos) Nein Nur-Text
lt-LT Litauisch (Litauen) Nein Nur-Text

Aussprache
lv-LV Lettisch (Lettland) Nein Nur-Text

Aussprache
mk-MK Mazedonisch (Nordmazedonien) Nein Nur-Text
ml-IN Malayalam (Indien) Nein Nur-Text
mn-MN Mongolisch (Mongolei) Nein Nur-Text
mr-IN Marathi (Indien) Nein Nur-Text
ms-MY Malaiisch (Malaysia) Nein Nur-Text
mt-MT Maltesisch (Malta) Nein Nur-Text
my-MM Birmanisch (Myanmar) Nein Nur-Text
nb-NO Norwegisch, Bokmål (Norwegen) Nein Nur-Text

Ausgabeformat
ne-NP Nepalesisch (Nepal) Nein Nur-Text
nl-BE Niederländisch (Belgien) Nein Nur-Text
nl-NL Niederländisch (Niederlande) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
or-IN Odia (Indien) Nein Audiodaten + von Menschen bezeichnetes Transkript
pa-IN Punjabi (Indien) Nein Audiodaten + von Menschen bezeichnetes Transkript
pl-PL Polnisch (Polen) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
ps-AF Paschtu (Afghanistan) Nein Nur-Text
pt-BR Portugiesisch (Brasilien) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
pt-PT Portugiesisch (Portugal) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
ro-RO Rumänisch (Rumänien) Nein Nur-Text

Aussprache
ru-RU Russisch (Russische Föderation) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausdrucksliste
si-LK Singhalesisch (Sri Lanka) Nein Nur-Text
sk-SK Slowakisch (Slowakei) Nein Nur-Text

Aussprache
sl-SI Slowenisch (Slowenien) Nein Nur-Text

Aussprache
so-SO Somalia (Somalia) Nein Nur-Text
sq-AL Albanisch (Albanien) Nein Nur-Text
sr-RS Serbisch (Kyrillisch, Serbien) Nein Nur-Text
sv-SE Schwedisch (Schweden) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Aussprache

Ausdrucksliste
sw-KE Suaheli (Kenia) Nein Nur-Text
sw-TZ Suaheli (Tansania) Nein Nur-Text
ta-IN Tamil (Indien) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text
te-IN Telugu (Indien) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text
th-TH Thailändisch (Thailand) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Ausdrucksliste
tr-TR Türkisch (Türkiye) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat
uk-UA Ukrainisch (Ukraine) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text
ur-IN Urdu (Indien) Nein Audiodaten + von Menschen bezeichnetes Transkript
uz-UZ Usbekisch (Lateinisch, Usbekistan) Nein Nur-Text
vi-VN Vietnamesisch (Vietnam) Nein Nur-Text

Ausdrucksliste
wuu-CN Chinesisch (Wu, vereinfacht) Nein Nur-Text
yue-CN Chinesisch (Kantonesisch, vereinfacht) Nein Nur-Text
zh-CN Chinesisch (Mandarin, vereinfacht) Ja Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Ausdrucksliste
zh-CN-shandong Chinesisch (Jilu Mandarin, vereinfacht) Nein Nur-Text
zh-CN-sichuan Chinesisch (Mandarin, Südwesten; vereinfacht) Nein Nur-Text
zh-HK Chinesisch (Kantonesisch, traditionell) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Ausdrucksliste
zh-TW Chinesisch (Taiwanesisch, Mandarin; traditionell) Nein Audiodaten + von Menschen bezeichnetes Transkript

Nur-Text

Strukturierter Text

Ausgabeformat

Ausdrucksliste
zu-ZA isi Zulu (Südafrika) Nein Nur-Text

1 Das Modell ist zweisprachig und unterstützt auch Englisch.

Custom Speech

Um die Genauigkeit der Spracherkennung zu verbessern, sind für einige Sprachen und Basismodelle Anpassungen verfügbar. Je nach Gebietsschema können Sie Audio und von Menschen bezeichnete Transkripte, unformatierten Text, strukturierten Text und Aussprachedaten hochladen. Die Anpassung mit Nur-Text wird standardmäßig für alle verfügbaren Basismodelle unterstützt. Weitere Informationen zur Anpassung finden Sie unter Custom Speech.

Diese Regionen unterstützen die Anzeigetext-Formatierung: da-DK, de-DE, en-AU, en-CA, en-GB, en-HK, en-IE, en-IN, en-NG, en-NZ, en-PH, en-SG, en-US, es-ES, es-MX, fi-FI, fr-CA, fr-FR, hi-IN, it-IT, ja-JP, ko-KR, nb-NO, nl-NL, pl-PL, pt-BR, pt-PT, sv-SE, tr-TR, zh-CN, zh-HK.

Nächste Schritte