Sprachunterstützung: benutzerdefinierte Modelle
Artikel 03/08/2024
1 Mitwirkender
Feedback
In diesem Artikel
Azure KI Dokument Intelligenz-Modelle bieten Unterstützung für mehrsprachige Dokumentverarbeitung. Unsere Sprachunterstützungsfunktionen ermöglichen es Ihren Benutzern, auf natürliche Weise mit Ihren Anwendungen zu kommunizieren und die globale Reichweite zu erhöhen. Benutzerdefinierte Modelle werden mithilfe Ihrer beschrifteten Datasets trainiert, um unterschiedliche Daten aus strukturierten, halbstrukturierten und unstrukturierten Formularen und Dokumenten zu extrahieren, die für Ihre Anwendungsfälle spezifisch sind. Eigenständige benutzerdefinierte Modelle können kombiniert werden, um zusammengestellte Modelle zu erstellen. Die folgenden Tabellen enthalten die verfügbare Sprach- und Gebietsschemaunterstützung nach Modell und Feature:
Benutzerdefinierter Klassifizierer
Sprache – Gebietsschemacode
Standard
Englisch (USA) – en-US
Englisch (USA) – en-US
Sprache
Code (optional)
Afrikaans
af
Albanisch
sq
Arabisch
ar
Bulgarisch
bg
Chinesisch (Han (vereinfachte Variante))
zh-Hans
Chinesisch (Han (traditionelle Variante))
zh-Hant
Kroatisch
hr
Tschechisch
cs
Dänisch
da
Niederländisch
nl
Estnisch
et
Finnisch
fi
Französisch
fr
Deutsch
de
Hebräisch
he
Hindi
hi
Ungarisch
hu
Indonesisch
id
Italienisch
it
Japanisch
ja
Koreanisch
ko
Lettisch
lv
Litauisch
lt
Mazedonisch
mk
Marathi
mr
Neugriechisch (1453-)
el
Nepali (Makrosprache)
ne
Norwegisch
no
Panjabi
pa
Persisch
fa
Polnisch
pl
Portugiesisch
pt
Rumänisch
rm
Russisch
ru
Slowakisch
sk
Slowenisch
sl
Somali (Arabisch)
so
Somali (Lateinische Schrift)
so-latn
Spanisch
es
Swahili (Makrosprache)
sw
Schwedisch
sv
Tamilisch
ta
Thailändisch
th
Türkisch
tr
Ukrainisch
uk
Urdu
ur
Vietnamesisch
vi
Benutzerdefiniertes neuronales Modell
In der folgenden Tabelle sind die unterstützten Sprachen für gedruckten Text aufgeführt.
Sprache
Code (optional)
Afrikaans
af
Albanisch
sq
Arabisch
ar
Bulgarisch
bg
Chinesisch (vereinfacht)
zh-Hans
Chinesisch (traditionell)
zh-Hant
Kroatisch
hr
Tschechisch
cs
Dänisch
da
Niederländisch
nl
Estnisch
et
Finnisch
fi
Französisch
fr
Deutsch
de
Hebräisch
he
Hindi
hi
Ungarisch
hu
Indonesisch
id
Italienisch
it
Japanisch
ja
Koreanisch
ko
Lettisch
lv
Litauisch
lt
Mazedonisch
mk
Marathi
mr
Neugriechisch (1453-)
el
Nepali (Makrosprache)
ne
Norwegisch
no
Panjabi
pa
Persisch
fa
Polnisch
pl
Portugiesisch
pt
Rumänisch
rm
Russisch
ru
Slowakisch
sk
Slowenisch
sl
Somali (Arabisch)
so
Somali (Lateinische Schrift)
so-latn
Spanisch
es
Swahili (Makrosprache)
sw
Schwedisch
sv
Tamilisch
ta
Thailändisch
th
Türkisch
tr
Ukrainisch
uk
Urdu
ur
Vietnamesisch
vi
In der folgenden Tabelle sind die unterstützten Sprachen für das Extrahieren handschriftlicher Texte aufgeführt.
Sprache
Sprachcode (optional)
Sprache
Sprachcode (optional)
Englisch
en
Japanisch
ja
Chinesisch (vereinfacht)
zh-Hans
Koreanisch
ko
Französisch
fr
Portugiesisch
pt
Deutsch
de
Spanisch
es
Italienisch
it
Neuronale Modelle unterstützen hinzugefügte Sprachen in v3.1
und späteren APIs.
Sprachen
API-Version
Englisch
v4.0:2024-02-29-preview, 2023-10-31-preview
, v3.1:2023-07-31 (GA)
, v3.0:2022-08-31 (GA)
Deutsch
v4.0:2024-02-29-preview, 2023-10-31-preview
, v3.1:2023-07-31 (GA)
Italienisch
v4.0:2024-02-29-preview, 2023-10-31-preview
, v3.1:2023-07-31 (GA)
Französisch
v4.0:2024-02-29-preview, 2023-10-31-preview
, v3.1:2023-07-31 (GA)
Spanisch
v4.0:2024-02-29-preview, 2023-10-31-preview
, v3.1:2023-07-31 (GA)
Niederländisch
v4.0:2024-02-29-preview, 2023-10-31-preview
, v3.1:2023-07-31 (GA)
Benutzerdefiniertes Vorlagenmodell
In der folgenden Tabelle sind die unterstützten Sprachen für gedruckten Text aufgeführt.
Sprache
Code (optional)
Abasisch
abq
Abchasische Sprache
ab
Achinesisch
ace
Acholi
ach
Adangme
ada
Adygeisch
ady
Afar
aa
Afrikaans
af
Akan
ak
Albanisch
sq
Algonkin
alq
Angika (Devanagari)
anp
Arabisch
ar
Asturisch
ast
Asu (Tansania)
asa
Avar
av
Awadhi-Hindi (Devanagari)
awa
Aymara
ay
Aserbaidschanisch (Lateinisch)
az
Bafia
ksf
Bagheli
bfy
Bambara
bm
Baschkirisch
ba
Baskisch
eu
Belarussisch (Kyrillisch)
be, be-cyrl
Belarussisch (Lateinisch)
be, be-latn
Bemba (Sambia)
bem
Bena (Tansania)
bez
Bhojpuri-Hindi (Devanagari)
bho
Bikol
bik
Bini
bin
Bislama
bi
Bodo (Devanagari)
brx
Bosnisch (Lateinisch)
bs
Brajbha
bra
Bretonisch
br
Bulgarisch
bg
Bundeli
bns
Burjatisch (Kyrillisch)
bua
Katalanisch
ca
Cebuano
ceb
Chamling
rab
Chamorro
ch
Tschetschenisch
ce
Chhattisgarhi (Devanagari)
hne
Chiga
cgg
Chinesisch (vereinfacht)
zh-Hans
Chinesisch (traditionell)
zh-Hant
Choctaw
cho
Chukot
ckt
Tschuwaschische
cv
Kornisch
kw
Korsisch
co
Cree
cr
Creek
mus
Krimtatarisch (Lateinisch)
crh
Kroatisch
Std.
Crow
cro
Tschechisch
cs
Dänisch
da
Dargwa
dar
Dari
prs
Dhimal (Devanagari)
dhi
Dogri (Devanagari)
doi
Duala
dua
Dunganisch
dng
Niederländisch
nl
Efik
efi
English
en
Ersjanisch (Kyrillisch)
myv
Estnisch
et
Färöisch
fo
Fidschi
fj
Filipino
fil
Finnisch
fi
Sprache
Code (optional)
Fon
fon
Französisch
fr
Friaulisch
fur
Ga
gaa
Gagausisch (Lateinisch)
gag
Galicisch
gl
Ganda
lg
Gayo
gay
Deutsch
de
Gilbertese
gil
Gondi (Devanagari)
gon
Griechisch
el
Grönländisch
kl
Guaraní
gn
Gurung (Devanagari)
gvr
Gusii
guz
Haitianisches Kreolisch
ht
Halbi (Devanagari)
hlb
Hani
hni
Haryanvi
bgc
Hawaiianisch
haw
Hebräisch
er
Herero
hz
Hiligaynon
hil
Hindi
hi
Hmong Daw (Lateinisch)
mww
Ho (Devanagiri)
hoc
Ungarisch
hu
Iban
iba
Isländisch
stimmt
Igbo
ig
Iloko
ilo
Inari-Samisch
smn
Indonesisch
id
Inguschisch
inh
Interlingual
ia
Inuktitut (Lateinisch)
iu
Irisch
ga
Italienisch
it
Japanisch
ja
Jaunsari (Devanagari)
Jns
Javanisch
jv
Jola-Fonyi
dyo
Kabardinisch
kbd
Kabuverdianu
kea
Kachin (Lateinisch)
kac
Kalenjin
kln
Kalmückisch
xal
Kangri (Devanagari)
xnr
Kanuri
kr
Karatschai-Balkarisch
krc
Karakalpakisch (Kyrillisch)
kaa-cyrl
Karakalpakisch (Lateinisch)
kaa
Kaschubisch
csb
Kasachisch (Kyrillisch)
kk-cyrl
Kasachisch (Lateinisch)
kk-latn
Chakassisch
kjh
Khaling
klr
Khasi
kha
K'iche'
quc
Kikuyu
ki
Kildinsamisch
sjd
Kinyarwanda
rw
Komi
kv
Kikongo
kg
Koreanisch
ko
Korku
kfq
Korjakisch
kpy
Kosraeanisch
kos
Kpelle
kpe
Kuanyama
kj
Kumykisch (Kyrillisch)
kum
Kurdisch (arabisch)
ku-arab
Kurdisch (lateinisch)
ku-latn
Kurukh (Devanagari)
kru
Kirgisisch (Kyrillisch)
ky
Lak
lbe
Lakota
lkt
Sprache
Code (optional)
Lateinisch
la
Lettisch
lv
Lezghian
lex
Lingala
ln
Litauisch
lt
Niedersorbisch
dsb
Lozi
loz
Lule-Samisch
smj
Luo (Kenia und Tansania)
luo
Luxemburgisch
lb
Luhyia
luy
Mazedonisch
mk
Machame
jmc
Maduresisch
mad
Mahasu Pahari (Devanagari)
bfz
Makhuwa-Meetto
mgh
Makonde
kde
Madagassisch
mg
Malaiisch (Lateinisch)
ms
Maltesisch
Mt
Malto (Devanagari)
kmj
Mandinka
mnk
Manx
gv
Maori
mi
Mapudungun
arn
Marathi
mr
Mari (Russland)
chm
Maa
mas
Mende (Sierra Leone)
men (Männer)
Meru
mer
Meta'
mgo
Minangkabau
Min
Mohawk
moh
Mongolisch (Kyrillisch)
mn
Mongondow
mog
Montenegrinisch (Kyrillisch)
cnr-cyrl
Montenegrinisch (Lateinisch)
cnr-latn
Morisyen
mfe
Mundang
mua
Nahuatl
nah
Navajo
nv
Ndonga
ng
Neapolitanisch
nap
Nepalesisch
ne
Ngomba
jgo
Niue
niu
Nogaisch
nog
Nord-Ndebele
nd
Nordsamisch (Lateinisch)
sme
Norwegisch
Nein
Nyanja
ny
Nkore
nyn
Nzima
nzi
Okzitanisch
oc
Ojibwa
oj
Oromo
om
Ossetisch
os
Pampanga
pam
Pangasinensisch
pag
Papiamento
pap
Paschtu
ps
Pedi
nso
Persisch
fa
Polnisch
pl
Portugiesisch (Portugal)
pt
Punjabi (Arabisch)
pa
Quechua
qu
Ripuarisch
ksh
Rumänisch
ro
Rätoromanisch
rm
Rundi
rn
Russisch
ru
Rwa
rwk
Sadri (Devanagari)
sck
Sakha
sah
Samburu
saq
Samoanisch (Lateinisch)
sm
Sango
sg
Sprache
Code (optional)
Sangu (Gabun)
snq
Sanskrit (Devanagari)
sa
Santali (Devanagiri)
sat
Schotten
sco
Schottisch-Gälisch
gd
Sena
seh
Serbisch (Kyrillisch)
sr-cyrl
Serbisch (Lateinisch)
sr, sr-latn
Shambala
ksb
Shona
sn
Siksika
bla
Sirmauri (Devanagari)
srx
Skolt-Samisch
sms
Slowakisch
sk
Slowenisch
sl
Soga
xog
Somali (Arabisch)
SO
Somali (Lateinische Schrift)
so-latn
Songhai
son
Süd-Ndebele
nr
Südliches Altaisch
alt
Südsamisch
sma
Südliches Sotho
st
Spanisch
es
Sundanesisch
su
Suaheli (Lateinisch)
sw
Siswati
ss
Schwedisch
sv
Tabassaran
Tabulatorzeichen
Taschelhit
shi
Tahitisch
ty
Taita
dav
Tadschikisch (Kyrillisch)
tg
Tamilisch
ta
Tatar (Kyrillisch)
tt-cyrl
Tatarisch (Lateinisch)
tt
Teso
teo
Tetum
tet
Thailändisch
th
Thangmi
thf
Tok Pisin
tpi
Tongaisch
Bis
Xitsonga
ts
Setswana
tn
Türkisch
tr
Turkmenisch (Lateinisch)
tk
Tuwinisch
tyv
Udmurtisch
udm
Uigurisch (Kyrillisch)
ug-cyrl
Ukrainisch
uk
Obersorbisch
hsb
Urdu
ur
Uigurisch (Arabisch)
ug
Usbekisch (Arabisch)
uz-arab
Usbekisch (kyrillisch)
uz-cyrl
Usbekisch (Lateinisch)
uz
Vietnamesisch
vi
Volapük
vo
Vunjo
vun
Walser
wae
Walisisch
cy
Westfriesisch
fy
Wolof
wo
Xhosa
xh
Yukatekisches Maya
yua
Zapotekisch
zap
Djerma
dje
Zhuang
za
Zulu
zu
In der folgenden Tabelle sind die unterstützten Sprachen für das Extrahieren handschriftlicher Texte aufgeführt:
Sprache
Sprachcode (optional)
Sprache
Sprachcode (optional)
Englisch
en
Japanisch
ja
Chinesisch (vereinfacht)
zh-Hans
Koreanisch
ko
Französisch
fr
Portugiesisch
pt
Deutsch
de
Spanisch
es
Italienisch
it