Podpora jazyků: vlastní modely
Článek 03/08/2024
1 přispěvatel
Váš názor
V tomto článku
Modely Azure AI Document Intelligence poskytují podporu vícejazyčného zpracování dokumentů. Naše možnosti podpory jazyka umožňují uživatelům komunikovat s vašimi aplikacemi přirozenými způsoby a umožnit globální outreach. Vlastní modely se trénují pomocí označených datových sad k extrakci odlišných dat ze strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů specifických pro vaše případy použití. Samostatné vlastní modely je možné kombinovat a vytvářet složené modely. Následující tabulky uvádějí dostupnou podporu jazyka a národního prostředí podle modelu a funkce:
Vlastní klasifikátor
Jazyk – kód národního prostředí
Výchozí
Angličtina (USA) – cs-CZ
Angličtina (USA) – cs-CZ
Jazyk
Kód (volitelné)
Afrikánština
af
Albánština
sq
Arabština
ar
Bulharština
bg
Čínština (Han (zjednodušená varianta))
zh-Hans
Čínština (Han (tradiční varianta))
zh-Hant
Chorvatština
hr
Čeština
cs
Dánština
da
Nizozemština
nl
Estonština
et
Finština
fi
Francouzština
fr
Němčina
de
Hebrejština
he
Hindština
hi
Maďarština
hu
Indonéština
id
Italština
it
japonština
ja
Korejština
ko
Lotyština
lv
Litevština
lt
Makedonština
mk
Maráthština
mr
Moderní řečtina (1453-)
el
Nepálština (makrolanguage)
ne
Norština
no
Panjabi
pa
Perština
fa
Polština
pl
Portugalština (Brazílie)
pt
Rumunština
rm
Ruština
ru
Slovenština
sk
Slovinština
sl
Somali (arabština)
so
Somali (latinka)
so-latn
Španělština
es
Swahili (makrolanguage)
sw
Švédština
sv
Tamilština
ta
Thajština
th
Turečtina
tr
Ukrajinština
uk
Urdština
ur
Vietnamština
vi
Vlastní neurální
Následující tabulka uvádí podporované jazyky pro tištěný text.
Jazyk
Kód (volitelné)
Afrikánština
af
Albánština
sq
Arabština
ar
Bulharština
bg
Čínština (zjednodušená)
zh-Hans
Čínština (tradiční)
zh-Hant
Chorvatština
hr
Čeština
cs
Dánština
da
Nizozemština
nl
Estonština
et
Finština
fi
Francouzština
fr
Němčina
de
Hebrejština
he
Hindština
hi
Maďarština
hu
Indonéština
id
Italština
it
japonština
ja
Korejština
ko
Lotyština
lv
Litevština
lt
Makedonština
mk
Maráthština
mr
Moderní řečtina (1453-)
el
Nepálština (makrolanguage)
ne
Norština
no
Panjabi
pa
Perština
fa
Polština
pl
Portugalština (Brazílie)
pt
Rumunština
rm
Ruština
ru
Slovenština
sk
Slovinština
sl
Somali (arabština)
so
Somali (latinka)
so-latn
Španělština
es
Swahili (makrolanguage)
sw
Švédština
sv
Tamilština
ta
Thajština
th
Turečtina
tr
Ukrajinština
uk
Urdština
ur
Vietnamština
vi
Následující tabulka uvádí podporované jazyky pro extrakci rukou psaných textů.
Jazyk
Kód jazyka (volitelné)
Jazyk
Kód jazyka (volitelné)
Angličtina
en
Japonština
ja
Čínština (zjednodušená)
zh-Hans
Korejština
ko
Francouzština
fr
Portugalština
pt
Němčina
de
Španělština
es
Italština
it
Neurální modely podporují přidané jazyky pro v3.1
rozhraní API a novější.
Jazyky
Verze rozhraní API
Angličtina
v4.0:2024-02-29-preview, 2023-10-31-preview
, , v3.1:2023-07-31 (GA)
v3.0:2022-08-31 (GA)
Němčina
v4.0:2024-02-29-preview, 2023-10-31-preview
, v3.1:2023-07-31 (GA)
Italština
v4.0:2024-02-29-preview, 2023-10-31-preview
, v3.1:2023-07-31 (GA)
Francouzština
v4.0:2024-02-29-preview, 2023-10-31-preview
, v3.1:2023-07-31 (GA)
Španělština
v4.0:2024-02-29-preview, 2023-10-31-preview
, v3.1:2023-07-31 (GA)
Nizozemština
v4.0:2024-02-29-preview, 2023-10-31-preview
, v3.1:2023-07-31 (GA)
Vlastní šablona
Následující tabulka uvádí podporované jazyky pro tištěný text.
Jazyk
Kód (volitelné)
Abaza
Abq
Abkhazian
ab
Achinese
Ace
Acoli
ach
Adangme
Ada
Adyghe
Ady
Dálky
aa
Afrikánština
af
Akan
Ak
Albánština
sq
Algonquin
alq
Angika (Devanagari)
Anp
Arabština
ar
Asturština
Ast
Asu (Tanzanie)
Asa
Avaric
Av
Awadhi-Hindština (Devanagari)
Awa
Aymara
Ay
Ázerbájdžánština (latinka)
Az
Bafia
ksf
Bagheli
bfy
Bambara
Bm
Baškirština
ba
Baskičtina
eu
Běloruský (cyrilice)
be, be-cyrl
Běloruský (latinka)
be, be-latn
Bemba (Zambia)
Bem
Bena (Tanzanie)
bez
Bhojpurština-Hindština (Devanagari)
Bho
Bikol
Bik
Bini
bin
Bislama
Bi
Bodo (Devanagari)
brx
Bosenština (latinka)
Bs
Brajbha
Podprsenka
Breton
Br
Bulharština
bg
Bundeli
Bns
Buryat (cyrilice)
Bua
Katalánština
ca
Cebuano
ceb
Zkosení
Rab
Chamorro
Ch
Čečenské
ce
Chhattisgarhi (Devanagari)
Hne
Chiga
cgg
Čínština (zjednodušená)
zh-Hans
Čínština (tradiční)
zh-Hant
Choctaw
Cho
Chukot
ckt
Chuvash
Cv
Cornish
Kw
Korsické
co
Krí
Čr
Creek
mus
Krymský Tatar (latinka)
crh
Chorvatština
hod.
Vrána
Cro
Čeština
cs
Dánština
da
Dargwa
dar
Dari
prs
Dhimal (Devanagari)
dhi
Dogri (Devanagari)
Doi
Duala
Dua
Dungan
Dng
Nizozemština
nl
Efik
Efi
Angličtina
en
Erzya (cyrilice)
myv
Estonština
et
Faerština
fo
Fidžijština
Fj
Filipino
Fil
Finština
fi
Jazyk
Kód (volitelné)
Fon
Fon
Francouzština
fr
Friulian
Kožešiny
Ga
Gaa
Gagauz (latinka)
Gag
Galicijština
gl
Ganda
Lg
Gayo
gay
Němčina
de
Gilbertese
Gil
Gondi (Devanagari)
Gon
Řečtina
el
Grónština
Kl
Guaranština
Gn
Gurung (Devanagari)
Gvr
Gusii
guz
Haitská kreolština
Ht
Halbi (Devanagari)
Hlb
Hani
hni
Haryanvi
bgc
Havajské
Haw
Hebrejština
he
Herero
Hz
Hiligaynon
Hil
Hindština
hi
Hmong Daw (latinka)
mww
Ho(Devanagiri)
Hoc
Maďarština
hu
Iban
Iba
Islandština
is
Igbo
Ig
Iloko
Mop
Inari Sami
Smn
Indonéština
ID
Ingush
Inh
Interlingua
Ia
Inuktitut (latinka)
Iu
Irština
Ga
Italština
to
japonština
ja
Jaunsari (Devanagari)
Jns
Javánština
Jv
Jola-Fonyi
Dyo
Kabardian
kbd
Kabuverdianu
Kea
Kachin (latinka)
Kac
Kalenjin
Kln
Kalmyk
Xal
Kangri (Devanagari)
xnr
Kanuri
Kr
Karachay-Balkar
krc
Kara-Kalpak (cyrilice)
kaa-cyrl
Kara-Kalpak (latinka)
Kaa
Kashubian
Csb
Kazaština (cyrilice)
kk-cyrl
Kazaština (latinka)
kk-latn
Khakas
kjh
Khaling
Klr
Khasi
Kha
K'iche'
quc
Kikuyu
Ki
Kildin Sami
Sjd
Kinyarwanda
Rw
Komi
Kv
Kongo
Kg
Korejština
ko
Korku
kfq
Koryak
kpy
Kosraean
Kos
Kpelle
kpe
Kuanyama
Kj
Kumyk (cyrilice)
Kum
Arabština (arabština)
ku-arab
Amerika (latinka)
ku-latn
Kurukh (Devanagari)
kru
Kyrgyz (cyrilice)
Ky
Lak
Lbe
Lakota
lkt
Jazyk
Kód (volitelné)
Latinské
la
Lotyština
lv
Lezghian
lex
Lingala
ln
Litevština
lt
Dolní Sorbian
Dsb
Lozi
Loz
Lule Sami
smj
Luo (Keňa a Tanzanie)
Luo
Lucemburština
Liber
Luyia
Luy
Makedonština
mk
Machame
jmc
Madurese
Šílený
Mahasu Pahari (Devanagari)
bfz
Makhuwa-Meetto
Mgh
Makonde
kde
Malgaština
Mg
Malajá (latinka)
sl.
Maltština
mt
Malto (Devanagari)
kmj
Mandinka
Mnk
Manská
Gv
Maorština
mi
Mapudungun
Arn
Maráthština
Pan
Mari (Rusko)
Chm
Masai
Mas
Mende (Sierra Leone)
Muži
Meru
Mer
Meta'
Mgo
Minangkabau
min
Mohawk
Moh
Mongolština (cyrilice)
Mn
Mongondow
Mog
Montenegrin (cyrilice)
cnr-cyrl
Montenegrin (latinka)
cnr-latn
Morisyen
Mfe
Mundang
Mua
Nahuatl
Ne
Navajo
nv
Ndonga
Ng
Neapolské
Nap
Nepálština
ne
Ngomba
jgo
Niuean
Niu
Nogay
Nog
North Ndebele
nd
Severní Sami (latinka)
Msp
Norština
ne
Nyanja
Ny
Nyankole
nyn
Nzima
nzi
Occitan
Oc
Ojibwa
Úř
Oromo
Ze
Ossetic
Os
Pampanga
Pam
Pangasinan
Pag
Papiamento
Pap
Pashto
Ps
Pedi
Nso
Perština
fa
Polština
pl
Portugalština
pt
Pašábština (arabština)
Pa
Quechua
Qu
Ripuarian
ksh
Rumunština
ro
Románština
Rm
Rundi
Rn
Ruština
ru
Rwa
rwk
Sadri (Devanagari)
Sck
Sakha
Sah
Samburu
saq
Samoan (latinka)
sm
Sango
Sg
Jazyk
Kód (volitelné)
Sangu (Gabon)
snq
Sanskrit (Devanagari)
Sa
Santali(Devanagiri)
Seděl
Skotského
sco
Skotská Gaelika
Gd
Sena
Ona
Srbština (cyrilice)
sr-cyrl
Srbština (latinka)
sr, sr-latn
Shambala
Ksb
Shona
sn
Siksika
Bla
Sirmauri (Devanagari)
srx
Skolt Sami
sms
Slovenština
sk
Slovinština
sl
Soga
Xog
Somali (arabština)
so
Somali (latinka)
so-latn
Songhai
son (syn)
South Ndebele
Nr
Jižní Altai
Alt
Jižní Sami
Sma
Jižní Sotho
St
Španělština
es
Sundánština
Su
Swahili (latinka)
sw
Swati
ss
Švédština
sv
Tabassaran
Kartě
Tachelhit
Shi
Tahitština
ty
Taita
Dav
Tádžik (cyrilice)
Tg
Tamilština
ta
Tatar (cyrilice)
tt-cyrl
Tatar (latinka)
TT
Teso
Teo
Tetum
Tet
Thajština
th
Thangmi
Thf
Tok Pisin
Tpi
Tongánština
na
Tsonga
Ts
Čwanština
tn
Turečtina
tr
Turkmen (latinka)
Tk
Tuvan
tyv
Udmurt
udm
Uighur (cyrilice)
ug-cyrl
Ukrajinština
uk
Hornolužická srbština
Hsb
Urdština
ur
Yghur (arabština)
Ug
Uzbečtina (arabština)
uz-arab
Uzbečtina (cyrilice)
uz-cyrl
Uzbečtina (latinka)
Uz
Vietnamština
vi
Volapük
Vo
Vunjo
Vun
Walser
Wae
Velština
Cy
Západní Frisian
Fy
Wolof
Wo
Xhoština
xh
Yucatécká mayština
Yua
Zapotec
zap
Zarma
Dje
Zhuang
za
Zulština
zu
Následující tabulka uvádí podporované jazyky pro extrakci rukou psaných textů.
Jazyk
Kód jazyka (volitelné)
Jazyk
Kód jazyka (volitelné)
Angličtina
en
Japonština
ja
Čínština (zjednodušená)
zh-Hans
Korejština
ko
Francouzština
fr
Portugalština
pt
Němčina
de
Španělština
es
Italština
it