Sdílet prostřednictvím


Podpora jazyků: vlastní modely

Tento obsah se vztahuje na: Zaškrtnutí v4.0 (Preview) | Předchozí verze: modrá značka zaškrtnutí v3.1 (GA) v3.0 (GA) modrá značka zaškrtnutí modrá značka zaškrtnutí v2.1 (GA)

Tento obsah se vztahuje na: Zaškrtnutí v3.1 (GA) | Nejnovější verze: nachová značka zaškrtnutí v4.0 (Preview) | Předchozí verze: modrá značka zaškrtnutí v3.0modrá značka zaškrtnutí v2.1

Tento obsah se vztahuje na:Zaškrtnutí v3.0 (GA) | Nejnovější verze: nachová značka zaškrtnutí v4.0 (Preview) nachová značka zaškrtnutív3.1 | Předchozí verze: modrá značka zaškrtnutí v2.1

Tento obsah se vztahuje na: Zaškrtnutí v2.1 | Nejnovější verze: modrá značka zaškrtnutí v4.0 (Preview)

Modely Azure AI Document Intelligence poskytují podporu vícejazyčného zpracování dokumentů. Naše možnosti podpory jazyka umožňují uživatelům komunikovat s vašimi aplikacemi přirozenými způsoby a umožnit globální outreach. Vlastní modely se trénují pomocí označených datových sad k extrakci odlišných dat ze strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů specifických pro vaše případy použití. Samostatné vlastní modely je možné kombinovat a vytvářet složené modely. Následující tabulky uvádějí dostupnou podporu jazyka a národního prostředí podle modelu a funkce:

Vlastní klasifikátor

Jazyk – kód národního prostředí Výchozí
Angličtina (USA) – cs-CZ Angličtina (USA) – cs-CZ
Jazyk Kód (volitelné)
Afrikánština af
Albánština sq
Arabština ar
Bulharština bg
Čínština (Han (zjednodušená varianta)) zh-Hans
Čínština (Han (tradiční varianta)) zh-Hant
Chorvatština hr
Čeština cs
Dánština da
Nizozemština nl
Estonština et
Finština fi
Francouzština fr
Němčina de
Hebrejština he
Hindština hi
Maďarština hu
Indonéština id
Italština it
japonština ja
Korejština ko
Lotyština lv
Litevština lt
Makedonština mk
Maráthština mr
Moderní řečtina (1453-) el
Nepálština (makrolanguage) ne
Norština no
Paňdžábština pa
Perština fa
Polština pl
Portugalština (Brazílie) pt
Rumunština rm
Ruština ru
Slovenština sk
Slovinština sl
Somali (arabština) so
Somali (latinka) so-latn
Španělština es
Swahili (makrolanguage) sw
Švédština sv
Tamilština ta
Thajština th
Turečtina tr
Ukrajinština uk
Urdština ur
Vietnamština vi

Vlastní neurální

Následující tabulka uvádí podporované jazyky pro tištěný text.

Jazyk Kód (volitelné)
Afrikánština af
Albánština sq
Arabština ar
Bulharština bg
Čínština (zjednodušená) zh-Hans
Čínština (tradiční) zh-Hant
Chorvatština hr
Čeština cs
Dánština da
Nizozemština nl
Estonština et
Finština fi
Francouzština fr
Němčina de
Hebrejština he
Hindština hi
Maďarština hu
Indonéština id
Italština it
japonština ja
Korejština ko
Lotyština lv
Litevština lt
Makedonština mk
Maráthština mr
Moderní řečtina (1453-) el
Nepálština (makrolanguage) ne
Norština no
Paňdžábština pa
Perština fa
Polština pl
Portugalština (Brazílie) pt
Rumunština rm
Ruština ru
Slovenština sk
Slovinština sl
Somali (arabština) so
Somali (latinka) so-latn
Španělština es
Swahili (makrolanguage) sw
Švédština sv
Tamilština ta
Thajština th
Turečtina tr
Ukrajinština uk
Urdština ur
Vietnamština vi

Neurální modely podporují přidané jazyky pro v3.1 rozhraní API a novější.

Jazyky Verze rozhraní API
Angličtina v4.0:2024-02-29-preview, 2023-10-31-preview, , v3.1:2023-07-31 (GA)v3.0:2022-08-31 (GA)
Němčina v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Italština v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Francouzština v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Španělština v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Nizozemština v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)

Vlastní šablona

Následující tabulka uvádí podporované jazyky pro tištěný text.

Jazyk Kód (volitelné)
Abaza abq
Abcházský ab
Achinese eso
Acoli ach
Adangme Ada
Adyghe Ady
V dálce aa
Afrikánština af
Akan Ak
Albánština sq
Algonquin alq
Angika (Devanagari) anp
Arabština ar
Asturština Ast
Asu (Tanzanie) Asa
Avaric Av
Awadhi-Hindština (Devanagari) Awa
Aymara ano
Ázerbájdžánština (latinka) Az
Bafia ksf
Bagheli bfy
Bambara Bm
Baškirština ba
Baskičtina eu
Běloruský (cyrilice) be, be-cyrl
Běloruský (latinka) be, be-latn
Bemba (Zambia) Bem
Bena (Tanzanie) bez
Bhojpurština-Hindština (Devanagari) bho
Bikol Bik
Bini bin
Bislama bisexuální
Bodo (Devanagari) brx
Bosenština (latinka) Bs
Brajbha podprsenka
Bretonština Br
Bulharština bg
Bundeli Bns
Buryat (cyrilice) bua
Katalánština ca
Cebuano ceb
Zkosení Rab
Chamorro ch
Čečenský ce
Chhattisgarhi (Devanagari) hne
Chiga cgg
Čínština (zjednodušená) zh-Hans
Čínština (tradiční) zh-Hant
Choctaw Cho
Chukot ckt
Chuvash CV
Cornwallština kW
Korsičtina co
Krí Čr
Potok mus
Krymský Tatar (latinka) crh
Chorvatština hod.
Vrána Cro
Čeština cs
Dánština da
Dargwa dar
Dari prs
Dhimal (Devanagari) dhi
Dogri (Devanagari) Doi
Duala Dua
Dungan dng
Nizozemština nl
Efik Efi
Angličtina en
Erzya (cyrilice) myv
Estonština et
Faerština fo
Fidžijština fj
Filipino Fil
Finština fi
Jazyk Kód (volitelné)
Fon Fon
Francouzština fr
Friulian kožešina
Ga Gaa
Gagauz (latinka) roubík
Galicijština gl
Ganda Lg
Gayo gay
Němčina de
Gilbertese Gil
Gondi (Devanagari) Gon
Řečtina el
Grónština Kl
Guaranština Gn
Gurung (Devanagari) gvr
Gusii guz
Haitská kreolština Ht
Halbi (Devanagari) hlb
Hani hni
Haryanvi bgc
Havajský plod hlohu
Hebrejština he
Herero Hz
Hiligaynon hil
Hindština hi
Hmong Daw (latinka) mww
Ho(Devanagiri) Hoc
Maďarština hu
Iban Iba
Islandština is
Igbo Ig
Iloko Mezinárodní organizace práce
Inari Sami smn
Indonéština ID
Ingush Inh
Interlingua Ia
Inuktitut (latinka) Iu
Irština Ghanština
Italština to
japonština ja
Jaunsari (Devanagari) Jns
Jávský joint venture
Jola-Fonyi dyo
Kabardian kbd
Kabuverdianu Kea
Kachin (latinka) Kac
Kalenjin Kln
Kalmyk xal
Kangri (Devanagari) xnr
Kanuri Kr
Karachay-Balkar krc
Kara-Kalpak (cyrilice) kaa-cyrl
Kara-Kalpak (latinka) Kaa
Kašubština Csb
Kazaština (cyrilice) kk-cyrl
Kazaština (latinka) kk-latn
Khakas kjh
Khaling klr
Khasi Kha
K'iche' quc
Kikuyu Ki
Kildin Sami Sjd
Kinyarwanda Rw
Komi kv
Kongo Kg
Korejština ko
Korku kfq
Koryak kpy
Kosraean Kos
Kpelle kpe
Kuanyama Kj
Kumyk (cyrilice) Kum
Arabština (arabština) ku-arab
Amerika (latinka) ku-latn
Kurukh (Devanagari) kru
Kyrgyz (cyrilice) Ky
Lak Lbe
Lakota lkt
Jazyk Kód (volitelné)
Latina la
Lotyština lv
Lezghian zákon
Lingala ln
Litevština lt
Dolnolužičtina dsb
Lozi Loz
Lule Sami smj
Luo (Keňa a Tanzanie) Luo
Lucemburština Lb
Luyia Luy
Makedonština mk
Machame jmc
Madurese šílený
Mahasu Pahari (Devanagari) bfz
Makhuwa-Meetto Mgh
Makonde kde
Malgaština Mg
Malajá (latinka) sl.
Maltština mt
Malto (Devanagari) kmj
Mandinka mnk
Manština Gv
Maorština míle
Mapudungun Arn
Maráthština pan
Mari (Rusko) Chm
Masai Mas
Mende (Sierra Leone) muži
Meru Mer
Meta' mgo
Minangkabau min
Číro Moh
Mongolština (cyrilice) Mn
Mongondow Mog
Montenegrin (cyrilice) cnr-cyrl
Montenegrin (latinka) cnr-latn
Morisyen mfe
Mundang Mua
Nahuatl Ne
Navajo nv
Ndonga Ng
Neapolské zdřímnutí
Nepálština ne
Ngomba jgo
Niuean Niu
Nogay dřevěný kolík
North Ndebele nd
Severní Sami (latinka) Msp
Norština ne
Nyanja Ny
Nyankole nyn
Nzima nzi
Okcitánština Oc
Ojibwa oj
Oromo Ze
Ossetic operační systém
Pampanga Pam
Pangasinan Pag
Papiamento kaše
Pashto PS
Pedi Nso
Perština fa
Polština pl
Portugalština pt
Pašábština (arabština) taťka
Quechua Qu
Ripuarian ksh
Rumunština ro
Románština mikrometr
Rundi Rn
Ruština ru
Rwa rwk
Sadri (Devanagari) sck
Sakha Sah
Samburu saq
Samoan (latinka) sm
Sango Sg
Jazyk Kód (volitelné)
Sangu (Gabon) snq
Sanskrit (Devanagari) přidružení zabezpečení
Santali(Devanagiri) seděl
Skotové sco
Skotská gaelština Gd
Sena ona
Srbština (cyrilice) sr-cyrl
Srbština (latinka) sr, sr-latn
Shambala ksb
Shona sn
Siksika Bla
Sirmauri (Devanagari) srx
Skolt Sami sms
Slovenština sk
Slovinština sl
Soga xog
Somali (arabština) so
Somali (latinka) so-latn
Songhai son (syn)
South Ndebele Nr
Jižní Altai Alt
Jižní Sami Sma
Jižní Sotho sv
Španělština es
Sundánština Su
Swahili (latinka) sw
Swati ss
Švédština sv
Tabassaran tabulátor
Tachelhit Shi
Tahitština ty
Taita Dav
Tádžik (cyrilice) Tg
Tamilština ta
Tatar (cyrilice) tt-cyrl
Tatar (latinka) TT
Teso teo
Tetum Tet
Thajština th
Thangmi thf
Tok Pisin Tpi
Tongánština na
Tsonga Ts
Čwanština tn
Turečtina tr
Turkmen (latinka) Tk
Tuvan tyv
Udmurt udm
Uighur (cyrilice) ug-cyrl
Ukrajinština uk
Hornolužická srbština Hsb
Urdština ur
Yghur (arabština) Ug
Uzbečtina (arabština) uz-arab
Uzbečtina (cyrilice) uz-cyrl
Uzbečtina (latinka) uz
Vietnamština vi
Volapük Vo
Vunjo vun
Walser Wae
Velština Cy
Západní Frisian Fy
Wolof pr
Xhoština xh
Yucatécká mayština Yua
Zapotec odprásknout
Zarma dje
Zhuang za
Zulština zu