Podpora jazyků: vlastní modely
Tento obsah se vztahuje na: v4.0 (Preview) | Předchozí verze: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Tento obsah se vztahuje na: v3.1 (GA) | Nejnovější verze: v4.0 (Preview) | Předchozí verze: v3.0 v2.1
Tento obsah se vztahuje na: v3.0 (GA) | Nejnovější verze: v4.0 (Preview) v3.1 | Předchozí verze: v2.1
Tento obsah se vztahuje na: v2.1 | Nejnovější verze: v4.0 (Preview)
Modely Azure AI Document Intelligence poskytují podporu vícejazyčného zpracování dokumentů. Naše možnosti podpory jazyka umožňují uživatelům komunikovat s vašimi aplikacemi přirozenými způsoby a umožnit globální outreach. Vlastní modely se trénují pomocí označených datových sad k extrakci odlišných dat ze strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů specifických pro vaše případy použití. Samostatné vlastní modely je možné kombinovat a vytvářet složené modely. Následující tabulky uvádějí dostupnou podporu jazyka a národního prostředí podle modelu a funkce:
Vlastní klasifikátor
Jazyk – kód národního prostředí | Výchozí |
---|---|
Angličtina (USA) – cs-CZ | Angličtina (USA) – cs-CZ |
Jazyk | Kód (volitelné) |
---|---|
Afrikánština | af |
Albánština | sq |
Arabština | ar |
Bulharština | bg |
Čínština (Han (zjednodušená varianta)) | zh-Hans |
Čínština (Han (tradiční varianta)) | zh-Hant |
Chorvatština | hr |
Čeština | cs |
Dánština | da |
Nizozemština | nl |
Estonština | et |
Finština | fi |
Francouzština | fr |
Němčina | de |
Hebrejština | he |
Hindština | hi |
Maďarština | hu |
Indonéština | id |
Italština | it |
japonština | ja |
Korejština | ko |
Lotyština | lv |
Litevština | lt |
Makedonština | mk |
Maráthština | mr |
Moderní řečtina (1453-) | el |
Nepálština (makrolanguage) | ne |
Norština | no |
Paňdžábština | pa |
Perština | fa |
Polština | pl |
Portugalština (Brazílie) | pt |
Rumunština | rm |
Ruština | ru |
Slovenština | sk |
Slovinština | sl |
Somali (arabština) | so |
Somali (latinka) | so-latn |
Španělština | es |
Swahili (makrolanguage) | sw |
Švédština | sv |
Tamilština | ta |
Thajština | th |
Turečtina | tr |
Ukrajinština | uk |
Urdština | ur |
Vietnamština | vi |
Vlastní generování
Vlastní generování podporuje pouze angličtinu. en
Vlastní neurální
Následující tabulka uvádí podporované jazyky pro tištěný text.
Jazyk | Kód (volitelné) |
---|---|
Afrikánština | af |
Albánština | sq |
Arabština | ar |
Bulharština | bg |
Čínština (zjednodušená) | zh-Hans |
Čínština (tradiční) | zh-Hant |
Chorvatština | hr |
Čeština | cs |
Dánština | da |
Nizozemština | nl |
Angličtina | en |
Estonština | et |
Finština | fi |
Francouzština | fr |
Němčina | de |
Hebrejština | he |
Hindština | hi |
Maďarština | hu |
Indonéština | id |
Italština | it |
japonština | ja |
Korejština | ko |
Lotyština | lv |
Litevština | lt |
Makedonština | mk |
Maráthština | mr |
Moderní řečtina (1453-) | el |
Nepálština (makrolanguage) | ne |
Norština | no |
Paňdžábština | pa |
Perština | fa |
Polština | pl |
Portugalština (Brazílie) | pt |
Rumunština | rm |
Ruština | ru |
Slovenština | sk |
Slovinština | sl |
Somali (arabština) | so |
Somali (latinka) | so-latn |
Španělština | es |
Swahili (makrolanguage) | sw |
Švédština | sv |
Tamilština | ta |
Thajština | th |
Turečtina | tr |
Ukrajinština | uk |
Urdština | ur |
Vietnamština | vi |
Vlastní šablona
Následující tabulka uvádí podporované jazyky pro tištěný text.
Jazyk | Kód (volitelné) |
---|---|
Abaza | abq |
Abcházský | ab |
Achinese | eso |
Acoli | ach |
Adangme | Ada |
Adyghe | Ady |
Afarsko | aa |
Afrikánština | af |
Akan | Ak |
Albánština | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Arabština | ar |
Asturština | Ast |
Asu (Tanzanie) | Asa |
Avaric | Av |
Awadhi-Hindština (Devanagari) | Awa |
Aymara | ano |
Ázerbájdžánština (latinka) | Az |
Bafia | ksf |
Bagheli | bfy |
Bambara | Bm |
Baškirština | ba |
Baskičtina | eu |
Běloruský (cyrilice) | be, be-cyrl |
Běloruský (latinka) | be, be-latn |
Bemba (Zambia) | Bem |
Bena (Tanzanie) | bez |
Bhojpurština-Hindština (Devanagari) | bho |
Bikol | Bik |
Bini | bin |
Bislama | bisexuální |
Bodo (Devanagari) | brx |
Bosenština (latinka) | Bs |
Brajbha | podprsenka |
Bretonština | Br |
Bulharština | bg |
Bundeli | Bns |
Buryat (cyrilice) | bua |
Katalánština | ca |
Cebuano | ceb |
Zkosení | Rab |
Chamorro | ch |
Čečenský | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
Čínština (zjednodušená) | zh-Hans |
Čínština (tradiční) | zh-Hant |
Choctaw | Cho |
Čukotský autonomní okruh | ckt |
Chuvash | CV |
Cornwallština | kW |
Korsičtina | co |
Krí | Čr |
Potok | mus |
Krymský Tatar (latinka) | crh |
Chorvatština | hod. |
Vrána | Cro |
Čeština | cs |
Dánština | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | Doi |
Duala | Dua |
Dungan | dng |
Nizozemština | nl |
Efik | Efi |
Angličtina | en |
Erzya (cyrilice) | myv |
Estonština | et |
Faerština | fo |
Fidžijština | fj |
Filipino | Fil |
Finština | fi |
Jazyk | Kód (volitelné) |
---|---|
Fon | Fon |
Francouzština | fr |
Friulian | kožešina |
Ga | Gaa |
Gagauz (latinka) | roubík |
Galicijština | gl |
Ganda | Lg |
Gayo | gay |
Němčina | de |
Gilbertese | Gil |
Gondi (Devanagari) | Gon |
Řečtina | el |
Grónština | Kl |
Guaranština | Gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Haitská kreolština | Ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Havajský | plod hlohu |
Hebrejština | he |
Herero | Hz |
Hiligaynon | hil |
Hindština | hi |
Hmong Daw (latinka) | mww |
Ho(Devanagiri) | Hoc |
Maďarština | hu |
Iban | Iba |
Islandština | is |
Igbo | Ig |
Iloko | Mezinárodní organizace práce |
Inari Sami | smn |
Indonéština | ID |
Ingush | Inh |
Interlingua | Ia |
Inuktitut (latinka) | Iu |
Irština | Ghanština |
Italština | to |
japonština | ja |
Jaunsari (Devanagari) | Jns |
Jávský | joint venture |
Jola-Fonyi | dyo |
Kabardian | kbd |
Kabuverdianu | Kea |
Kachin (latinka) | Kac |
Kalenjin | Kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | Kr |
Karachay-Balkar | krc |
Kara-Kalpak (cyrilice) | kaa-cyrl |
Kara-Kalpak (latinka) | Kaa |
Kašubština | Csb |
Kazaština (cyrilice) | kk-cyrl |
Kazaština (latinka) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | Kha |
K'iche' | quc |
Kikuyu | Ki |
Kildin Sami | Sjd |
Kinyarwanda | Rw |
Komi | kv |
Kongo | Kg |
Korejština | ko |
Korku | kfq |
Koryak | kpy |
Kosraean | Kos |
Kpelle | kpe |
Kuanyama | Kj |
Kumyk (cyrilice) | Kum |
Arabština (arabština) | ku-arab |
Amerika (latinka) | ku-latn |
Kurukh (Devanagari) | kru |
Kyrgyz (cyrilice) | Ky |
Lak | Lbe |
Lakota | lkt |
Jazyk | Kód (volitelné) |
---|---|
Latina | la |
Lotyština | lv |
Lezghian | zákon |
Lingala | ln |
Litevština | lt |
Dolnolužičtina | dsb |
Lozi | Loz |
Lule Sami | smj |
Luo (Keňa a Tanzanie) | Luo |
Lucemburština | Lb |
Luyia | Luy |
Makedonština | mk |
Machame | jmc |
Madurese | šílený |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | Mgh |
Makonde | kde |
Malgaština | Mg |
Malajá (latinka) | sl. |
Maltština | mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Manština | Gv |
Maorština | míle |
Mapudungun | Arn |
Maráthština | pan |
Mari (Rusko) | Chm |
Masai | Mas |
Mende (Sierra Leone) | muži |
Meru | Mer |
Meta' | mgo |
Minangkabau | min |
Číro | Moh |
Mongolština (cyrilice) | Mn |
Mongondow | Mog |
Montenegrin (cyrilice) | cnr-cyrl |
Montenegrin (latinka) | cnr-latn |
Morisyen | mfe |
Mundang | Mua |
Nahuatl | Ne |
Navajo | nv |
Ndonga | Ng |
Neapolské | zdřímnutí |
Nepálština | ne |
Ngomba | jgo |
Niuean | Niu |
Nogay | dřevěný kolík |
North Ndebele | nd |
Severní Sami (latinka) | Msp |
Norština | ne |
Nyanja | Ny |
Nyankole | nyn |
Nzima | nzi |
Okcitánština | Oc |
Ojibwa | oj |
Oromo | Ze |
Ossetic | operační systém |
Pampanga | Pam |
Pangasinan | Pag |
Papiamento | kaše |
Pashto | PS |
Pedi | Nso |
Perština | fa |
Polština | pl |
Portugalština | pt |
Pašábština (arabština) | taťka |
Quechua | Qu |
Ripuarian | ksh |
Rumunština | ro |
Románština | mikrometr |
Rundi | Rn |
Ruština | ru |
Rwa | rwk |
Sadri (Devanagari) | sck |
Sacha (Jakutsko) | Sah |
Samburu | saq |
Samoan (latinka) | sm |
Sango | Sg |
Jazyk | Kód (volitelné) |
---|---|
Sangu (Gabon) | snq |
Sanskrit (Devanagari) | přidružení zabezpečení |
Santali(Devanagiri) | seděl |
Skotové | sco |
Skotská gaelština | Gd |
Sena | ona |
Srbština (cyrilice) | sr-cyrl |
Srbština (latinka) | sr, sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | Bla |
Sirmauri (Devanagari) | srx |
Skolt Sami | sms |
Slovenština | sk |
Slovinština | sl |
Soga | xog |
Somali (arabština) | so |
Somali (latinka) | so-latn |
Songhai | son (syn) |
South Ndebele | Nr |
Jižní Altai | Alt |
Jižní Sami | Sma |
Jižní Sotho | sv |
Španělština | es |
Sundánština | Su |
Swahili (latinka) | sw |
Swati | ss |
Švédština | sv |
Tabassaran | tabulátor |
Tachelhit | Shi |
Tahitština | ty |
Taita | Dav |
Tádžik (cyrilice) | Tg |
Tamilština | ta |
Tatar (cyrilice) | tt-cyrl |
Tatar (latinka) | TT |
Teso | teo |
Tetum | Tet |
Thajština | th |
Thangmi | thf |
Tok Pisin | Tpi |
Tongánština | na |
Tsonga | Ts |
Čwanština | tn |
Turečtina | tr |
Turkmen (latinka) | Tk |
Tuvan | tyv |
Udmurt | udm |
Uighur (cyrilice) | ug-cyrl |
Ukrajinština | uk |
Hornolužická srbština | Hsb |
Urdština | ur |
Yghur (arabština) | Ug |
Uzbečtina (arabština) | uz-arab |
Uzbečtina (cyrilice) | uz-cyrl |
Uzbečtina (latinka) | uz |
Vietnamština | vi |
Volapük | Vo |
Vunjo | vun |
Walser | Wae |
Velština | Cy |
Západní Frisian | Fy |
Wolof | pr |
Xhoština | xh |
Yucatécká mayština | Yua |
Zapotec | odprásknout |
Zarma | dje |
Zhuang | za |
Zulština | zu |