Podpora jazyků: analýza dokumentů
Tento obsah se vztahuje na: v4.0 (Preview) | Předchozí verze: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Tento obsah se vztahuje na: v3.1 (GA) | Nejnovější verze: v4.0 (Preview) | Předchozí verze: v3.0 v2.1
Tento obsah se vztahuje na: v3.0 (GA) | Nejnovější verze: v4.0 (Preview) v3.1 | Předchozí verze: v2.1
Tento obsah se vztahuje na: v2.1 | Nejnovější verze: v4.0 (Preview)
Modely Azure AI Document Intelligence poskytují podporu vícejazyčného zpracování dokumentů. Naše možnosti podpory jazyka umožňují uživatelům komunikovat s vašimi aplikacemi přirozenými způsoby a umožnit globální outreach. Modely analýzy dokumentů umožňují extrakci textu z formulářů a dokumentů a vrací strukturovaný obsah připravený pro podnikovou činnost, použití nebo průběh vaší organizace. Následující tabulky uvádějí dostupnou podporu jazyka a národního prostředí podle modelu a funkce:
- Čtení: Model pro čtení umožňuje extrakci a analýzu tištěného a rukou psaného textu. Tento model je základním modulem OCR pro jiné předem vytvořené modely document intelligence, jako je rozložení, obecný dokument, faktura, účtenka, dokument identity (ID), karta zdravotního pojištění, daňové doklady a vlastní modely. Další informace najdete v tématu Přehled modelu pro čtení
- Rozložení: Model rozložení umožňuje extrakci a analýzu textu, tabulek, struktury dokumentu a značek výběru (například přepínačů a zaškrtávacích políček) z formulářů a dokumentů.
- Obecný dokument: Obecný model dokumentu umožňuje extrakci a analýzu textu, struktury dokumentu a párů klíč-hodnota. Další informace najdete v tématu Obecný přehled modelu dokumentů.
Poznámka:
Volitelný kód jazyka
Univerzální modely založené na hlubokém učení Document Intelligence extrahují veškerý vícejazyčný text v dokumentech, včetně textových čar se smíšenými jazyky, a nevyžadují zadání kódu jazyka.
Nezadávejte kód jazyka jako parametr, pokud si nejste jisti jazykem a nechcete, aby služba použila pouze příslušný model. V opačném případě může služba vrátit neúplný a nesprávný text.
Není také nutné zadat národní prostředí. Jedná se o volitelný parametr. Technologie hloubkového učení Document Intelligence automaticky rozpozná textový jazyk na vašem obrázku.
Čtení modelu
ID modelu: předem připravená čtení
Následující tabulka uvádí podporu jazyka čtení modelu pro extrakci a analýzu tištěného textu.
Jazyk | Kód (volitelné) |
---|---|
Abaza | abq |
Abcházský | ab |
Achinese | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
V dálce | aa |
Afrikánština | af |
Akan | ak |
Albánština | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Arabština | ar |
Asturština | ast |
Asu (Tanzanie) | asa |
Avaric | av |
Awadhi-Hindština (Devanagari) | awa |
Aymara | ay |
Ázerbájdžánština (latinka) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Baškirština | ba |
Baskičtina | eu |
Běloruský (cyrilice) | be , be-cyrl |
Běloruský (latinka) | be , be-latn |
Bemba (Zambia) | bem |
Bena (Tanzanie) | bez |
Bhojpurština-Hindština (Devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Devanagari) | brx |
Bosenština (latinka) | bs |
Brajbha | bra |
Bretonština | br |
Bulharština | bg |
Bundeli | bns |
Buryat (cyrilice) | bua |
Katalánština | ca |
Cebuano | ceb |
Zkosení | rab |
Chamorro | ch |
Čečenský | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
Čínština (zjednodušená) | zh-Hans |
Čínština (tradiční) | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Chuvash | cv |
Cornwallština | kw |
Korsičtina | co |
Krí | cr |
Potok | mus |
Krymský Tatar (latinka) | crh |
Chorvatština | hr |
Vrána | cro |
Čeština | cs |
Dánština | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | doi |
Duala | dua |
Dungan | dng |
Nizozemština | nl |
Efik | efi |
Angličtina | en |
Erzya (cyrilice) | myv |
Estonština | et |
Faerština | fo |
Fidžijština | fj |
Filipino | fil |
Finština | fi |
Jazyk | Kód (volitelné) |
---|---|
Fon |
fon |
Francouzština | fr |
Friulian | fur |
Ga |
gaa |
Gagauz (latinka) | gag |
Galicijština | gl |
Ganda | lg |
Gayo | gay |
Němčina | de |
Gilbertese | gil |
Gondi (Devanagari) | gon |
Řečtina | el |
Grónština | kl |
Guaranština | gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Haitská kreolština | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Havajský | haw |
Hebrejština | he |
Herero | hz |
Hiligaynon | hil |
Hindština | hi |
Hmong Daw (latinka) | mww |
Ho(Devanagiri) | hoc |
Maďarština | hu |
Iban | iba |
Islandština | is |
Igbo | ig |
Iloko | ilo |
Inari Sami | smn |
Indonéština | id |
Ingush | inh |
Interlingua | ia |
Inuktitut (latinka) | iu |
Irština | ga |
Italština | it |
japonština | ja |
Jaunsari (Devanagari) | Jns |
Jávský | jv |
Jola-Fonyi | dyo |
Kabardian | kbd |
Kabuverdianu | kea |
Kachin (latinka) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karachay-Balkar | krc |
Kara-Kalpak (cyrilice) | kaa-cyrl |
Kara-Kalpak (latinka) | kaa |
Kašubština | csb |
Kazaština (cyrilice) | kk-cyrl |
Kazaština (latinka) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
K'iche' | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Kinyarwanda | rw |
Komi | kv |
Kongo | kg |
Korejština | ko |
Korku | kfq |
Koryak | kpy |
Kosraean | kos |
Kpelle | kpe |
Kuanyama | kj |
Kumyk (cyrilice) | kum |
Arabština (arabština) | ku-arab |
Amerika (latinka) | ku-latn |
Kurukh (Devanagari) | kru |
Kyrgyz (cyrilice) | ky |
Lak |
lbe |
Lakota | lkt |
Jazyk | Kód (volitelné) |
---|---|
Latina | la |
Lotyština | lv |
Lezghian | lex |
Lingala | ln |
Litevština | lt |
Dolnolužičtina | dsb |
Lozi | loz |
Lule Sami | smj |
Luo (Keňa a Tanzanie) | luo |
Lucemburština | lb |
Luyia | luy |
Makedonština | mk |
Machame | jmc |
Madurese | mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Malgaština | mg |
Malajá (latinka) | ms |
Maltština | mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Manština | gv |
Maorština | mi |
Mapudungun | arn |
Maráthština | mr |
Mari (Rusko) | chm |
Masai | mas |
Mende (Sierra Leone) | men |
Meru | mer |
Meta' | mgo |
Minangkabau | min |
Číro | moh |
Mongolština (cyrilice) | mn |
Mongondow | mog |
Montenegrin (cyrilice) | cnr-cyrl |
Montenegrin (latinka) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Neapolské | nap |
Nepálština | ne |
Ngomba | jgo |
Niuean | niu |
Nogay | nog |
North Ndebele | nd |
Severní Sami (latinka) | sme |
Norština | no |
Nyanja | ny |
Nyankole | nyn |
Nzima | nzi |
Okcitánština | oc |
Ojibwa | oj |
Oromo | om |
Ossetic | os |
Pampanga | pam |
Pangasinan | pag |
Papiamento | pap |
Pashto | ps |
Pedi | nso |
Perština | fa |
Polština | pl |
Portugalština | pt |
Pašábština (arabština) | pa |
Quechua | qu |
Ripuarian | ksh |
Rumunština | ro |
Románština | rm |
Rundi | rn |
Ruština | ru |
Rwa |
rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
Samoan (latinka) | sm |
Sango | sg |
Jazyk | Kód (volitelné) |
---|---|
Sangu (Gabon) | snq |
Sanskrit (Devanagari) | sa |
Santali(Devanagiri) | sat |
Skotové | sco |
Skotská gaelština | gd |
Sena | seh |
Srbština (cyrilice) | sr-cyrl |
Srbština (latinka) | sr , sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
Skolt Sami | sms |
Slovenština | sk |
Slovinština | sl |
Soga | xog |
Somali (arabština) | so |
Somali (latinka) | so-latn |
Songhai | son |
South Ndebele | nr |
Jižní Altai | alt |
Jižní Sami | sma |
Jižní Sotho | st |
Španělština | es |
Sundánština | su |
Swahili (latinka) | sw |
Swati | ss |
Švédština | sv |
Tabassaran | tab |
Tachelhit | shi |
Tahitština | ty |
Taita | dav |
Tádžik (cyrilice) | tg |
Tamilština | ta |
Tatar (cyrilice) | tt-cyrl |
Tatar (latinka) | tt |
Teso | teo |
Tetum | tet |
Thajština | th |
Thangmi | thf |
Tok Pisin | tpi |
Tongánština | to |
Tsonga | ts |
Čwanština | tn |
Turečtina | tr |
Turkmen (latinka) | tk |
Tuvan | tyv |
Udmurt | udm |
Uighur (cyrilice) | ug-cyrl |
Ukrajinština | uk |
Hornolužická srbština | hsb |
Urdština | ur |
Yghur (arabština) | ug |
Uzbečtina (arabština) | uz-arab |
Uzbečtina (cyrilice) | uz-cyrl |
Uzbečtina (latinka) | uz |
Vietnamština | vi |
Volapük | vo |
Vunjo | vun |
Walser | wae |
Velština | cy |
Západní Frisian | fy |
Wolof | wo |
Xhoština | xh |
Yucatécká mayština | yua |
Zapotec | zap |
Zarma | dje |
Zhuang | za |
Zulština | zu |
Následující tabulka uvádí podporu jazyka čtení modelu pro extrakci a analýzu tištěného textu.
Jazyk | Kód (volitelné) |
---|---|
Afrikánština | af |
Angika | anp |
Arabština | ar |
Asturština | ast |
Awadhi | awa |
Ázerbájdžánština | az |
Běloruský (cyrilice) | be , be-cyrl |
Běloruský (latinka) | be-latn |
Bagheli | bfy |
Mahasu Pahari | bfz |
Bulharština | bg |
Haryanvi | bgc |
Bhojpuri | bho |
Bislama | bi |
Bundeli | bns |
Bretonština | br |
Braj | bra |
Bodo | brx |
Bosenština | bs |
Buriat | bua |
Katalánština | ca |
Cebuano | ceb |
Chamorro | ch |
Montenegrin (latinka) | cnr , cnr-latn |
Montenegrin (cyrilice) | cnr-cyrl |
Korsičtina | co |
Krymská tatarština | crh |
Čeština | cs |
Kašubština | csb |
Velština | cy |
Dánština | da |
Němčina | de |
Dhimal | dhi |
Dogri | doi |
Dolnolužičtina | dsb |
Angličtina | en |
Španělština | es |
Estonština | et |
Baskičtina | eu |
Perština | fa |
Finština | fi |
Filipino | fil |
Jazyk | Kód (volitelné) |
---|---|
Fidžijština | fj |
Faerština | fo |
Francouzština | fr |
Friulian | fur |
Západní Frisian | fy |
Irština | ga |
Gagauz | gag |
Skotská gaelština | gd |
Gilbertese | gil |
Galicijština | gl |
Gondi | gon |
Manština | gv |
Gurung | gvr |
Havajský | haw |
Hindština | hi |
Halbi | hlb |
Chhattisgarhi | hne |
Hani | hni |
Ho |
hoc |
Chorvatština | hr |
Hornolužická srbština | hsb |
Haitský | ht |
Maďarština | hu |
Interlingua | ia |
Indonéština | id |
Islandština | is |
Italština | it |
Inuktitutština | iu |
Japonština | |
Jaunsari | jns |
Jávský | jv |
Kara-Kalpak (latinka) | kaa , kaa-latn |
Kara-Kalpak (cyrilice) | kaa-cyrl |
Kachin | kac |
Kabuverdianu | kea |
Korku | kfq |
Khasi | kha |
Kazaština (latinka) | kk , kk-latn |
Kazaština (cyrilice) | kk-cyrl |
Kalaallisut | kl |
Khaling | klr |
Malto | kmj |
Jazyk | Kód (volitelné) |
---|---|
Korejština | |
Kosraean | kos |
Koryak | kpy |
Karachay-Balkar | krc |
Kurukh | kru |
Kölsch | ksh |
Amerika (latinka) | ku , ku-latn |
Arabština (arabština) | ku-arab |
Kumyk | kum |
Cornwallština | kw |
Kirgizské | ky |
Latina | la |
Lucemburština | lb |
Lakota | lkt |
Litevština | lt |
Maorština | mi |
Mongolština | mn |
Maráthština | mr |
Malajština | ms |
Maltština | mt |
Hmong Daw |
mww |
Erzya | myv |
Neapolské | nap |
Nepálština | ne |
Niuean | niu |
Nizozemština | nl |
Norština | no |
Nogai | nog |
Okcitánština | oc |
Ossetian | os |
Paňdžábština | pa |
Polština | pl |
Dari | prs |
Nasdílení změn | ps |
Portugalština | pt |
K'iche' | quc |
Camling | rab |
Románština | rm |
Rumunština | ro |
Ruština | ru |
Sanskrt | sa |
Santali | sat |
Jazyk | Kód (volitelné) |
---|---|
Sadri | sck |
Skotové | sco |
Slovenština | sk |
Slovinština | sl |
Samojština | sm |
Jižní Sami | sma |
Severní Sami | sme |
Lule Sami | smj |
Inari Sami | smn |
Skolt Sami | sms |
Somálština | so |
Albánština | sq |
Srbština (latinka) | sr , sr-latn |
Sirmauri | srx |
Švédština | sv |
Svahilština | sw |
Tetum | tet |
Tádžičtina | tg |
Thangmi | thf |
Turkmenština | tk |
Tonga | to |
Turečtina | tr |
Tatarština | tt |
Tuvinian | tyv |
Ujgurština | ug |
Urdština | ur |
Uzbečtina (latinka) | uz , uz-latn |
Uzbečtina (cyrilice) | uz-cyrl |
Uzbečtina (arabština) | uz-arab |
Volapük | vo |
Walser | wae |
Kangri | xnr |
Yucateco | yua |
Zhuang | za |
Čínština (Han (zjednodušená varianta)) | zh , zh-hans |
Čínština (Han (tradiční varianta)) | zh-hant |
Zulština | zu |
Rozložení
ID modelu: předem připravené rozložení
Následující tabulka uvádí podporované jazyky pro tištěný text:
Jazyk | Kód (volitelné) |
---|---|
Abaza | abq |
Abcházský | ab |
Achinese | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
V dálce | aa |
Afrikánština | af |
Akan | ak |
Albánština | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Arabština | ar |
Asturština | ast |
Asu (Tanzanie) | asa |
Avaric | av |
Awadhi-Hindština (Devanagari) | awa |
Aymara | ay |
Ázerbájdžánština (latinka) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Baškirština | ba |
Baskičtina | eu |
Běloruský (cyrilice) | be , be-cyrl |
Běloruský (latinka) | be , be-latn |
Bemba (Zambia) | bem |
Bena (Tanzanie) | bez |
Bhojpurština-Hindština (Devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Devanagari) | brx |
Bosenština (latinka) | bs |
Brajbha | bra |
Bretonština | br |
Bulharština | bg |
Bundeli | bns |
Buryat (cyrilice) | bua |
Katalánština | ca |
Cebuano | ceb |
Zkosení | rab |
Chamorro | ch |
Čečenský | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
Čínština (zjednodušená) | zh-Hans |
Čínština (tradiční) | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Chuvash | cv |
Cornwallština | kw |
Korsičtina | co |
Krí | cr |
Potok | mus |
Krymský Tatar (latinka) | crh |
Chorvatština | hr |
Vrána | cro |
Čeština | cs |
Dánština | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | doi |
Duala | dua |
Dungan | dng |
Nizozemština | nl |
Efik | efi |
Angličtina | en |
Erzya (cyrilice) | myv |
Estonština | et |
Faerština | fo |
Fidžijština | fj |
Filipino | fil |
Finština | fi |
Jazyk | Kód (volitelné) |
---|---|
Fon |
fon |
Francouzština | fr |
Friulian | fur |
Ga |
gaa |
Gagauz (latinka) | gag |
Galicijština | gl |
Ganda | lg |
Gayo | gay |
Němčina | de |
Gilbertese | gil |
Gondi (Devanagari) | gon |
Řečtina | el |
Grónština | kl |
Guaranština | gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Haitská kreolština | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Havajský | haw |
Hebrejština | he |
Herero | hz |
Hiligaynon | hil |
Hindština | hi |
Hmong Daw (latinka) | mww |
Ho(Devanagiri) | hoc |
Maďarština | hu |
Iban | iba |
Islandština | is |
Igbo | ig |
Iloko | ilo |
Inari Sami | smn |
Indonéština | id |
Ingush | inh |
Interlingua | ia |
Inuktitut (latinka) | iu |
Irština | ga |
Italština | it |
japonština | ja |
Jaunsari (Devanagari) | Jns |
Jávský | jv |
Jola-Fonyi | dyo |
Kabardian | kbd |
Kabuverdianu | kea |
Kachin (latinka) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karachay-Balkar | krc |
Kara-Kalpak (cyrilice) | kaa-cyrl |
Kara-Kalpak (latinka) | kaa |
Kašubština | csb |
Kazaština (cyrilice) | kk-cyrl |
Kazaština (latinka) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
K'iche' | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Kinyarwanda | rw |
Komi | kv |
Kongo | kg |
Korejština | ko |
Korku | kfq |
Koryak | kpy |
Kosraean | kos |
Kpelle | kpe |
Kuanyama | kj |
Kumyk (cyrilice) | kum |
Arabština (arabština) | ku-arab |
Amerika (latinka) | ku-latn |
Jazyk | Kód (volitelné) |
---|---|
Kurukh (Devanagari) | kru |
Kyrgyz (cyrilice) | ky |
Lak |
lbe |
Lakota | lkt |
Latina | la |
Lotyština | lv |
Lezghian | lex |
Lingala | ln |
Litevština | lt |
Dolnolužičtina | dsb |
Lozi | loz |
Lule Sami | smj |
Luo (Keňa a Tanzanie) | luo |
Lucemburština | lb |
Luyia | luy |
Makedonština | mk |
Machame | jmc |
Madurese | mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Malgaština | mg |
Malajá (latinka) | ms |
Maltština | mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Manština | gv |
Maorština | mi |
Mapudungun | arn |
Maráthština | mr |
Mari (Rusko) | chm |
Masai | mas |
Mende (Sierra Leone) | men |
Meru | mer |
Meta' | mgo |
Minangkabau | min |
Číro | moh |
Mongolština (cyrilice) | mn |
Mongondow | mog |
Montenegrin (cyrilice) | cnr-cyrl |
Montenegrin (latinka) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Neapolské | nap |
Nepálština | ne |
Ngomba | jgo |
Niuean | niu |
Nogay | nog |
North Ndebele | nd |
Severní Sami (latinka) | sme |
Norština | no |
Nyanja | ny |
Nyankole | nyn |
Nzima | nzi |
Okcitánština | oc |
Ojibwa | oj |
Oromo | om |
Ossetic | os |
Pampanga | pam |
Pangasinan | pag |
Papiamento | pap |
Pashto | ps |
Pedi | nso |
Perština | fa |
Polština | pl |
Portugalština | pt |
Pašábština (arabština) | pa |
Quechua | qu |
Ripuarian | ksh |
Rumunština | ro |
Románština | rm |
Rundi | rn |
Ruština | ru |
Jazyk | Kód (volitelné) |
---|---|
Rwa |
rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
Samoan (latinka) | sm |
Sango | sg |
Sangu (Gabon) | snq |
Sanskrit (Devanagari) | sa |
Santali(Devanagiri) | sat |
Skotové | sco |
Skotská gaelština | gd |
Sena | seh |
Srbština (cyrilice) | sr-cyrl |
Srbština (latinka) | sr , sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
Skolt Sami | sms |
Slovenština | sk |
Slovinština | sl |
Soga | xog |
Somali (arabština) | so |
Somali (latinka) | so-latn |
Songhai | son |
South Ndebele | nr |
Jižní Altai | alt |
Jižní Sami | sma |
Jižní Sotho | st |
Španělština | es |
Sundánština | su |
Swahili (latinka) | sw |
Swati | ss |
Švédština | sv |
Tabassaran | tab |
Tachelhit | shi |
Tahitština | ty |
Taita | dav |
Tádžik (cyrilice) | tg |
Tamilština | ta |
Tatar (cyrilice) | tt-cyrl |
Tatar (latinka) | tt |
Teso | teo |
Tetum | tet |
Thajština | th |
Thangmi | thf |
Tok Pisin | tpi |
Tongánština | to |
Tsonga | ts |
Čwanština | tn |
Turečtina | tr |
Turkmen (latinka) | tk |
Tuvan | tyv |
Udmurt | udm |
Uighur (cyrilice) | ug-cyrl |
Ukrajinština | uk |
Hornolužická srbština | hsb |
Urdština | ur |
Yghur (arabština) | ug |
Uzbečtina (arabština) | uz-arab |
Uzbečtina (cyrilice) | uz-cyrl |
Uzbečtina (latinka) | uz |
Vietnamština | vi |
Volapük | vo |
Vunjo | vun |
Walser | wae |
Velština | cy |
Západní Frisian | fy |
Wolof | wo |
Xhoština | xh |
Yucatécká mayština | yua |
Zapotec | zap |
Zarma | dje |
Zhuang | za |
Zulština | zu |
Následující tabulka uvádí podporu jazyka modelu rozložení pro extrakci a analýzu tištěného textu.
Jazyk | Kód (volitelné) |
---|---|
Afrikánština | af |
Angika | anp |
Arabština | ar |
Asturština | ast |
Awadhi | awa |
Ázerbájdžánština | az |
Běloruský (cyrilice) | be , be-cyrl |
Běloruský (latinka) | be-latn |
Bagheli | bfy |
Mahasu Pahari | bfz |
Bulharština | bg |
Haryanvi | bgc |
Bhojpuri | bho |
Bislama | bi |
Bundeli | bns |
Bretonština | br |
Braj | bra |
Bodo | brx |
Bosenština | bs |
Buriat | bua |
Katalánština | ca |
Cebuano | ceb |
Chamorro | ch |
Montenegrin (latinka) | cnr , cnr-latn |
Montenegrin (cyrilice) | cnr-cyrl |
Korsičtina | co |
Krymská tatarština | crh |
Čeština | cs |
Kašubština | csb |
Velština | cy |
Dánština | da |
Němčina | de |
Dhimal | dhi |
Dogri | doi |
Dolnolužičtina | dsb |
Angličtina | en |
Španělština | es |
Estonština | et |
Baskičtina | eu |
Perština | fa |
Finština | fi |
Filipino | fil |
Jazyk | Kód (volitelné) |
---|---|
Fidžijština | fj |
Faerština | fo |
Francouzština | fr |
Friulian | fur |
Západní Frisian | fy |
Irština | ga |
Gagauz | gag |
Skotská gaelština | gd |
Gilbertese | gil |
Galicijština | gl |
Gondi | gon |
Manština | gv |
Gurung | gvr |
Havajský | haw |
Hindština | hi |
Halbi | hlb |
Chhattisgarhi | hne |
Hani | hni |
Ho |
hoc |
Chorvatština | hr |
Hornolužická srbština | hsb |
Haitský | ht |
Maďarština | hu |
Interlingua | ia |
Indonéština | id |
Islandština | is |
Italština | it |
Inuktitutština | iu |
Japonština | |
Jaunsari | jns |
Jávský | jv |
Kara-Kalpak (latinka) | kaa , kaa-latn |
Kara-Kalpak (cyrilice) | kaa-cyrl |
Kachin | kac |
Kabuverdianu | kea |
Korku | kfq |
Khasi | kha |
Kazaština (latinka) | kk , kk-latn |
Kazaština (cyrilice) | kk-cyrl |
Kalaallisut | kl |
Khaling | klr |
Malto | kmj |
Jazyk | Kód (volitelné) |
---|---|
Korejština | |
Kosraean | kos |
Koryak | kpy |
Karachay-Balkar | krc |
Kurukh | kru |
Kölsch | ksh |
Amerika (latinka) | ku , ku-latn |
Arabština (arabština) | ku-arab |
Kumyk | kum |
Cornwallština | kw |
Kirgizské | ky |
Latina | la |
Lucemburština | lb |
Lakota | lkt |
Litevština | lt |
Maorština | mi |
Mongolština | mn |
Maráthština | mr |
Malajština | ms |
Maltština | mt |
Hmong Daw |
mww |
Erzya | myv |
Neapolské | nap |
Nepálština | ne |
Niuean | niu |
Nizozemština | nl |
Norština | no |
Nogai | nog |
Okcitánština | oc |
Ossetian | os |
Paňdžábština | pa |
Polština | pl |
Dari | prs |
Nasdílení změn | ps |
Portugalština | pt |
K'iche' | quc |
Camling | rab |
Románština | rm |
Rumunština | ro |
Ruština | ru |
Sanskrt | sa |
Santali | sat |
Jazyk | Kód (volitelné) |
---|---|
Sadri | sck |
Skotové | sco |
Slovenština | sk |
Slovinština | sl |
Samojština | sm |
Jižní Sami | sma |
Severní Sami | sme |
Lule Sami | smj |
Inari Sami | smn |
Skolt Sami | sms |
Somálština | so |
Albánština | sq |
Srbština (latinka) | sr , sr-latn |
Sirmauri | srx |
Švédština | sv |
Svahilština | sw |
Tetum | tet |
Tádžičtina | tg |
Thangmi | thf |
Turkmenština | tk |
Tonga | to |
Turečtina | tr |
Tatarština | tt |
Tuvinian | tyv |
Ujgurština | ug |
Urdština | ur |
Uzbečtina (latinka) | uz , uz-latn |
Uzbečtina (cyrilice) | uz-cyrl |
Uzbečtina (arabština) | uz-arab |
Volapük | vo |
Walser | wae |
Kangri | xnr |
Yucateco | yua |
Zhuang | za |
Čínština (Han (zjednodušená varianta)) | zh , zh-hans |
Čínština (Han (tradiční varianta)) | zh-hant |
Zulština | zu |
Jazyk | Kód jazyka |
---|---|
Afrikánština | af |
Albánština | sq |
Asturština | ast |
Baskičtina | eu |
Bislama | bi |
Bretonština | br |
Katalánština | ca |
Cebuano | ceb |
Chamorro | ch |
Čínština (zjednodušená) | zh-Hans |
Čínština (tradiční) | zh-Hant |
Cornwallština | kw |
Korsičtina | co |
Krymský Tatar (latinka) | crh |
Čeština | cs |
Dánština | da |
Nizozemština | nl |
Angličtina (vytištěno a ručně psané) | en |
Estonština | et |
Fidžijština | fj |
Filipino | fil |
Finština | fi |
Francouzština | fr |
Friulian | fur |
Galicijština | gl |
Němčina | de |
Gilbertese | gil |
Grónština | kl |
Haitská kreolština | ht |
Hani | hni |
Hmong Daw (latinka) | mww |
Maďarština | hu |
Indonéština | id |
Interlingua | ia |
Inuktitut (latinka) | iu |
Irština | ga |
Jazyk | Kód jazyka |
---|---|
Italština | it |
japonština | ja |
Jávský | jv |
K'iche' | quc |
Kabuverdianu | kea |
Kachin (latinka) | kac |
Kara-Kalpak | kaa |
Kašubština | csb |
Khasi | kha |
Korejština | ko |
Latinka (latinka) | kur |
Lucemburština | lb |
Malajá (latinka) | ms |
Manština | gv |
Neapolské | nap |
Norština | no |
Okcitánština | oc |
Polština | pl |
Portugalština | pt |
Románština | rm |
Skotové | sco |
Skotská gaelština | gd |
Slovinština | slv |
Španělština | es |
Swahili (latinka) | sw |
Švédština | sv |
Tatar (latinka) | tat |
Tetum | tet |
Turečtina | tr |
Hornolužická srbština | hsb |
Uzbečtina (latinka) | uz |
Volapük | vo |
Walser | wae |
Západní Frisian | fy |
Yucatécká mayština | yua |
Zhuang | za |
Zulština | zu |
Obecný dokument
Důležité
Díky funkci Document Intelligence v4.0:2024-02-29-preview, 2023-10-31-preview a dále se do rozložení (předem sestavený dokument) přidává obecný model dokumentu (předem připravený dokument). Pokud chcete extrahovat páry klíč-hodnota, značky výběru, text, tabulky a strukturu z dokumentů, použijte následující modely:
Páry klíč-hodnota | version | ID modelu |
---|---|---|
Model rozložení se zadaným řetězcem features=keyValuePairs dotazu |
• v4:2024-02-29-preview, 2023-10-31-preview • v3.1:2023-07-31 (GA) |
prebuilt-layout |
Obecný model dokumentu | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) |
prebuilt-document |
ID modelu: předem připravený dokument
Následující tabulka uvádí obecnou podporu jazyka modelu dokumentů.
Model ID |
Jazyk – kód národního prostředí | Výchozí |
---|---|---|
předem připravený dokument | Angličtina (USA) – en-US |
Angličtina (USA) – en-US |
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro