Nyelvi támogatás: dokumentumelemzés
Ez a tartalom a következőre vonatkozik: v4.0 (előzetes verzió) | Korábbi verziók: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ez a tartalom a következőre vonatkozik: v3.1 (GA) | Legújabb verzió: v4.0 (előzetes verzió) | Korábbi verziók: v3.0 v2.1
Ez a tartalom a következőre vonatkozik: v3.0 (GA) | Legújabb verziók: v4.0 (előzetes verzió) v3.1 | Korábbi verzió: 2.1-es verzió
Ez a tartalom a következőre vonatkozik: v2.1 | Legújabb verzió: 4.0-s verzió (előzetes verzió)
Az Azure AI Document Intelligence-modellek többnyelvű dokumentumfeldolgozási támogatást nyújtanak. Nyelvi támogatási képességeink lehetővé teszik a felhasználók számára, hogy természetes módon kommunikáljanak az alkalmazásokkal, és lehetővé tegyék a globális tájékoztatást. A dokumentumelemzési modellek lehetővé teszik az űrlapokból és dokumentumokból való szövegkivételt, és strukturált, üzleti használatra kész tartalmakat ad vissza, amelyek készen állnak a szervezet tevékenységére, használatára vagy előrehaladására. Az alábbi táblázatok az elérhető nyelvet és területi támogatást sorolják fel modell és funkció szerint:
- Olvasás: Az olvasási modell lehetővé teszi a nyomtatott és kézzel írt szövegek kinyerását és elemzését. Ez a modell a dokumentumintelligencia egyéb előre összeállított modelljeinek, például az elrendezés, az általános dokumentum, a számla, a nyugta, az identitás(azonosító) dokumentum, az egészségbiztosítási kártya, az adódokumentumok és az egyéni modellek alapjául szolgáló OCR-motor. További információ: Modell olvasása – áttekintés
- Elrendezés: Az elrendezési modell lehetővé teszi a szöveg, táblázatok, dokumentumszerkezet és kijelölési jelek (például választógombok és jelölőnégyzetek) kinyerésének és elemzését űrlapokból és dokumentumokból.
- Általános dokumentum: Az általános dokumentummodell lehetővé teszi a szöveg, a dokumentumszerkezet és a kulcs-érték párok kinyerását és elemzését. További információ: Általános dokumentummodell áttekintése
Feljegyzés
Nyelvi kód megadása nem kötelező
A Dokumentumintelligencia mélytanuláson alapuló univerzális modelljei kinyerik a dokumentumok összes többnyelvű szövegét, beleértve a vegyes nyelveket tartalmazó szövegsorokat is, és nem igényelnek nyelvi kód megadását.
Ne adja meg paraméterként a nyelvi kódot, hacsak nem biztos a nyelvben, és csak a megfelelő modell alkalmazására szeretné kényszeríteni a szolgáltatást. Ellenkező esetben előfordulhat, hogy a szolgáltatás hiányos és helytelen szöveget ad vissza.
Emellett nem szükséges területi beállításokat megadni. Ez egy nem kötelező paraméter. A Dokumentumintelligencia mélytanulási technológiája automatikusan észleli a kép szövegnyelvét.
Modell olvasása
Modellazonosító: előre összeállított olvasás
Az alábbi táblázat a nyomtatott szövegek kinyerését és elemzését támogató olvasási modell nyelvi támogatását sorolja fel.
Nyelv | Kód (nem kötelező) |
---|---|
Abaza | abq |
Abházián | ab |
Achinese | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
Afar | aa |
Búr | af |
Akan | ak |
Albán | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Arab | ar |
Asztúriai | ast |
Asu (Tanzánia) | asa |
Avaric | av |
Awadhi-Hindi (Devanagari) | awa |
Aymara | ay |
Azerbajdzsáni (latin) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Baskír | ba |
Baszk | eu |
Fehérorosz (cirill betűs) | be , be-cyrl |
Fehérorosz (latin) | be , be-latn |
Bemba (Zambia) | bem |
Bena (Tanzánia) | bez |
Bhojpuri-Hindi (Devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Devanagari) | brx |
Bosnyák (latin betűs) | bs |
Brajbha | bra |
Breton | br |
Bolgár | bg |
Bundeli | bns |
Buryat (cirill betűs) | bua |
Katalán | ca |
Cebuano | ceb |
Letörés | rab |
Chamorro | ch |
Csecsen | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
kínai (egyszerűsített) | zh-Hans |
Kínai (hagyományos) | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Csuvas | cv |
Cornwalli | kw |
Korzikai | co |
Cree | cr |
Patak | mus |
Krími tatár (latin) | crh |
Horvát | hr |
Varjú | cro |
Cseh | cs |
Dán | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | doi |
Duala | dua |
Dungan | dng |
Holland | nl |
Efik | efi |
Angol | en |
Erzya (cirill betűs) | myv |
Észt | et |
Feröer-szigeteki | fo |
Fidzsi | fj |
Filipino | fil |
finn | fi |
Nyelv | Kód (nem kötelező) |
---|---|
Fon |
fon |
Francia | fr |
Friuli | fur |
Ga |
gaa |
Gagauz (latin) | gag |
Gallego | gl |
Ganda | lg |
Gayo | gay |
Német | de |
Gilbertese | gil |
Gondi (Devanagari) | gon |
Görög | el |
Grönlandi | kl |
Guarani | gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Haitii kreol | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Hawaii | haw |
héber | he |
Herero | hz |
Hiligaynon | hil |
Hindi | hi |
Hmong Daw (latin) | mww |
Ho(Devanagiri) | hoc |
Magyar | hu |
Iban | iba |
Izlandi | is |
Igbo | ig |
Iloko | ilo |
Inari Sami | smn |
Indonéz | id |
Ingush | inh |
Interlingva | ia |
Inuktitut (latin) | iu |
Ír | ga |
Olasz | it |
Japán | ja |
Jaunsari (Devanagari) | Jns |
Jávai | jv |
Jola-Fonyi | dyo |
Kabardian | kbd |
Kabuverdianu | kea |
Kachin (latin) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karachay-Balkar | krc |
Kara-Kalpak (cirill betűs) | kaa-cyrl |
Kara-Kalpak (latin) | kaa |
Kashubian | csb |
Kazak (cirill betűs) | kk-cyrl |
Kazak (latin) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
K'iche' | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Kinyarwanda | rw |
Komi | kv |
Kongo | kg |
Koreai | ko |
Korku | kfq |
Koryak | kpy |
Kosraean | kos |
Kpelle | kpe |
Kuanyama | kj |
Kumyk (cirill betűs) | kum |
Kurd (arab) | ku-arab |
Kurd (latin) | ku-latn |
Kurukh (Devanagari) | kru |
Kirgiz (cirill betűs) | ky |
Lak |
lbe |
Lakota | lkt |
Nyelv | Kód (nem kötelező) |
---|---|
Latin | la |
Lett | lv |
Lezghian | lex |
Lingala | ln |
Litván | lt |
Alsó sorbián | dsb |
Lozi | loz |
Lule Sami | smj |
Luo (Kenya és Tanzánia) | luo |
Luxemburgi | lb |
Luyia | luy |
Macedón | mk |
Machame | jmc |
Madurese | mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Madagaszkári | mg |
Maláj (latin) | ms |
Máltai | mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Man-szigeti macska | gv |
Maori | mi |
Mapudungun | arn |
Marathi | mr |
Mari (Oroszország) | chm |
Masai | mas |
Mende (Sierra Leone) | men |
Meru | mer |
Meta' | mgo |
Minangkabau | min |
Mohawk | moh |
Mongol (cirill betűs) | mn |
Mongondow | mog |
Montenegró (cirill betűs) | cnr-cyrl |
Montenegró (latin) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Nápolyi | nap |
Nepáli | ne |
Ngomba | jgo |
Niuean | niu |
Nogay | nog |
Észak-Ndebele | nd |
Északi számi (latin) | sme |
Norvég | no |
Nyanja | ny |
Nyankole | nyn |
Nzima | nzi |
Okcitán | oc |
Ojibwa | oj |
Oromo | om |
Oszét | os |
Pampanga | pam |
Pangasinan | pag |
Papiamentó | pap |
Pastu | ps |
Pedi | nso |
Perzsa | fa |
Lengyel | pl |
Portugál | pt |
Punjabi (arab) | pa |
Kecsua | qu |
Ripuarian | ksh |
Román | ro |
Romansh | rm |
Rundi | rn |
Orosz | ru |
Rwa |
rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
Szamoán (latin) | sm |
Sango | sg |
Nyelv | Kód (nem kötelező) |
---|---|
Sangu (Gabon) | snq |
Szanszkrit (Devanagari) | sa |
Santali (Devanagiri) | sat |
Skót | sco |
Skót gael | gd |
Sena | seh |
Szerb (cirill betűs) | sr-cyrl |
Szerb (latin betűs) | sr , sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
Skolt Sami | sms |
Szlovák | sk |
Szlovén | sl |
Soga | xog |
Szomáliai (arab) | so |
Szomáliai (latin) | so-latn |
Songhai | son |
Dél-Ndebele | nr |
Déli Altai | alt |
Dél-Szami | sma |
Dél-Sotho | st |
Spanyol | es |
Sundanese | su |
Szuahéli (latin) | sw |
Swati | ss |
Svéd | sv |
Tabassaran | tab |
Tachelhit | shi |
Tahitian | ty |
Taita | dav |
Tajik (cirill betűs) | tg |
Tamil | ta |
Tatár (cirill betűs) | tt-cyrl |
Tatár (latin) | tt |
Teso | teo |
Tetum | tet |
Thai | th |
Thangmi | thf |
Tok Pisin | tpi |
Tongai | to |
Tsonga | ts |
Tswana | tn |
Török | tr |
Türkmének (latin betűs) | tk |
Tuvan | tyv |
Udmurt | udm |
Ujgur (cirill betűs) | ug-cyrl |
Ukrán | uk |
Felső sorbián | hsb |
urdu | ur |
Ujgur (arab) | ug |
Üzbég (arab) | uz-arab |
Üzbég (cirill betűs) | uz-cyrl |
Üzbég (latin) | uz |
Vietnámi | vi |
Volapük | vo |
Vunjo | vun |
Walser | wae |
Walesi | cy |
Nyugati fríz | fy |
Wolof | wo |
Xhosza | xh |
Yucatec Maya | yua |
Zapotec | zap |
Zarma | dje |
Zhuang | za |
Zulu | zu |
Az alábbi táblázat a nyomtatott szövegek kinyerését és elemzését támogató olvasási modell nyelvi támogatását sorolja fel.
Nyelv | Kód (nem kötelező) |
---|---|
Búr | af |
Angika | anp |
Arab | ar |
Asztúriai | ast |
Awadhi | awa |
Azerbajdzsáni | az |
Fehérorosz (cirill betűs) | be , be-cyrl |
Fehérorosz (latin) | be-latn |
Bagheli | bfy |
Mahasu Pahari | bfz |
Bolgár | bg |
Haryanvi | bgc |
Bhojpuri | bho |
Bislama | bi |
Bundeli | bns |
Breton | br |
Braj | bra |
Bodó | brx |
bosnyák | bs |
Buriat | bua |
Katalán | ca |
Cebuano | ceb |
Chamorro | ch |
Montenegró (latin) | cnr , cnr-latn |
Montenegró (cirill betűs) | cnr-cyrl |
Korzikai | co |
Krími tatár | crh |
Cseh | cs |
Kashubian | csb |
Walesi | cy |
Dán | da |
Német | de |
Dhimal | dhi |
Dogri | doi |
Alsó sorbián | dsb |
Angol | en |
Spanyol | es |
Észt | et |
Baszk | eu |
Perzsa | fa |
finn | fi |
Filipino | fil |
Nyelv | Kód (nem kötelező) |
---|---|
Fidzsi | fj |
Feröer-szigeteki | fo |
Francia | fr |
Friuli | fur |
Nyugati fríz | fy |
Ír | ga |
Gagauz | gag |
Skót gael | gd |
Gilbertese | gil |
Gallego | gl |
Gondi | gon |
Man-szigeti macska | gv |
Gurung | gvr |
Hawaii | haw |
Hindi | hi |
Halbi | hlb |
Chhattisgarhi | hne |
Hani | hni |
Ho |
hoc |
Horvát | hr |
Felső sorbián | hsb |
Haiti | ht |
Magyar | hu |
Interlingva | ia |
Indonéz | id |
Izlandi | is |
Olasz | it |
Inuktitut | iu |
Japán | |
Jaunsari | jns |
Jávai | jv |
Kara-Kalpak (latin) | kaa , kaa-latn |
Kara-Kalpak (cirill betűs) | kaa-cyrl |
Kachin | kac |
Kabuverdianu | kea |
Korku | kfq |
Khasi | kha |
Kazak (latin) | kk , kk-latn |
Kazak (cirill betűs) | kk-cyrl |
Kalaallisut | kl |
Khaling | klr |
Malto | kmj |
Nyelv | Kód (nem kötelező) |
---|---|
Koreai | |
Kosraean | kos |
Koryak | kpy |
Karachay-Balkar | krc |
Kurukh | kru |
Kölsch | ksh |
Kurd (latin) | ku , ku-latn |
Kurd (arab) | ku-arab |
Kumyk | kum |
Cornwalli | kw |
Kirgiz | ky |
Latin | la |
Luxemburgi | lb |
Lakota | lkt |
Litván | lt |
Maori | mi |
Mongol | mn |
Marathi | mr |
Maláj | ms |
Máltai | mt |
Hmong Daw |
mww |
Erzya | myv |
Nápolyi | nap |
Nepáli | ne |
Niuean | niu |
Holland | nl |
Norvég | no |
Nogai | nog |
Okcitán | oc |
Oszét | os |
Panjabi | pa |
Lengyel | pl |
Dari | prs |
Pushto | ps |
Portugál | pt |
K'iche' | quc |
Álcázás | rab |
Romansh | rm |
Román | ro |
Orosz | ru |
Szanszkrit | sa |
Santali | sat |
Nyelv | Kód (nem kötelező) |
---|---|
Sadri | sck |
Skót | sco |
Szlovák | sk |
Szlovén | sl |
Szamoai | sm |
Dél-Szami | sma |
Északi számi | sme |
Lule Sami | smj |
Inari Sami | smn |
Skolt Sami | sms |
Szomália | so |
Albán | sq |
Szerb (latin betűs) | sr , sr-latn |
Sirmauri | srx |
Svéd | sv |
Szuahéli | sw |
Tetum | tet |
Tádzsik | tg |
Thangmi | thf |
Türkmén | tk |
Tonga | to |
Török | tr |
Tatár | tt |
Tuvinian | tyv |
Ujgur | ug |
urdu | ur |
Üzbég (latin) | uz , uz-latn |
Üzbég (cirill betűs) | uz-cyrl |
Üzbég (arab) | uz-arab |
Volapük | vo |
Walser | wae |
Kangri | xnr |
Yucateco | yua |
Zhuang | za |
Kínai (Han (egyszerűsített változat)) | zh , zh-hans |
Kínai (Han (hagyományos változat)) | zh-hant |
Zulu | zu |
Elrendezés
Modellazonosító: előre összeállított elrendezés
Az alábbi táblázat a nyomtatott szövegek támogatott nyelvét sorolja fel:
Nyelv | Kód (nem kötelező) |
---|---|
Abaza | abq |
Abházián | ab |
Achinese | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
Afar | aa |
Búr | af |
Akan | ak |
Albán | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Arab | ar |
Asztúriai | ast |
Asu (Tanzánia) | asa |
Avaric | av |
Awadhi-Hindi (Devanagari) | awa |
Aymara | ay |
Azerbajdzsáni (latin) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Baskír | ba |
Baszk | eu |
Fehérorosz (cirill betűs) | be , be-cyrl |
Fehérorosz (latin) | be , be-latn |
Bemba (Zambia) | bem |
Bena (Tanzánia) | bez |
Bhojpuri-Hindi (Devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Devanagari) | brx |
Bosnyák (latin betűs) | bs |
Brajbha | bra |
Breton | br |
Bolgár | bg |
Bundeli | bns |
Buryat (cirill betűs) | bua |
Katalán | ca |
Cebuano | ceb |
Letörés | rab |
Chamorro | ch |
Csecsen | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
kínai (egyszerűsített) | zh-Hans |
Kínai (hagyományos) | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Csuvas | cv |
Cornwalli | kw |
Korzikai | co |
Cree | cr |
Patak | mus |
Krími tatár (latin) | crh |
Horvát | hr |
Varjú | cro |
Cseh | cs |
Dán | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | doi |
Duala | dua |
Dungan | dng |
Holland | nl |
Efik | efi |
Angol | en |
Erzya (cirill betűs) | myv |
Észt | et |
Feröer-szigeteki | fo |
Fidzsi | fj |
Filipino | fil |
finn | fi |
Nyelv | Kód (nem kötelező) |
---|---|
Fon |
fon |
Francia | fr |
Friuli | fur |
Ga |
gaa |
Gagauz (latin) | gag |
Gallego | gl |
Ganda | lg |
Gayo | gay |
Német | de |
Gilbertese | gil |
Gondi (Devanagari) | gon |
Görög | el |
Grönlandi | kl |
Guarani | gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Haitii kreol | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Hawaii | haw |
héber | he |
Herero | hz |
Hiligaynon | hil |
Hindi | hi |
Hmong Daw (latin) | mww |
Ho(Devanagiri) | hoc |
Magyar | hu |
Iban | iba |
Izlandi | is |
Igbo | ig |
Iloko | ilo |
Inari Sami | smn |
Indonéz | id |
Ingush | inh |
Interlingva | ia |
Inuktitut (latin) | iu |
Ír | ga |
Olasz | it |
Japán | ja |
Jaunsari (Devanagari) | Jns |
Jávai | jv |
Jola-Fonyi | dyo |
Kabardian | kbd |
Kabuverdianu | kea |
Kachin (latin) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karachay-Balkar | krc |
Kara-Kalpak (cirill betűs) | kaa-cyrl |
Kara-Kalpak (latin) | kaa |
Kashubian | csb |
Kazak (cirill betűs) | kk-cyrl |
Kazak (latin) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
K'iche' | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Kinyarwanda | rw |
Komi | kv |
Kongo | kg |
Koreai | ko |
Korku | kfq |
Koryak | kpy |
Kosraean | kos |
Kpelle | kpe |
Kuanyama | kj |
Kumyk (cirill betűs) | kum |
Kurd (arab) | ku-arab |
Kurd (latin) | ku-latn |
Nyelv | Kód (nem kötelező) |
---|---|
Kurukh (Devanagari) | kru |
Kirgiz (cirill betűs) | ky |
Lak |
lbe |
Lakota | lkt |
Latin | la |
Lett | lv |
Lezghian | lex |
Lingala | ln |
Litván | lt |
Alsó sorbián | dsb |
Lozi | loz |
Lule Sami | smj |
Luo (Kenya és Tanzánia) | luo |
Luxemburgi | lb |
Luyia | luy |
Macedón | mk |
Machame | jmc |
Madurese | mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Madagaszkári | mg |
Maláj (latin) | ms |
Máltai | mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Man-szigeti macska | gv |
Maori | mi |
Mapudungun | arn |
Marathi | mr |
Mari (Oroszország) | chm |
Masai | mas |
Mende (Sierra Leone) | men |
Meru | mer |
Meta' | mgo |
Minangkabau | min |
Mohawk | moh |
Mongol (cirill betűs) | mn |
Mongondow | mog |
Montenegró (cirill betűs) | cnr-cyrl |
Montenegró (latin) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Nápolyi | nap |
Nepáli | ne |
Ngomba | jgo |
Niuean | niu |
Nogay | nog |
Észak-Ndebele | nd |
Északi számi (latin) | sme |
Norvég | no |
Nyanja | ny |
Nyankole | nyn |
Nzima | nzi |
Okcitán | oc |
Ojibwa | oj |
Oromo | om |
Oszét | os |
Pampanga | pam |
Pangasinan | pag |
Papiamentó | pap |
Pastu | ps |
Pedi | nso |
Perzsa | fa |
Lengyel | pl |
Portugál | pt |
Punjabi (arab) | pa |
Kecsua | qu |
Ripuarian | ksh |
Román | ro |
Romansh | rm |
Rundi | rn |
Orosz | ru |
Nyelv | Kód (nem kötelező) |
---|---|
Rwa |
rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
Szamoán (latin) | sm |
Sango | sg |
Sangu (Gabon) | snq |
Szanszkrit (Devanagari) | sa |
Santali (Devanagiri) | sat |
Skót | sco |
Skót gael | gd |
Sena | seh |
Szerb (cirill betűs) | sr-cyrl |
Szerb (latin betűs) | sr , sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
Skolt Sami | sms |
Szlovák | sk |
Szlovén | sl |
Soga | xog |
Szomáliai (arab) | so |
Szomáliai (latin) | so-latn |
Songhai | son |
Dél-Ndebele | nr |
Déli Altai | alt |
Dél-Szami | sma |
Dél-Sotho | st |
Spanyol | es |
Sundanese | su |
Szuahéli (latin) | sw |
Swati | ss |
Svéd | sv |
Tabassaran | tab |
Tachelhit | shi |
Tahitian | ty |
Taita | dav |
Tajik (cirill betűs) | tg |
Tamil | ta |
Tatár (cirill betűs) | tt-cyrl |
Tatár (latin) | tt |
Teso | teo |
Tetum | tet |
Thai | th |
Thangmi | thf |
Tok Pisin | tpi |
Tongai | to |
Tsonga | ts |
Tswana | tn |
Török | tr |
Türkmének (latin betűs) | tk |
Tuvan | tyv |
Udmurt | udm |
Ujgur (cirill betűs) | ug-cyrl |
Ukrán | uk |
Felső sorbián | hsb |
urdu | ur |
Ujgur (arab) | ug |
Üzbég (arab) | uz-arab |
Üzbég (cirill betűs) | uz-cyrl |
Üzbég (latin) | uz |
Vietnámi | vi |
Volapük | vo |
Vunjo | vun |
Walser | wae |
Walesi | cy |
Nyugati fríz | fy |
Wolof | wo |
Xhosza | xh |
Yucatec Maya | yua |
Zapotec | zap |
Zarma | dje |
Zhuang | za |
Zulu | zu |
Az alábbi táblázat az elrendezési modell nyelvi támogatását tartalmazza a nyomtatott szövegek kinyerése és elemzése során.
Nyelv | Kód (nem kötelező) |
---|---|
Búr | af |
Angika | anp |
Arab | ar |
Asztúriai | ast |
Awadhi | awa |
Azerbajdzsáni | az |
Fehérorosz (cirill betűs) | be , be-cyrl |
Fehérorosz (latin) | be-latn |
Bagheli | bfy |
Mahasu Pahari | bfz |
Bolgár | bg |
Haryanvi | bgc |
Bhojpuri | bho |
Bislama | bi |
Bundeli | bns |
Breton | br |
Braj | bra |
Bodó | brx |
bosnyák | bs |
Buriat | bua |
Katalán | ca |
Cebuano | ceb |
Chamorro | ch |
Montenegró (latin) | cnr , cnr-latn |
Montenegró (cirill betűs) | cnr-cyrl |
Korzikai | co |
Krími tatár | crh |
Cseh | cs |
Kashubian | csb |
Walesi | cy |
Dán | da |
Német | de |
Dhimal | dhi |
Dogri | doi |
Alsó sorbián | dsb |
Angol | en |
Spanyol | es |
Észt | et |
Baszk | eu |
Perzsa | fa |
finn | fi |
Filipino | fil |
Nyelv | Kód (nem kötelező) |
---|---|
Fidzsi | fj |
Feröer-szigeteki | fo |
Francia | fr |
Friuli | fur |
Nyugati fríz | fy |
Ír | ga |
Gagauz | gag |
Skót gael | gd |
Gilbertese | gil |
Gallego | gl |
Gondi | gon |
Man-szigeti macska | gv |
Gurung | gvr |
Hawaii | haw |
Hindi | hi |
Halbi | hlb |
Chhattisgarhi | hne |
Hani | hni |
Ho |
hoc |
Horvát | hr |
Felső sorbián | hsb |
Haiti | ht |
Magyar | hu |
Interlingva | ia |
Indonéz | id |
Izlandi | is |
Olasz | it |
Inuktitut | iu |
Japán | |
Jaunsari | jns |
Jávai | jv |
Kara-Kalpak (latin) | kaa , kaa-latn |
Kara-Kalpak (cirill betűs) | kaa-cyrl |
Kachin | kac |
Kabuverdianu | kea |
Korku | kfq |
Khasi | kha |
Kazak (latin) | kk , kk-latn |
Kazak (cirill betűs) | kk-cyrl |
Kalaallisut | kl |
Khaling | klr |
Malto | kmj |
Nyelv | Kód (nem kötelező) |
---|---|
Koreai | |
Kosraean | kos |
Koryak | kpy |
Karachay-Balkar | krc |
Kurukh | kru |
Kölsch | ksh |
Kurd (latin) | ku , ku-latn |
Kurd (arab) | ku-arab |
Kumyk | kum |
Cornwalli | kw |
Kirgiz | ky |
Latin | la |
Luxemburgi | lb |
Lakota | lkt |
Litván | lt |
Maori | mi |
Mongol | mn |
Marathi | mr |
Maláj | ms |
Máltai | mt |
Hmong Daw |
mww |
Erzya | myv |
Nápolyi | nap |
Nepáli | ne |
Niuean | niu |
Holland | nl |
Norvég | no |
Nogai | nog |
Okcitán | oc |
Oszét | os |
Panjabi | pa |
Lengyel | pl |
Dari | prs |
Pushto | ps |
Portugál | pt |
K'iche' | quc |
Álcázás | rab |
Romansh | rm |
Román | ro |
Orosz | ru |
Szanszkrit | sa |
Santali | sat |
Nyelv | Kód (nem kötelező) |
---|---|
Sadri | sck |
Skót | sco |
Szlovák | sk |
Szlovén | sl |
Szamoai | sm |
Dél-Szami | sma |
Északi számi | sme |
Lule Sami | smj |
Inari Sami | smn |
Skolt Sami | sms |
Szomália | so |
Albán | sq |
Szerb (latin betűs) | sr , sr-latn |
Sirmauri | srx |
Svéd | sv |
Szuahéli | sw |
Tetum | tet |
Tádzsik | tg |
Thangmi | thf |
Türkmén | tk |
Tonga | to |
Török | tr |
Tatár | tt |
Tuvinian | tyv |
Ujgur | ug |
urdu | ur |
Üzbég (latin) | uz , uz-latn |
Üzbég (cirill betűs) | uz-cyrl |
Üzbég (arab) | uz-arab |
Volapük | vo |
Walser | wae |
Kangri | xnr |
Yucateco | yua |
Zhuang | za |
Kínai (Han (egyszerűsített változat)) | zh , zh-hans |
Kínai (Han (hagyományos változat)) | zh-hant |
Zulu | zu |
Nyelv | Nyelvkód |
---|---|
Búr | af |
Albán | sq |
Asztúriai | ast |
Baszk | eu |
Bislama | bi |
Breton | br |
Katalán | ca |
Cebuano | ceb |
Chamorro | ch |
Kínai (egyszerűsített) | zh-Hans |
Kínai (hagyományos) | zh-Hant |
Cornwalli | kw |
Korzikai | co |
Krími tatár (latin) | crh |
Cseh | cs |
Dán | da |
Holland | nl |
Angol (nyomtatott és kézzel írt) | en |
Észt | et |
Fidzsi | fj |
Filipino | fil |
finn | fi |
Francia | fr |
Friuli | fur |
Gallego | gl |
Német | de |
Gilbertese | gil |
Grönlandi | kl |
Haitii kreol | ht |
Hani | hni |
Hmong Daw (latin) | mww |
Magyar | hu |
Indonéz | id |
Interlingva | ia |
Inuktitut (latin) | iu |
Ír | ga |
Nyelv | Nyelvkód |
---|---|
Olasz | it |
Japán | ja |
Jávai | jv |
K'iche' | quc |
Kabuverdianu | kea |
Kachin (latin) | kac |
Kara-Kalpak | kaa |
Kashubian | csb |
Khasi | kha |
Koreai | ko |
Kurd (latin) | kur |
Luxemburgi | lb |
Maláj (latin) | ms |
Man-szigeti macska | gv |
Nápolyi | nap |
Norvég | no |
Okcitán | oc |
Lengyel | pl |
Portugál | pt |
Romansh | rm |
Skót | sco |
Skót gael | gd |
Szlovén | slv |
Spanyol | es |
Szuahéli (latin) | sw |
Svéd | sv |
Tatár (latin) | tat |
Tetum | tet |
Török | tr |
Felső sorbián | hsb |
Üzbég (latin) | uz |
Volapük | vo |
Walser | wae |
Nyugati fríz | fy |
Yucatec Maya | yua |
Zhuang | za |
Zulu | zu |
Általános dokumentum
Fontos
A Dokumentumintelligencia 4.0:2024-07-31-preview, 2023-10-31 előzetes verziójával az általános dokumentummodell (előre összeállított dokumentum) lesz hozzáadva az elrendezéshez (előre összeállított elrendezés). Kulcs-érték párok, kijelölési jelek, szöveg, táblázatok és struktúra dokumentumokból való kinyeréséhez használja az alábbi modelleket:
Kulcsértékpárok | Verzió | Modellazonosító |
---|---|---|
Elrendezési modell megadott lekérdezési sztringgel features=keyValuePairs . |
• v4:2024-02-29-preview, 2023-10-31-preview • v3.1:2023-07-31 (GA) |
prebuilt-layout |
Általános dokumentummodell | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) |
prebuilt-document |
Modellazonosító: előre összeállított dokumentum
Az alábbi táblázat a dokumentummodellek általános nyelvi támogatását sorolja fel.
Modell ID |
Nyelv – Területi kód | Alapértelmezett |
---|---|---|
előre összeállított dokumentum | Angol (Egyesült Államok)—US |
Angol (Egyesült Államok)—US |
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: