Sdílet prostřednictvím


Požadavky a omezení pro model zpracování dokumentů

Podporované jazyky

Model pro dokumenty s pevnou šablonou

Při trénování modelu zpracování dokumentů a výběru dokumentů s pevnou šablonou jako typu dokumentu jsou podporovány následující jazyky:

Abaza, abcházština, ačínsky, ačolština, adangme, adygejština, afarština, afrikánština, akanština, albánština, algonkinština, angika (devanagari), arabština, asturština, asu (Tanzanie), avarština, awadhi-hindi (devanagari), aymarština, ázerbájdžánština (latinka), bafia, bagheli, bambarština, baškirština, baskičtina, běloruština (cyrilika), běloruština (latinka), bemba (Zambie), bemba (Zambie), bhódžpurština (devanagari), bikolština, bini, bislama, bodo (devanagari), bosensky (latinka), brajbháša, bretónština, bulharština, bundeli, burjatština (cyrilika), katalánština, cebuánština, čamling, čamorro, čečenština, čhatisgarhština (devanagari), čiga, čínština zjednodušená, čínština tradiční, čoktavština, čukotsky, čuvaština, cornština, korzičtina, krí, krík, krymskotatarština (latinka), chorvatština, krou, čeština, dánština, dargwa, darí, dhimálština (devanagari), dogrština (devanagari), duala, dungánština, nizozemština, efikština, angličtina, erzjanština (cyrilika), estonština, faerština, fidžijština, filipínština, finština, fonština, francouzština, friulština, ga, gagauzština (latinka), galicijština, gandština, gayo, němčina, gilbertština, gondština (devanagari), řečtina, grónština, guaraní, gurungština (devanagari), gusii, haitská kreolština, halbiština (devanagari), hanština, harijanština, havajština, hebrejština, herero, hiligaynon, hindština, hmong daw (latinka), ho (devanagari), maďarština, iban, islandština, igboština, iloko, inari sámština, indonéština, inguština, interlingua, inuktitut (latinka), irština, italština, japonština, jaunsarština (devanagari), javánština, jola-fonyi, kabardsky, kabuverdianu, kačinština (latinka), kalendžinština, kalmyk, kangri (devanagari), kanuri, karačajevo-balkarsky, kara-kalpakština (cyrilika), kara-kalpakština (latinka), kašubština, kazaština (cyrilika), kazaština (latinka), chakasština, chaling, khasi, k'ičé, kikujština, kildin sámština, kinyarwanda, komi, kongo, korejština, korku, koryak, kosraean, kpelle, kuanyama, kumycky (cyrilika), kurdština (arabské písmo), kurdština (latinka), kurukh (devanagari), kyrgyzština (cyrilika), lak, lakotština, latinka, lotyština, lezginština, lingala, litevština, dolnolužická srbština, lozi, lule sámština, luo (Keňa a Tanzanie), lucemburština, luyia luy, makedonština, machame, madurština, mahasu pahari (devanagari), makuwa-meetto, makonde, malgaština, malajština (latinka), maltština, malto (devanagari), mandinka, manx, maorština, mapudungun, maráthština, mari (Rusko), masajština, mende (Sierra Leone), meru, meta', minangkabau, mohawk, mongolština (cyrilika), mongondow, černohorská (cyrilika), černohorská (latinka), morisyen, mundang, nahuatl, navajo, ndonga, neapolština, nepálština, ngomba, niuean, nogajština, severní ndebele, severní sámština (latinka), norština, nyanja, nyankole, nzima, okcitánština, ojibwa, oromština, osetština, pampanga, pangasinan, papiamento, paštština, pedi, perština, polština, portugalština, pandžábština (arabština), kečuánština, ripuárština, rumunština, rétorománština, rundi, ruština, rwa, sadri (devanagari), sakha, samburu, samojština (latinka), sango, sangu (Gabon), sanskrt (devanagari), santalština (devanagari), skotská galština, sena, srbská (cyrilika), srbská (latinka), shambala, sherpa (devanagari), shona, siksika, sirmauri (devanagari), skolt sámština, slovenština, slovinština, soga, somálština (arabština), somálština (latinka), songhajština, jižní ndebele, jižní altajština, jižní sámština, jižní sothština, španělština, sundština, swahilština (latinka), swati, švédština, tabasaran, tachelhit, tahitština, taita, tadžičtina (cyrilika), tamilština, tatarština (cyrilika), tatarština (latinka), teso, tetum, thajština, thangmi, tok pisin, tonganština, tsonga, tswana, turečtina, turkmenština (latinka), tuvanština, udmurtština, ujgurština (cyrilika), ukrajinština, hornolužická srbština, urdština, ujgurština (arabština), uzbečtina (arabština), uzbečtina (cyrilika), uzbečtina (latinka), vietnamština, volapük, vunjo, walser, velština, západofríština, wolof, xhosa, yucatec maya, zapotec, zarma, zhuang, zulu

Model pro obecné dokumenty

Při trénování modelu zpracování dokumentů a výběru Obecných dokumentů jako typu dokumentu jsou podporovány následující jazyky.

Afrikánština, albánština, arabština, bulharština, čínština (zjednodušená), čínština (tradiční), chorvatština, čeština, dánština, nizozemština, estonština, finština, francouzština, němčina, hebrejština, hindština, maďarština, indonéština, italština, japonština, korejština, lotyšština, litevština, makedonština, maráthština, novořečtina (1453-), nepálština, norština, pandžábština, perština, polština, portugalština, rumunština, ruština, slovenština, slovinština, somálština (arabské písmo), somálština (latinka), španělština, svahilština, švédština, tamilština, thajština, turečtina, ukrajinština, urdština, vietnamština

Požadavky

Zpracování dokumentů funguje u vstupních dokumentů, které splňují následující požadavky:

  • Formát JPG, PNG nebo PDF (text nebo sken). Soubory PDF s vloženým textem jsou lepší, protože nebude docházet k chybám v extrakci a umístění znaků.
  • Soubory TIFF nelze použít pro trénování. K trénování modelu budete muset použít dokumenty ve formátu PDF, JPG nebo PNG. Jakmile je model trénován, může extrahovat data ze souborů TIFF, když je model použit v cloudovém toku Power Automate.
  • Pokud jsou soubory PDF uzamčeny heslem, musíte je před odesláním odstranit.
  • Maximální velikost dokumentu ke zpracování nesmí přesáhnout 20 MB.
  • Obrázky musí mít rozměry mezi 50 × 50 a 10 000 × 10 000 pixely.
  • Soubory naskenované z papírových dokumentů musí být obrázky ve vysoké kvalitě.
  • Na jeden model můžete vytvořit až 200 kolekcí.
  • V cloudovém toku je limit 300 polí, která lze označit pro zpracování dokumentů.

Poznámka:

  • Extrahování podpisů z dokumentů aktuálně není podporováno.
  • Pole, která přesahují přes hranice stránky, nejsou aktuálně podporována.
  • Řádky, které jsou zalomeny z jedné stránky na druhou, nejsou aktuálně podporovány.

Tip pro optimalizaci

Naučte se vylepšit výkon modelů zpracování dokumentů.

Další krok

Vytvoření modelu pro zpracování formulářů