Partajați prin


Cerințe și limitări pentru un model de procesare a documentelor

Limbile acceptate

Model pentru documente cu șablon fix

Următoarele limbi sunt acceptate la antrenarea unui model de procesare a documentelor și selectarea documentelor cu șablon fix ca tip de document:

Abaza, Abhază, Achineză, Acoli, Adangme, Adyghe, Afar, Afrikaans, Akan, Albaneză, Algonquin, Angika (Devanagari), Arabă, Asturiană, Asu (Tanzania), Avaric, Awadhi-Hindi (Devanagari), Aymara, Azerbaid (latină), Bafia, Bagheli, Belorusă, Bashă, Belarusa, Belarusa Bemba (Zambia), Bemba (Zambia), Bhojpuri-Hindi (Devanagari), Bikol, Bini, Bislama, Bodo (Devanagari), bosniacă (latină), brajbha, bretonă, bulgară, bundeli, buryat (chirilic), catalană, cebuano, chamling, chamorro, cecenă, chhattis, chineză simplă, chineză simplă, chogartahi, chineză simplă, devanagari Chukot, Chuvash, Cornish, Corsican, Cree, Creek, Crimeean Tatar (latină), croată, Crow, cehă, daneză, Dargwa, Dari, Dhimal (Devanagari), Dogri (Devanagari), Duala, Dungan, olandeză, Efik, engleză, Erzya (chirilic), estonă, feroeză, fijiană, filipineză, finlandeză, fon, franceză, friuleană, Ga, Gagauz (latină), galică, germană, devana, gagăuză (latină), galică, germană, devana, gagăuză, galleză Groenlandeză, Guarani, Gurung (Devanagari), Gusii, Creola haitiană, Halbi (Devanagari), Hani, Haryanvi, Hawaiiană, Ebraică, Herero, Hiligaynon, Hindi, Hmong Daw (latină), Ho (Devanagiri), Maghiară, Iban, islandeză, Igbo, Iloko, Inari Sami, Indoneziană, Italiană, Inguatinish, Indoneziană, Irlandeză, Inguatinish, Indoneziană Jaunsari (Devanagari), javaneză, Jola-Fonyi, Kabardian, Kabuverdianu, Kachin (latină), Kalenjin, Kalmyk, Kangri (Devanagari), Kanuri, Karachay-Balkar, Kara-Kalpak (chirilic), Kara-Kalpak (latină), Kashubian, kazah (chirilic), kazah (latină), Khakas, Khaling, Khasi, K'iche', Kikuyu, Kildin Sami, Kinyarwanda, Coreeană, Komielle, Kongra, Koreana, K. Kuanyama, Kumyk (chirilic), kurdă (araba), kurdă (latină), Kurukh (Devanagari), kirghiză (chirilic), Lak, Lakota, latină, letonă, lezghiană, lingala, lituaniană, sorabă inferioară, Lozi, Lule Sami, Luo (Kenya, Macedonia de Nord și Tanzania, Lumezia, Luxemburg și Tanzania), Luocha, Luxemburg și Tanzania Madurese, Mahasu Pahari (Devanagari), Makhuwa-Meetto, Makonde, Malagasy, Malay (latină), Malteză, Malto (Devanagari), Mandinka, Manx, Maori, Mapudungun, Marathi, Mari (Rusia), Masai, Mende (Sierra Leone), Meru, Meta', Minangkabau, Mohawk, Mongolian (chirilic), Mongondow, Muntenegrean (chirilic), Muntenegrean (latină), Morisyen, Mundang, Nepal, Najohuatan, Mundang, Najohuadong Ngomba, Niuean, Nogay, Ndebele de Nord, Sami de Nord (latină), Norvegiană, Nyanja, Nyankole, Nzima, Occitană, Ojibwa, Oromo, Ossetic, Pampanga, Pangasinan, Papiamento, Pashto, Pedi, Persană, Poloneză, Portugheză, Punjabi (Araba), Quechua, Română, Rusă, Sadri, Romanșă (Devanagari), Sakha, Samburu, Samoan (latină), Sango, Sangu (Gabon), sanscrită (Devanagari), Santali (Devanagari), Scoțiană, Gaelică Scoțiană, Sena, Sârbă (Chirilică), Sârbă (Latină), Shambala, Sherpa (Devanagari), Shona, Siksika, Sirmauri (Devanagari), Sami Skolt, Slovacă, Slovenă, Soga, Somaleză (Arabă), Somaleză (Latină), Songhai, Ndebele de Sud, Altai de Sud, Sami de Sud, Sotho de Sud, Spaniolă, Sundaneză, Swahili (Latină), Swati, Suedeză, Tabassaran, Tachelhit, Tahitiană, Taita, Tadjik (Chirilică), Tamilă, Tătară (Chirilică), Tătară (Latină), Teso, Tetum, Thailandeză, Thangmi, Tok Pisin, Tongană, Tsonga, Tswana, Turcă, Turkmenă (Latină), Tuvană, Udmurtă, Uigur (Chirilică), Ucraineană, Sorabă Superioară, Urdu, Uigur (Arabă), Uzbecă (Arabă), Uzbecă (Chirilică), Uzbecă (Latină), Vietnameză, Volapük Vunjo, Walser, Welsh, Western Frisian, Wolof, Xhosa, Yucatec Maya, Zapotec, Zarma, Zhuang, Zulu

Model pentru documente generale

Următoarele limbi sunt acceptate la antrenarea unui model de procesare a documentelor și selectarea Documente generale ca tip de document.

Afrikaans, albaneză, arabă, bulgară, chineză (Han (varianta simplificată)), chineză (Han (varianta tradițională)), croată, cehă, daneză, olandeză, estonă, finlandeză, franceză, germană, ebraică, hindi, maghiară, indoneziană, italiană, japoneză, coreeană, letonă, lituaniană, macedoneană, marathi, greacă modernă (1453-), nepaleză (macrolimbă), norvegiană, panjabi, persană, poloneză, portugheză, română, rusă, slovacă, slovenă, somaleză (arabă), somaleză (latină), spaniolă, swahili (macrolimbă), suedeză, tamilă, thailandeză, turcă, ucraineană, urdu, vietnameză

Cerințe

Prelucrarea documentelor funcționează asupra documentelor de intrare care îndeplinesc următoarele cerințe:

  • Format JPG, PNG sau PDF (text sau scanat). PDF-urile cu text încorporat sunt mai bune, deoarece nu vor exista erori la extragerea și localizarea caracterelor.
  • Fișierele TIFF nu pot fi utilizate pentru antrenament. Trebuie să utilizați documente în format PDF, JPG sau PNG pentru a antrena un model. Odată ce modelul este antrenat, acesta poate extrage date din fișierele TIFF atunci când modelul este utilizat într-un flux cloud Power Automate.
  • Dacă fișierele PDF sunt blocate prin parolă, trebuie să eliminați blocarea înainte de a le trimite.
  • Dimensiunea maximă a documentului care poate fi procesat nu trebuie să depășească 20 MB.
  • Pentru imagini, dimensiunile trebuie să fie între 50 × 50 și 10.000 × 10.000 pixeli.
  • Dacă sunt scanate de pe documente pe hârtie, imaginile scanate ar trebui să fie de înaltă calitate.
  • Puteți crea până la 200 de colecții per model.
  • Într-un flux în cloud, limita de câmpuri care pot fi etichetate pentru procesarea documentelor este de 300.

Notă

  • Extragerea semnăturilor din documente este acceptată în prezent numai pentru documentele șablon fixe.
  • Câmpurile care se împart între limitele paginii nu sunt acceptate în prezent.
  • Rândurile care trec de la o pagină la alta nu sunt acceptate în prezent.

Sfat de optimizare

Aflați cum să *îmbunătățiți* performanța modelelor de procesare a documentelor .

Pasul următor

Creați un model de procesare a formularelor