Wymagania i ograniczenia dotyczące modelu przetwarzania dokumentów

Obsługiwane języki

Model dla dokumentów ze stałym szablonem

Następujące języki są obsługiwane podczas trenowania modelu przetwarzania dokumentów i wybierania dokumentów ze stałym szablonem jako typu dokumentu:

Abaza, abchaski, achiński, acoli, adangme, adygejski, afarski, afrikaans, akan, albański, algonkiński, angika (dewanagari), arabski, asturyjski, asu (Tanzania), awarski, awadhi-hindi (dewanagari), ajmara, azerski (łac.), bafijski, bagheli, bambara, baszkirski, baskijski, białoruski (cyrylica), białoruski (łacina), bemba (Zambia), bhojpuri-hindi (dewanagari), bikol, bini, bislama, bodo (dewanagari), bośniacki (łacina), brajbha, bretoński, bułgarski, bundeli, buriacki (cyrylica), kataloński, cebuano, chamling, chamorro, czeczeński, chhattisgarhi (dewanagari), chiga, chiński uproszczony, chiński tradycyjny, choktaw, czukot, czuwaski, kornwalijski, korsykański, cree, creek, tatarski krymski (łacina), chorwacki, wroni, czeski, duński, dargwa, dari, dhimal (dewanagari), dogri (dewanagari), duala, dungański, niderlandzki, efik, angielski, erija (cyrylica), estoński, farerski, fidżyjski, filipiński, fiński, fon, francuski, friulski, ga, gagauski (łac.), galicyjski, ganda, gayo, niemiecki, gilbertyński, gondi (dewanagari), grecki, grenlandzki, guarani, gurung (dewanagari), gusii, kreolski haitański, halbi (dewanagari), hani, haryanvi, hawajski, hebrajski, herero, hiligajnon, hindi, hmong daw (łac.), ho (dewanagiri), węgierski, iban, islandzki, igbo, iloko, inari lapoński, indonezyjski, inguski, interlingua, inuktitut (łac.), irlandzki, włoski, japoński, jaunsari (dewanagari), jawajski, jola-fonyi, kabardyjski, kabuverdianu, kachiński (łac.), kalendżin, kałmucki, kangri (dewanagari), kanuri, karaczaj-bałkar, kara-kalpak (cyrylica), kara-kalpak (łac.), kaszubski, kazachski (cyrylica), kazachski (łac.), khakas, khaling, khasi, k'iche', kikuyu, kildin sami, kinyarwanda, komi, kongo, koreański, korku, koryak, kosraean, kpelle, kuanyama, kumyk (cyrylica), kurdyjski (arabski), kurdyjski (łacina), kurukh (dewanagari), kirgiski (cyrylica), lak, lakota, łacina, łotewski, lezgiński, lingala, litewski, dolnołużycki, lozi, lule sami, luo (Kenia i Tanzania), luksemburski, luyia luy, macedoński, machame, madurese, mahasu pahari (dewanagari), makhuwa-meetto, makonde, malgaski, malajski (łac.), maltański, malto (dewanagari), mandinka, manx, maoryski, mapudungun, marathi, mari (rosyjski), masajski, mende (Sierra Leone), meru, meta', minangkabau, mohawk, mongolski (cyrylica), mongondow, czarnogórski (cyrylica), czarnogórski (łacina), morisyen, mundang, nahuatl, navajo, ndonga, neapolitański, nepalski, ngomba, niuean, nogay, północny ndebele, północny lapoński (łacina), norweski, nyanja, nyankole, nzima, oksytański, ojibwa, oromo, osetyjski, pampanga, pangasinan, papiamento, paszto, pedi, perski, polski, portugalski, pendżabski (arabski), keczua, ripuaryjski, rumuński, romansz, rundi, rosyjski, rwa, sadri (dewanagari), sacha, samburu, samoański (łac.), sango, sangu (gaboński), sanskryt (dewanagari), santali (dewanagiri), szkocki, szkocki gaelicki, sena, serbski (cyrylica), serbski (łac.), szambala, szerpa (dewanagari), szona, siksika, sirmauri (dewanagari), skolt lapoński, słowacki, słoweński, soga, somalijski (arabski), somalijski (łacina), songhai, południowy ndebele, południowy ałtajski, południowy lapoński, południowy sotho, hiszpański, sundański, suahili (łacina), swati, szwedzki, tabassaran, tachelhit, tahitański, taita, tadżycki (cyrylica), tamilski, tatarski (cyrylica), tatarski (łacina), teso, tetum, tajski, thangmi, tok pisin, tongański, tsonga, tswana, turecki, turkmeński (łacina), tuwiński, udmurcki, ujgurski (cyrylica), ukraiński, górnołużycki, urdu, ujgurski (arabski), uzbecki (arabski), uzbecki (cyrylica), uzbecki (łacina), wietnamski, volapük, vunjo, walserski, walijski, zachodniofryzyjski, wolof, xhosa, jukatecki maja, zapotecki, zarma, zhuang, zulu

Wzór dokumentów ogólnych

Następujące języki są obsługiwane podczas trenowania modelu przetwarzania dokumentów i wybierania Dokumenty ogólne jako typu dokumentu.

afrikaans, albański, arabski, bułgarski, chiński (Han (wariant uproszczony)), chiński (Han (wariant tradycyjny)), chorwacki, czeski, duński, holenderski, estoński, fiński, francuski, niemiecki, hebrajski, hindi, węgierski, indonezyjski, włoski, japoński, koreański, łotewski, litewski, macedoński, marathi, nepalski (makrojęzyk), norweski, panjabi, perski, polski, portugalski, rosyjski, rumuński, słowacki, słoweński, somalijski (arabski), somalijski (łacina), hiszpański, suahili (makrojęzyk), szwedzki, tamilski, tajski, turecki, ukraiński, urdu, wietnamski

Wymagania

Przetwarzanie dokumentów działa na dokumentach wejściowych, które spełniają następujące wymagania:

  • Format JPG, PNG lub PDF (tekst lub obraz zeskanowany). Pliki PDF z tekstem osadzonym są lepsze, ponieważ nie występują błędy podczas wyodrębniania i lokalizowania znaków.
  • Plików TIFF nie można używać do szkolenia. Do szkolenia modelu będą potrzebne dokumenty w formacie PDF, JPG lub PNG. Po przeszkolonym modelu można wyodrębnić dane z plików TIFF, gdy model jest używany w przepływie w chmurze Power Automate.
  • Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem należy usunąć blokadę.
  • Maksymalny rozmiar dokumentu do przetworzenia nie może przekraczać 20 MB.
  • W przypadku obrazów wymiary muszą należeć do przedziału od 50 x 50 do 10 000 x 10 000 pikseli.
  • W przypadku skanowania z dokumentów papierowych skany powinny być obrazami o wysokiej jakości.
  • Można tworzyć do 200 zbiorów na model.
  • W przepływie w chmurze limit pól, w których można umieścić etykiety do przetwarzania dokumentów, wynosi 300.

Uwaga

  • Wyodrębnianie podpisów z dokumentów nie jest obecnie obsługiwane.
  • Pola, które dzielą granice stron, nie są obecnie obsługiwane.
  • Łamanie wierzy między stronami, nie jest obecnie obsługiwane.

Porady dotyczące optymalizacji

Dowiedz się, jak poprawić wydajność modeli przetwarzania dokumentów.

Następny krok

Tworzenie modelu przetwarzania formularzy