Dijeli putem


Najčešća pitanja o obradi dokumenata

Ovaj se članak sastoji od najčešćih pitanja o modelu obrade dokumenata u AI Builder Ako ovdje ne pronađete svoje pitanje, pregledajte Pregled modela umjetne inteligencije za obradu dokumenata ili pošaljite svoje pitanje zajednici Power Automate za AI Builder.

Funkcija

Što mogu učiniti s obradom dokumenata?

Pomoću obrade dokumenata možete izraditi prilagođeni AI model za izdvajanje informacija iz različitih vrsta dokumenata.

  • Opcija Dokumenti s fiksnim predloškom idealna je ako se elementi vaših dokumenata mogu naći na sličnim mjestima. To je obično slučaj za fakture, narudžbenice, narudžbenice za dostavu i porezne obrasce.
  • Opcija općih dokumenata idealna je za bilo koju vrstu dokumenta, uključujući one podržane prvom opcijom, ali i ugovore, izjavu o radu, pisma i drugo. Ova opcija može biti snažnija za izdvajanje podataka, ali zahtijeva dulje vrijeme vježbanja.

Saznajte više u članku Pregled modela obrade dokumenata.

Koje vrste dokumenata može obraditi obrada dokumenata?

Podržane vrste datoteka su PDF, JPG i PNG.

Koje podatke mogu izdvojiti iz dokumenata pomoću obrade dokumenata?

Obrada dokumenata može izdvojiti polja, tablice i potvrdne okvire iz dokumenata.

Saznajte više u članku Definiranje informacija za izdvajanje.

Mogu li izdvojiti rukom pisani tekst iz dokumenata?

Da. Obrada dokumenata može izdvojiti tiskani i rukom pisani tekst iz vaših dokumenata.

Koliko uzoraka trebam za obuku modela obrade dokumenata?

Za visokokvalitetne dokumente koji koriste isti raspored trebalo bi biti dovoljno pet oglednih dokumenata. Za dokumente niske kvalitete (na primjer, skeniranja loše kvalitete) možda će biti potrebno više oglednih dokumenata. Da biste poboljšali rezultate, upotrijebite 15 do 20 oglednih dokumenata.

Najbolje prakse

  • Za predloške dokumenata

    • Jedan (1) izgled po kolekciji.
    • Izgled mora biti identičan unutar iste zbirke.
    • Najmanje pet (5) i najviše 20 dokumenata po zbirci (nemojte prekoračiti ovo ograničenje).
  • Za opće dokumente

    • Stvorite jedinstveni model za sve varijacije vrste dokumenta, uključujući strukturirane i nestrukturirane dokumente.

    • Označite polja relevantna za njihove vrijednosti za bolju točnost ekstrakcije.

      Na primjer, upotrijebite "supplier_id" za ID dobavljača. Nazivi polja trebaju odgovarati jeziku dokumenta.

    • Najmanje pet (5) i najviše 20 dokumenata po zbirci (nemojte prekoračiti ovo ograničenje).

Moj model je trenutno objavljen u verziji 3.1 (GA) i planiram ga ponovno uvježbati pomoću verzije 4.0 (GA). Je li potrebno ponovno označiti sve svoje dokumente?

Osim ako u zbirku ne dodajete nova polja, potvrdne okvire, tablice, potpise za izdvajanje podataka ili nove dokumente, ne morate ponovno tagirati sve dokumente.

Prije objavljivanja modela, preporučuje se brzo testiranje modela pomoću jednog ili više uzoraka kako biste provjerili i osigurali da su sva željena polja pravilno izdvojena.

Mogu li se prebaciti s jedne vrste dokumenta na drugu?

Da, prilikom uređivanja modela možete se prebacivati između vrste dokumenta s fiksnim predloškom i općeg tipa dokumenta. Međutim, ovaj prekidač nije podržan za fakture.

Može li jedan model obrade obrazaca izdvojiti informacije iz dokumenata koji imaju različite izglede ili predloške?

Da. Pomoću značajke zbirke trenirate jedan model obrade obrazaca za rukovanje dokumentima koji imaju različite izglede.

Saznajte više u članku Grupiranje dokumenata prema zbirkama.

Može li obrada dokumenata obraditi više obrazaca u jednom dokumentu ?

Svaki obrazac mora biti u zasebnoj datoteci. Ako, primjerice, imate PDF dokument s više faktura, stvorite zasebnu datoteku za svaku fakturu prije nego što je pošaljete u model za obradu dokumenata.

Također možete odrediti stranice za model obrade dokumenata za rukovanje. Na taj način možete iskoristiti funkcionalnost modela za petljanje stranicu po stranicu i obradu jednog po jednog obrasca.

Saznajte više u odjeljku Raspon stranica.

Obučio sam model obrade dokumenata, ali ne postižem dobre rezultate kada su u pitanju izdvojeni podaci. Kako mogu poboljšati model?

Ako vaš model vraća loše rezultate nakon što ste ga trenirali, uredite model i navedite više uzoraka za obuku. Što više uzoraka pružite, to će model umjetne inteligencije više naučiti kako izdvojiti podatke iz vaših dokumenata.

Saznajte više u članku Poboljšanje performansi modela obrade dokumenata.

Ograničenja

Koji je maksimalan broj dokumenata koje mogu obraditi?

Možete obraditi do 360 dokumenata po okruženju svakih 60 sekundi.

Zašto se neki likovi pogrešno prepoznaju?

  • Može se dogoditi da se neki znakovi zbrkaju: 0 (broj) i O (slovo), 1 (broj) i l (slovo), 4 (broj) i A (slovo) i još mnogo toga.
  • Može se dogoditi da se neki znakovi iznad ili blizu drugih pogrešno prepoznaju: O (slovo) preko okomite crte postaje 0 (broj), 5 (broj) preko retka postaje $ (znak američkog dolara), l_ (malo slovo, podvlaka) postaje L (veliko slovo) i još mnogo toga.
  • Može se dogoditi da se neki znakovi na dokumentima loše kvalitete prepoznaju pogrešno ili se uopće ne prepoznaju.

U prethodnim slučajevima ništa se ne može učiniti kako AI Builder bi se poboljšalo prepoznavanje. Preporučujemo poboljšanje kvalitete i izgleda izvornog dokumenta kako bismo riješili slične probleme.

Napomena

Microsoft stalno poboljšava tehnologiju optičkog prepoznavanja znakova (OCR) za otkrivanje znakova, pa se takvi problemi događaju rjeđe.

Mogu li izraditi model s mnogo kolekcija?

Možete izraditi do 200 kolekcija po modelu. No obuka modela općih dokumenata s desecima zbirki može potrajati nekoliko sati i – u rijetkim prilikama – isteknuti vrijeme. Ako vaš model ima velik broj kolekcija, očekujte da ćete pričekati do 24 sata za završetak obuke modela.

Mogu li stvoriti model u rješenju?

Trenutačno nije moguće stvoriti model u rješenju.

Mogu li koristiti ugovore i pisma u svom modelu obrade dokumenata?

Da, nestrukturirani dokumenti poput ugovora i pisama podržani su obradom dokumenata pomoću opcije Opći dokumenti .

Usporedbe

Koje su razlike između obrade dokumenata, obrade računa, obrade računa, čitača osobnih dokumenata, čitača posjetnica i prepoznavanja teksta?

Ovisno o vašoj situaciji, možda ćete morati koristiti određeni model ili njihovu kombinaciju.

Prepoznavanje teksta koristite kada želite izdvojiti sav tekst prisutan na slici ili PDF-u. Zatim možete, na primjer, potražiti ključnu riječ u tekstu koji se izdvaja ili izgraditi neka fiksna pravila za izdvajanje određenih stavki.

Ako želite izvući podatke iz faktura, potvrda, putovnica, vozačkih dozvola ili posjetnica, počnite s odgovarajućim unaprijed izgrađenim modelom:

Ove unaprijed izrađene modele možete koristiti odmah, bez potrebe za stvaranjem novog modela. Ovi modeli mogu izdvojiti uobičajene informacije koje se nalaze u odgovarajućoj vrsti dokumenta.

Za bilo koju drugu vrstu dokumenta možete stvoriti prilagođeni model obrade dokumenata za izdvajanje polja i tablica koje su vam potrebne. To vrijedi i ako su vam potrebne dodatne informacije koje ne pruža unaprijed izrađeni model.

Saznajte više u članku Prilagođeni model obrade dokumenata.

Koja je razlika između AI Builder obrade dokumenata i Azure Form Recognizer?

AI Builder Obrada dokumenata temelji se na Azure Form Recognizeru. To oba proizvoda pruža najnovija dostignuća u Microsoftovoj umjetnoj inteligenciji.

  • AI Builder je dio Microsoft Power Platform. To svakome omogućuje dodavanje umjetne inteligencije u aplikacije i automatizaciju pomoću sučelja jednostavnog za korištenje. Ne morate biti programer ili podatkovni znanstvenik.

  • Azure Form Recognizer namijenjen je profesionalnim razvojnim inženjerima. Mogu koristiti jednostavne REST API-je za dodavanje mogućnosti umjetne inteligencije svojim prilagođenim rješenjima koda.

Opcije troškova

Koliko košta AI Builder obrada dokumenata?

Možete početi besplatno isprobavati obradu dokumenata pokretanjem probnog razdoblja. Nakon što ga procijenite, morate kupiti AI Builder kredite za korištenje obrade dokumenata. Svaka stranica koju obrađujete obradom dokumenta troši AI Builder zasluge, čak i ako stranica ne sadrži podatke za izdvajanje. AI Builder Krediti se mogu kupiti putem AI Builder dodataka.

Saznajte više o AI Builder licenciranju.