Dokumenditöötluse KKK
See artikkel koosneb korduma kippuvatest küsimustest dokumenditöötlusmudeli kohta AI Builder. Kui te ei leia siit oma küsimust, vaadake üle tehisintellekti mudeli töötlemise dokumendi ülevaade või esitage oma küsimus kogukonnale Power Automate AI Builder.
Dokumenditöötluse abil saate luua kohandatud tehisintellekti mudeli teabe eraldamiseks erinevat tüüpi dokumentidest.
- Suvand Fikseeritud malliga dokumendid on ideaalne, kui teie dokumentide elemendid on leitud sarnastest kohtadest. Tavaliselt on see nii arvete, ostutellimuste, tarnetellimuste ja maksuvormide puhul.
- Ülddokumentide valik sobib ideaalselt igasuguste dokumentide jaoks, sealhulgas nende jaoks, mida toetab esimene võimalus, aga ka lepingud, tööaruanded, kirjad ja muud. See suvand võib olla andmete ekstraktimiseks võimsam, kuid nõuab pikemat treeningaega.
Lisateave: Dokumenditöötlusmudeli ülevaade
Toetatud failitüübid on PDF, JPG ja PNG.
Dokumenditöötlusega saab dokumentidest eraldada välju, tabeleid ja märkeruute.
Lisateave: Ekstraktitava teabe määratlemine
Jah. Dokumenditöötlus võib eraldada teie dokumentidest prinditud ja käsitsi kirjutatud teksti.
Kvaliteetsete dokumentide puhul, mis kasutavad sama paigutust, peaks piisama viiest näidisdokumendist. Madala kvaliteediga dokumentide puhul (nt halva kvaliteediga skannimine) võib vaja minna rohkem näidisdokumente. Tulemuste parandamiseks kasutage 15–20 näidisdokumenti.
Jah. Kogude funktsiooni abil saate treenida ühte vormitöötlusmudelit, et käsitleda erineva paigutusega dokumente.
Lisateave: dokumentide rühmitamine kogude järgi
Iga vorm peab olema eraldi failis. Näiteks kui teil on PDF-dokument, milles on mitu arvet, looge iga arve jaoks eraldi fail, enne kui saadate selle dokumenditöötlusmudelisse.
Samuti saate määrata dokumenditöötlusmudeli käsitletavad leheküljed. Nii saate mudeli funktsioone ära kasutada, et aheldada lehekülgi lehtede kaupa ja töödelda ühte vormi korraga.
Lisateave: Leheküljevahemik
Koolitasin dokumenditöötlusmudelit, kuid ma ei saa väljavõtte andmete osas häid tulemusi. Kuidas ma saan mudelit parandada?
Kui teie mudel annab pärast treenimist halbu tulemusi, muutke mudelit ja andke treenimiseks rohkem näidiseid. Mida rohkem näidiseid esitate, seda rohkem õpib tehisintellekti mudel, kuidas dokumentidest andmeid ekstraktida.
Lisateave: Dokumenditöötlusmudeli jõudluse parandamine
Saate töödelda kuni 360 dokumenti keskkonna kohta iga 60 sekundi järel.
- Võib juhtuda, et mõned tähemärgid lähevad segadusse: 0 (number) ja O (täht), 1 (number) ja l (täht), 4 (number) ja A (täht) ja palju muud.
- Võib juhtuda, et mõned tähemärgid, mis ületavad teist tähemärki või on teiste tähemärkide lähedal, tuvastatakse valesti: vertikaaljoont ületav O (täht) muutub 0-ks (number), joont ületav 5 (number) muutub $-ks (Ameerika Ühendriikide dollari märk), l_ (väiketäht, alakriips) muutub L-ks (suurtäht) ja palju muud.
- Võib juhtuda, et mõned halva kvaliteediga dokumentide tähemärgid tuvastatakse valesti või üldse mitte.
Ülaltoodud juhtudel ei saa tunnustamise parandamiseks midagi teha AI Builder . Sarnaste probleemide lahendamiseks soovitame parandada alusdokumendi kvaliteeti ja kujundust.
Märkus
Microsoft täiustab pidevalt OCR-tehnoloogiat märkide tuvastamiseks, nii et selliseid probleeme juhtub harvemini.
Ühe mudeli kohta saate luua kuni 200 kollektsiooni. Kuid koolitus Ülddokumentide mudelid kümnete kogudega võivad võtta mitu tundi ja harvadel juhtudel ka aja maha. Kui teie modellil on palju kollektsioone, oodake mudelikoolituse läbimist kuni 24 tundi.
Praegu pole lahenduses võimalik mudelit luua.
Jah, struktureerimata dokumente, nagu lepingud ja kirjad, toetab dokumenditöötlus, kasutades suvandit Ülddokumendid .
Mis on dokumenditöötlusel, arvete töötlemisel, kviitungite töötlemisel, isikut tõendava dokumendi lugejal, visiitkaardilugejal ja tekstituvastusel?
Sõltuvalt teie olukorrast peate võib-olla kasutama konkreetset mudelit või nende kombinatsiooni.
Kasutage tekstituvastust , kui soovite ekstraktida kogu pildil või PDF-is oleva teksti. Seejärel saate näiteks ekstraktitud tekstist märksõna otsida või luua teatud üksuste ekstraktimiseks mõned kindlad reeglid.
Kui soovite saada teavet arvetest, kviitungitest, passidest, juhilubadest või visiitkaartidest, alustage vastavast valmismudelist:
- Arvete töötlemine
- Kviitungite töötlemine
- Isikut tõendava dokumendi lugeja (passid ja juhiload)
- Visiitkaardi lugeja
Neid valmismudeleid saate kasutada kohe, ilma et peaksite uut mudelit looma. Nende mudelitega saab ekstraktida vastavas dokumenditüübis leiduvat üldist teavet.
Mis tahes muu dokumenditüübi puhul saate luua kohandatud dokumenditöötlusmudeli vajalike väljade ja tabelite ekstraktimiseks. See kehtib ka siis, kui vajate lisateavet, mida eelvalmistatud mudel ei paku.
Lisateave: Kohandatud dokumenditöötlusmudel
AI Builder dokumenditöötlus on üles ehitatud Azure’i vormituvastaja peale. See pakub mõlemale tootele Microsofti tehisintellekti uusimaid edusamme.
AI Builder on osa Microsoft Power Platform. See võimaldab kõigil lisada tehisintellekti rakendustesse ja automatiseerimisse hõlpsasti kasutatava liidese abil. Te ei pea olema arendaja ega andmeteadlane.
Azure’i vormituvastus on suunatud professionaalsetele arendajatele. Nad saavad kasutada lihtsaid REST API-sid, et lisada tehisintellekti võimalusi oma kohandatud koodilahendustele.
Saate alustada dokumenditöötluse tasuta proovimist, alustades prooviversiooni . Pärast selle hindamist peate dokumenditöötluse kasutamiseks ostma AI Builder krediiti. Iga lehekülg, mida dokumenditöötluses töötlete, kulutab AI Builder krediiti, isegi kui leht ei sisalda ekstraktitavaid andmeid. AI Builder Krediiti saab osta lisandmoodulite kaudu AI Builder .
Lisateave: AI Builder litsentsimine