Märkus.
Juurdepääs sellele lehele nõuab autoriseerimist. Võite proovida sisse logida või kausta vahetada.
Juurdepääs sellele lehele nõuab autoriseerimist. Võite proovida kausta vahetada.
See artikkel sisaldab korduma kippuvaid küsimusi dokumenditöötlusmudeli kohta AI Builder. Kui te ei leia siit oma küsimust, vaadake üle dokumenditöötluse tehisintellekti mudeli ülevaade või esitage oma küsimus kogukonnale Power Automate AI Builder.
Funktsionaalsus
Mida ma saan teha dokumentide töötlemisega?
Dokumenditöötluse abil saate luua kohandatud tehisintellekti mudeli, et eraldada teavet erinevat tüüpi dokumentidest.
- Suvand Fikseeritud malliga dokumendid on ideaalne, kui teie dokumentide elemendid asuvad sarnastes kohtades. Tavaliselt on see nii arvete, ostutellimuste, tarnetellimuste ja maksuvormide puhul.
- Ülddokumentide valik sobib ideaalselt igat tüüpi dokumentide jaoks, sealhulgas nende, mida toetab esimene võimalus, aga ka lepingud, tööaruanded, kirjad ja muud. See suvand võib olla andmete ekstraktimiseks võimsam, kuid nõuab pikemat koolitusaega.
Lisateavet leiate teemast Dokumenditöötlusmudeli ülevaade.
Mis tüüpi dokumente saab dokumenditöötlusega tegeleda?
Toetatud failitüübid on PDF, JPG ja PNG.
Milliseid andmeid saab dokumenditöötluse abil dokumentidest ekstraktida?
Dokumenditöötlus võib dokumentidest välju, tabeleid ja märkeruute ekstraktida.
Lisateavet leiate teemast Ekstraktitava teabe määratlemine.
Kas ma saan dokumentidest käsitsi kirjutatud teksti eraldada?
Jah. Dokumenditöötlus võib teie dokumentidest prinditud ja käsitsi kirjutatud teksti eraldada.
Mitu näidist on vaja dokumenditöötlusmudeli treenimiseks?
Sama kujundust kasutavate kvaliteetsete dokumentide puhul peaks piisama viiest näidisdokumendist. Madala kvaliteediga dokumentide (nt halva kvaliteediga skaneeringud) puhul võib vaja minna rohkem näidisdokumente. Tulemuste parandamiseks kasutage 15–20 näidisdokumenti.
Head tavad
Mallidokumentide puhul
- Üks (1) paigutus kollektsiooni kohta.
- Paigutus peab olema sama kollektsiooni piires identne.
- Minimaalselt viis (5) ja maksimaalselt 20 dokumenti kollektsiooni kohta (ärge ületage seda limiiti).
Üldiste dokumentide puhul
Looge üks mudel dokumenditüübi kõigi variatsioonide jaoks, sealhulgas nii struktureeritud kui ka struktureerimata dokumentide jaoks.
Märgistage nende väärtustele vastavad väljad parema ekstraheerimise täpsuse tagamiseks.
Näiteks kasutage hankija ID jaoks "supplier_id". Väljanimed peavad vastama dokumendi keelele.
Minimaalselt viis (5) ja maksimaalselt 20 dokumenti kollektsiooni kohta (ärge ületage seda limiiti).
Minu mudel on praegu avaldatud versioonis 3.1 (GA) ja plaanin selle versiooni 4.0 (GA) abil ümber õpetada. Kas kõik dokumendid on vaja uuesti sildistada?
Kui te ei lisa kogumikku uusi välju, märkeruute, tabeleid, allkirju andmete ekstraktimiseks või uusi dokumente, ei pea te kõiki dokumente uuesti sildistama.
Enne mudeli avaldamist on soovitatav oma mudelit kiiresti testida , kasutades ühte või mitut näidist, et kontrollida ja veenduda, et kõik soovitud väljad on õigesti ekstraktitud.
Kas ma saan ühelt dokumenditüübilt teisele üle minna?
Jah, mudeli redigeerimisel saate vahetada fikseeritud malli dokumenditüübi ja üldise dokumenditüübi vahel. Seda lülitit aga arvete puhul ei toetata.
Kas üks vormitöötlusmudel saab eraldada teavet erineva paigutuse või malliga dokumentidest?
Jah. Kollektsioonide funktsiooni abil saate treenida ühte vormitöötlusmudelit erineva paigutusega dokumentide käsitlemiseks.
Lisateavet leiate teemast Dokumentide rühmitamine kogumite kaupa.
Kas dokumenditöötlus saab käsitleda mitut vormi ühes dokumendis ?
Iga vorm peab olema eraldi failis. Näiteks kui teil on PDF-dokument, milles on mitu arvet, looge iga arve jaoks eraldi fail, enne kui saadate selle dokumenditöötlusmudelisse.
Samuti saate määrata leheküljed, mida dokumenditöötlusmudel käsitleks. Nii saate kasutada mudeli funktsioone, et liikuda lehekülgede kaupa ja töödelda ühte vormi korraga.
Lisateavet leiate teemast Leheküljevahemik.
Treenisin dokumenditöötlusmudelit, kuid ma ei saa ekstraheeritud andmete osas häid tulemusi. Kuidas ma saan mudelit täiustada?
Kui teie mudel tagastab pärast koolitamist halbu tulemusi, redigeerige mudelit ja esitage treenimiseks rohkem näidiseid. Mida rohkem näidiseid esitate, seda rohkem õpib tehisintellekti mudel teie dokumentidest andmeid ekstraheerima.
Lisateavet leiate teemast Dokumenditöötlusmudeli jõudluse parandamine.
Piirangud
Kui palju dokumente saan töödelda?
Saate töödelda kuni 360 dokumenti keskkonna kohta iga 60 sekundi järel.
Miks mõned tegelased valesti ära tunnetakse?
- Võib juhtuda, et mõned tähemärgid lähevad segadusse: 0 (arv) ja O (täht), 1 (arv) ja l (täht), 4 (arv) ja A (täht) ja palju muud.
- Võib juhtuda, et mõned tähemärgid, mis ületavad teist tähemärki või on teiste tähemärkide lähedal, tuvastatakse valesti: vertikaaljoont ületav O (täht) muutub 0-ks (number), joont ületav 5 (number) muutub $-ks (Ameerika Ühendriikide dollari märk), l_ (väiketäht, alakriips) muutub L-ks (suurtäht) ja palju muud.
- Võib juhtuda, et mõned halva kvaliteediga dokumentide tähemärgid tuvastatakse valesti või üldse mitte.
Eelmistel juhtudel ei saa äratundmise parandamiseks midagi teha AI Builder . Sarnaste probleemide lahendamiseks soovitame parandada lähtedokumendi kvaliteeti ja paigutust.
Märkus.
Microsoft täiustab pidevalt optilise märgituvastuse (OCR) tehnoloogiat märkide tuvastamiseks, nii et selliseid probleeme juhtub harvemini.
Kas ma saan luua mudeli, millel on palju kollektsioone?
Mudeli kohta saate luua kuni 200 kollektsiooni. Kümnete kollektsioonidega ülddokumentide mudelite koolitamine võib aga võtta mitu tundi ja harvadel juhtudel ka aja maha võtta. Kui teie mudelil on palju kollektsioone, oodake mudeli koolituse lõpuleviimist kuni 24 tundi.
Kas ma saan lahenduses mudeli luua?
Praegu ei ole võimalik lahenduses mudelit luua.
Kas ma saan oma dokumenditöötlusmudelis kasutada lepinguid ja kirju?
Jah, struktureerimata dokumente, nagu lepingud ja kirjad, toetab dokumenditöötlus, kasutades suvandit Ülddokumendid .
Võrdlusi
Millised on erinevused dokumenditöötluse, arvete töötlemise, kviitungite töötlemise, isikut tõendava dokumendi lugeja, visiitkaardilugeja ja tekstituvastuse vahel?
Sõltuvalt teie olukorrast peate võib-olla kasutama konkreetset mudelit või nende kombinatsiooni.
Kasutage tekstituvastust , kui soovite ekstraktida kogu pildil või PDF-failis oleva teksti. Seejärel saate näiteks otsida ekstraheeritavast tekstist märksõna või luua teatud üksuste ekstraktimiseks mõned fikseeritud reeglid.
Kui soovite arvetelt, kviitungitelt, passidest, juhilubadelt või visiitkaartidelt teavet eraldada, alustage vastavast valmismudelist.
- Arvete töötlemine
- Kviitungi töötlemine
- Isikut tõendava dokumendi lugeja (passid ja juhiload)
- Visiitkaardi lugeja
Saate neid valmismudeleid kasutada kohe, ilma et peaksite uut mudelit looma. Need mudelid saavad eraldada vastavast dokumenditüübist leitud ühist teavet.
Mis tahes muu dokumenditüübi jaoks saate luua kohandatud dokumenditöötlusmudeli, et ekstraktida vajalikud väljad ja tabelid. See kehtib ka siis, kui vajate lisateavet, mida eelehitatud mudel ei paku.
Lisateavet leiate teemast Kohandatud dokumenditöötlusmudel.
Mis AI Builder on dokumenditöötlusel ja Azure’i vormituvastusel?
AI Builder Dokumenditöötlus on üles ehitatud Azure’i vormituvastusele. See pakub mõlemale tootele Microsofti tehisintellekti uusimaid edusamme.
AI Builder on osa Microsoft Power Platform. See võimaldab igaühel hõlpsasti kasutatava liidese abil rakendustesse ja automatiseerimisse tehisintellekti lisada. Te ei pea olema arendaja ega andmeteadlane.
Azure’i vormituvastus on suunatud professionaalsetele arendajatele. Nad saavad kasutada lihtsaid REST API-sid, et lisada oma kohandatud koodilahendustele tehisintellekti võimalusi.
Kuluvalikud
Kui palju maksab AI Builder dokumentide töötlemine?
Võite alustada dokumentide töötlemist tasuta, alustades prooviversiooni. Pärast selle hindamist peate dokumenditöötluse kasutamiseks ostma AI Builder krediiti. Iga dokumenditöötlusega töödeldav leht kulutab AI Builder krediiti, isegi kui leht ei sisalda ekstraktitavaid andmeid. AI Builder Krediiti saab osta lisandmoodulite kaudu AI Builder .
Vaadake lisateavet litsentsimise AI Builder kohta.