Kopīgot, izmantojot


Bieži uzdotie jautājumi par dokumentu apstrādi

Šis raksts sastāv no bieži uzdotajiem jautājumiem par dokumentu apstrādes modeli AI Builder. Ja šeit neatrodat savu jautājumu, pārskatiet dokumentu apstrādes AI modeļa pārskatu vai iesniedziet jautājumu Power Automate kopienai AI Builder.

Funkcionalitāte

Ko es varu darīt ar dokumentu apstrādi?

Izmantojot dokumentu apstrādi, varat izveidot pielāgotu AI modeli, lai iegūtu informāciju no dažāda veida dokumentiem.

  • Opcija Fiksētas veidnes dokumenti ir ideāla, ja jūsu dokumentu elementus var atrast līdzīgās vietās. Parasti tas attiecas uz rēķiniem, pirkšanas pasūtījumiem, piegādes pasūtījumiem un nodokļu veidlapām.
  • Vispārīgo dokumentu opcija ir ideāli piemērota jebkura veida dokumentiem, ieskaitot tos, kurus atbalsta pirmā iespēja, bet arī līgumi, darba paziņojums, vēstules un citi. Šī opcija var būt jaudīgāka, lai iegūtu datus, bet prasa ilgāku apmācības laiku.

Papildinformāciju uzziniet sadaļā Dokumentu apstrādes modeļa pārskats.

Kāda veida dokumentus var apstrādāt dokumentu apstrādi?

Atbalstītie failu tipi ir PDF, JPG un PNG.

Kādus datus es varu iegūt no dokumentiem, izmantojot dokumentu apstrādi?

Dokumentu apstrāde var izvilkt laukus, tabulas un izvēles rūtiņas no dokumentiem.

Papildinformāciju uzziniet sadaļā Iegūstamās informācijas definēšana.

Vai es varu iegūt ar roku rakstītu tekstu no dokumentiem?

Jā. Dokumentu apstrāde var iegūt drukātu un ar roku rakstītu tekstu no jūsu dokumentiem.

Cik paraugu ir nepieciešams, lai apmācītu dokumentu apstrādes modeli?

Augstas kvalitātes dokumentiem, kuros tiek izmantots viens un tas pats izkārtojums, pietiek ar pieciem dokumentu paraugiem. Zemas kvalitātes dokumentiem (piemēram, sliktas kvalitātes skenēšanai) var būt nepieciešams vairāk dokumentu paraugu. Lai uzlabotu rezultātus, izmantojiet 15 līdz 20 dokumentu paraugus.

Paraugprakse

  • Dokumentu veidnēm

    • Viens (1) izkārtojums katrā kolekcijā.
    • Izkārtojumam jābūt identiskam vienā kolekcijā.
    • Vismaz pieci (5) un ne vairāk kā 20 dokumenti vienā kolekcijā (nepārsniedziet šo ierobežojumu).
  • Vispārīgiem dokumentiem

    • Izveidojiet vienotu modeli visiem dokumenta tipa variantiem, ieskaitot gan strukturētos, gan nestrukturētos dokumentus.

    • Marķējiet laukus, kas attiecas uz to vērtībām, lai nodrošinātu labāku ekstrakcijas precizitāti.

      Piemēram, piegādātāja ID izmantojiet "supplier_id". Lauku nosaukumiem jāatbilst dokumenta valodai.

    • Vismaz pieci (5) un ne vairāk kā 20 dokumenti vienā kolekcijā (nepārsniedziet šo ierobežojumu).

Mans modelis pašlaik ir publicēts v3.1 (GA), un es plānoju to pārkvalificēt, izmantojot v4.0 (GA). Vai ir nepieciešams atkārtoti atzīmēt visus dokumentus?

Ja kolekcijai nepievienojat jaunus laukus, izvēles rūtiņas, tabulas, parakstus datu iegūšanai vai jaunus dokumentus, jums nav atkārtoti jāatzīmē visi dokumenti.

Pirms modeļa publicēšanas ieteicams ātri pārbaudīt modeli , izmantojot vienu vai vairākus paraugus, lai pārbaudītu un pārliecinātos, ka visi vēlamie lauki ir pareizi izvilkti.

Vai varu pārslēgties no viena dokumenta tipa uz citu?

Jā, rediģējot modeli, varat pārslēgties starp fiksētas veidnes dokumenta tipu uz vispārējo dokumenta tipu. Tomēr šis slēdzis netiek atbalstīts rēķiniem.

Vai viens veidlapu apstrādes modelis var iegūt informāciju no dokumentiem, kuriem ir atšķirīgi izkārtojumi vai veidnes?

Jā. Izmantojot kolekciju līdzekli, jūs apmācāt vienu veidlapu apstrādes modeli, lai apstrādātu dokumentus ar atšķirīgiem izkārtojumiem.

Papildinformāciju sadaļā Dokumentu grupēšana pēc kolekcijām.

Vai dokumentu apstrāde var apstrādāt vairākas veidlapas vienā dokumentā?

Katrai veidlapai jābūt atsevišķā failā. Piemēram, ja jums ir PDF dokuments ar vairākiem rēķiniem, izveidojiet atsevišķu failu katram rēķinam, pirms nosūtāt to dokumentu apstrādes modelim.

Varat arī norādīt lappuses, kas jāapstrādā dokumentu apstrādes modelim. Tādā veidā jūs varat izmantot modeļa funkcionalitāti, lai cilpinātu lappusi pēc lappuses un apstrādātu pa vienai veidlapai.

Uzziniet vairāk sadaļā Lappušu diapazons.

Es apmācīju dokumentu apstrādes modeli, bet es nesaņemu labus rezultātus, kad runa ir par iegūtajiem datiem. Kā es varu uzlabot modeli?

Ja modelis pēc apmācības atgriež sliktus rezultātus, rediģējiet modeli un sniedziet vairāk paraugu apmācībai. Jo vairāk paraugu sniedzat, jo vairāk AI modelis iemācās, kā iegūt datus no dokumentiem.

Papildinformāciju uzziniet sadaļā Dokumentu apstrādes modeļa veiktspējas uzlabošana.

Ierobežojumi

Kāds ir maksimālais dokumentu skaits, ko varu apstrādāt?

Katrā vidē ik pēc 60 sekundēm varat apstrādāt līdz 360 dokumentiem.

Kāpēc dažas rakstzīmes tiek atpazītas nepareizi?

  • Var gadīties, ka dažas rakstzīmes tiek sajauktas: 0 (skaitlis) un O (burts), 1 (skaitlis) un l (burts), 4 (skaitlis) un A (burts) un vairāk.
  • Var gadīties, ka dažas rakstzīmes virs vai tuvu citām tiek atpazītas nepareizi: O (burts) virs vertikālās līnijas kļūst par 0 (skaitlis), 5 (skaitlis) virs līnijas kļūst par $ (amerikāņu dolāra zīme), l_ (mazais burts, pasvītrojums) kļūst par L (lielais burts) un daudz ko citu.
  • Var gadīties, ka dažas rakstzīmes sliktas kvalitātes dokumentos tiek atpazītas nepareizi vai vispār.

Iepriekšējos gadījumos neko nevar darīt AI Builder , lai uzlabotu atpazīstamību. Mēs iesakām uzlabot avota dokumenta kvalitāti un izkārtojumu, lai atrisinātu līdzīgus jautājumus.

Piezīmes

Microsoft pastāvīgi uzlabo optiskās rakstzīmju atpazīšanas (OCR) tehnoloģiju, lai noteiktu rakstzīmes, tāpēc šādas problēmas rodas retāk.

Vai es varu izveidot modeli ar daudzām kolekcijām?

Katram modelim var izveidot līdz 200 kolekcijām. Tomēr vispārējo dokumentu modeļu apmācība ar desmitiem kolekciju var aizņemt vairākas stundas un retos gadījumos taimauts. Ja jūsu modelim ir liels kolekciju skaits, gaidiet līdz 24 stundām, līdz tiks pabeigta modeļa apmācība.

Vai es varu izveidot modeli risinājumā?

Pašlaik nav iespējams izveidot modeli risinājumā.

Vai es varu izmantot līgumus un vēstules savā dokumentu apstrādes modelī?

Jā, nestrukturētus dokumentus, piemēram, līgumus un vēstules, atbalsta dokumentu apstrāde, izmantojot opciju Vispārīgie dokumenti .

Salīdzinājumus

Kādas ir atšķirības starp dokumentu apstrādi, rēķinu apstrādi, kvīšu apstrādi, personu apliecinošu dokumentu lasītāju, vizītkaršu lasītāju un teksta atpazīšanu?

Atkarībā no jūsu situācijas, iespējams, jums būs jāizmanto konkrēts modelis vai to kombinācija.

Izmantojiet teksta atpazīšanu , ja vēlaties izvilkt visu attēlā vai PDF failā esošo tekstu. Pēc tam, piemēram, varat meklēt atslēgvārdu izvilktajā tekstā vai izveidot dažas fiksētas kārtulas, lai iegūtu noteiktus vienumus.

Ja vēlaties iegūt informāciju no rēķiniem, kvītīm, pasēm, autovadītāja apliecībām vai vizītkartēm, sāciet ar atbilstošo iepriekš izveidoto modeli:

Šos iepriekš izveidotos modeļus var izmantot nekavējoties, neizveidojot jaunu modeli. Šie modeļi var iegūt kopīgu informāciju, kas atrodama attiecīgajā dokumenta tipā.

Jebkuram citam dokumenta tipam varat izveidot pielāgotu dokumentu apstrādes modeli, lai iegūtu nepieciešamos laukus un tabulas. Tas attiecas arī uz gadījumiem, ja jums ir nepieciešama papildu informācija, ko nesniedz iepriekš izveidotais modelis.

Papildinformāciju uzziniet sadaļā Pielāgots dokumentu apstrādes modelis.

Kāda ir atšķirība starp AI Builder dokumentu apstrādi un Azure veidlapu atpazīšanu?

AI Builder dokumentu apstrāde ir veidota, pamatojoties uz Azure veidlapu atpazīšanu. Tas nodrošina abiem produktiem jaunākos Microsoft AI sasniegumus.

  • AI Builder ir daļa. Microsoft Power Platform Tas ļauj ikvienam pievienot AI lietotnēm un automatizācijai, izmantojot viegli lietojamu saskarni. Jums nav jābūt izstrādātājam vai datu zinātniekam.

  • Azure veidlapu atpazīšana ir paredzēta profesionāliem izstrādātājiem. Viņi var izmantot vienkāršas REST API, lai pievienotu AI iespējas saviem pielāgotajiem koda risinājumiem.

Izmaksu iespējas

Cik maksā dokumentu AI Builder apstrāde?

Jūs varat sākt izmēģināt dokumentu apstrādi bez maksas, sākot izmēģinājumversiju. Pēc tam, kad esat to izvērtējis, jums ir jāiegādājas AI Builder kredīti, lai izmantotu dokumentu apstrādi. Katra lapa, ko apstrādājat, izmantojot dokumentu apstrādi, patērē AI Builder kredītus, pat ja lapā nav iegūtu datu. AI Builder Kredītus var iegādāties, izmantojot AI Builder papildinājumus.

Uzziniet vairāk licencēšanas AI Builder sadaļā.