Asiakirjan käsittelyn usein kysytyt kysymykset
Tässä artikkelissa on usein kysyttyjä kysymyksiä AI Builderin asiakirjan käsittelymallista. Jos kysymystä ei ole täällä, tutustu asiakirjan käsittelyn tekoälymallin yleiskatsaukseen tai lähetä kysymys Power Automaten AI Builder -yhteisöön.
Asiakirjan käsittelyn avulla voidaan luoda mukautettu tekoälymalli, joka poimii tietoja erilaisista asiakirjoista.
- Kiinteän mallin asiakirjat -vaihtoehto on ihanteellinen, jos asiakirjojesi elementit ovat löydettävissä samankaltaisista paikoista. Tämä pätee yleensä laskuihin, ostotilauksiin, toimitustilauksiin ja verolomakkeisiin.
- Yleiset asiakirjat -vaihtoehto sopii ihanteellisesti mille tahansa asiakirjalle, mukaan luettuna ensimmäisen vaihtoehdon tukemat asiakirjat, mutta myös sopimukset, työkuvaukset, kirjeet jne. Tämä vaihtoehto voi olla tehokkaampi tietojen poiminnassa, mutta se vaatii enemmän aikaa koulutukseen.
Lisätietoja: Asiakirjan käsittelymallin yleiskatsaus
Tuetut tiedostomuodot ovat PDF, JPG ja PNG.
Asiakirjan käsittely voi poimia kenttiä, taulukoita ja valintaruutuja asiakirjoista.
Lisätietoja: Määritä poimittavat tiedot
Kyllä. Asiakirjan käsittely voi poimia asiakirjoista painettua ja käsinkirjoitettua tekstiä.
Laadukkaat asiakirjat, joissa käytetään samaa asettelua, riittää viisi näyteasiakirjaa. Jos asiakirjat ovat huonolaatuisia (esimerkiksi huonosti skannatut asiakirjat), näyteasiakirjoja voi olla tarpeen käyttää enemmän. Voit parantaa tuloksia käyttämällä 15–20 näyteasiakirjaa.
Kyllä. Käyttämällä kokoelmatoimintoa voit harjoittaa yhden lomakkeen käsittelymallia eri asetteluja käyttäville asiakirjoille.
Lisätietoja: Ryhmittele asiakirjat kokoelmien mukaan
Jokaisen lomakkeen on oltava erillisessä tiedostossa. Esimerkiksi PDF-asiakirjasta, jossa on useita laskuja, voidaan luoda erillinen tiedosto kullekin laskulle ennen kuin lähetät sen asiakirjan käsittelymallille.
Voit myös määrittää sivuja käsiteltävälle asiakirjan käsittelymallille. Näin voit hyödyntää mallin toimintoja ja käydä läpi sivu kerrallaan ja käsitellä yhden lomakkeen kerrallaan.
Lisätietoja: Sivualue
Olen harjoittanut asiakirjan käsittelymallia, mutta en ole saanut hyviä tuloksia tietojen poimimisesta. Miten voin parantaa mallia?
Jos mallin palauttaa heikkoja tuloksia koulutuksen jälkeen, muokkaa mallia ja anna koulutusta varten lisää näytteitä. Mitä enemmän näytettä annat, sitä enemmän tekoälymalli oppii poimimaan tietoja asiakirjoista.
Lisätietoja: Asiakirjan käsittelymallin suorituskyvyn parantaminen
Voit käsitellä ympäristöä kohden enintään 360 asiakirjaa 60 sekunnin välein.
- Saattaa käydä niin, että jotkut merkit menevät sekaisin: 0 (numero) ja O (kirjain), 1 (numero) ja l (kirjain), 4 (numero) ja A (kirjain) jne.
- Saattaa käydä niin, että jotkin toisten päällä tai lähellä olevat merkit tunnistetaan väärin: O (kirjain) pystyviivan päällä muuttuu 0:ksi (numero), 5 (numero) rivin päällä muuttuu $:ksi (Amerikan dollarin merkki), l_ (pieni kirjain, alaviiva) muuttuu L-kirjaimeksi (iso kirjain) ja paljon muuta.
- Saattaa käydä niin, että jotkin huonolaatuisten asiakirjojen merkit tunnistetaan väärin tai ei tunnisteta ollenkaan.
Yllä mainituissa tapauksissa AI Builderissa ei voida tehdä mitään tunnistuksen parantamiseksi. Suosittelemme parantamaan lähdeasiakirjan laatua ja ulkoasua vastaavien ongelmien ratkaisemiseksi.
Huomautus
Microsoft parantaa jatkuvasti OCR-tekniikkaa merkkien havaitsemisessa, joten tällaisia ongelmia esiintyy harvemmin.
Mallikohtaisesti voi luoda enintään 200 kokoelmaa. Sellaisten Yleiset asiakirjat -mallien opettaminen, joilla on kymmeniä kokoelmia, voi kuitenkin kestää useita tunteja, ja joissakin harvinaisissa tapauksissa ne voidaan jopa aikakatkaista. Jos mallissa on suuri määrä kokoelmia, mallin opetuksen valmistumisessa saattaa kestää jopa 24 tuntia.
Tällä hetkellä mallin luominen ratkaisussa ei ole mahdollista.
Kyllä. Asiakirjan käsittely Yleiset asiakirjat -vaihtoehtoa käyttäen tukee rakenteettomia asiakirjoja, kuten sopimuksia ja kirjeitä.
Mitkä ovat asiakirjan käsittelyn, laskun käsittelyn, vastaanoton käsittelyn, henkilöllisyysasiakirjojen lukijan, käyntikortinlukijan ja tekstintunnistuksen erot?
Tilanteesta riippuen sinun täytyy ehkä käyttää tiettyä mallia tai niiden yhdistelmää.
Käytä tekstintunnistusta, kun haluat purkaa kaikki tekstit kuvasta tai PDF-tiedostosta. Tämän jälkeen voit esimerkiksi hakea avainsanaa purettavasta tekstistä tai muodostaa joitakin kiinteitä sääntöjä tiettyjen kohteiden purkamista varten.
Jos haluat poimia tietoja laskuista, kuiteista, passeista, ajokorteista tai käyntikorteista, aloita vastaavasta esimääritetystä mallista:
- Laskujen käsittely
- Kuittien käsittely
- Henkilökorttien lukija (passit ja ajokortit)
- Käyntikortinlukija
Voit käyttää näitä esimääritettyjä malleja heti luomatta uutta mallia. Nämä mallit voivat poimia yleisiä tietoja, jotka löytyvät niitä vastaavasta asiakirjatyypistä.
Mille tahansa asiakirjatyypille voidaan luoda asiakirjan mukautettu käsittelymalli, joka poimii halutut kentät ja taulukot. Näin on myös silloin, jos tarvitset lisätietoja, jotka eivät ole esimääritetyssä mallissa.
Lisätietoja: Asiakirjan mukautettu käsittelymalli
AI Builderin asiakirjan käsittely perustuu Azuren lomakkeen tunnistustoimintoon. Tällä tavoin Microsoftin tekoälyn uusimmat edistysaskeleet ovat kummankin tuotteen käytettävissä.
AI Builder sisältyy Microsoft Power Platformiin. Niinpä kaikki käyttäjät voivat lisätä tekoälyä sovelluksiin ja automatisointiin helppokäyttöisen käyttöliittymän avulla. Sinun ei tarvitse olla ohjelmistokehittäjä tai datatieteilijä.
Azure Form Recognizer on tarkoitettu ammattilaiskehittäjille. He voivat lisätä mukautettuihin koodiratkaisuihin tekoälyominaisuuksia yksinkertaisten REST API -ohjelmointirajapintojen avulla.
Asiakirjan käsittelyn kokeilun voi aloittaa maksutta kokeiluversion avulla. Kokeiluversion arvioinnin jälkeen asiakirjan käsittelyä varten on ostettava AI Builder -saldoa. Jokainen tiedostojen käsittelyn sivu kuluttaa AI Builder -hyvitystä, vaikka sivussa ei olisi purettavia tietoja. AI Builder -saldoa voi ostaa AI Builder -lisäosina.
Lisätietoja: AI Builder -käyttöoikeudet