Veelgestelde vragen over documentverwerking
Dit artikel bestaat uit veelgestelde vragen over het model voor documentverwerking in AI Builder. Als u uw vraag hier niet kunt vinden, bekijk dan het overzicht van het AI-model voor documentverwerking of stel uw vraag aan de Power Automate-community voor AI Builder.
Met documentverwerking kunt u een aangepast AI-model bouwen om informatie uit verschillende soorten documenten te extraheren.
- De optie Vaste sjabloondocumenten is ideaal als de elementen van uw documenten op vergelijkbare plekken kunnen worden gevonden. Dit is meestal het geval voor facturen, inkooporders, leveringsbonnen en belastingformulieren.
- De optie Algemene documenten is ideaal voor elk soort document, inclusief de documenten die door de eerste optie worden ondersteund, maar ook contracten, werkomschrijvingen, brieven en andere. Deze optie kan krachtiger zijn om gegevens te extraheren, maar vereist een langere trainingstijd.
Meer informatie: Overzicht van het model voor documentverwerking
Ondersteunde bestandstypen zijn PDF, JPG en PNG.
Documentverwerking kan velden, tabellen en selectievakjes uit documenten extraheren.
Meer informatie: Te extraheren informatie opgeven
Ja. Met documentverwerking kan gedrukte en handgeschreven tekst uit uw documenten worden geëxtraheerd.
Voor documenten van hoge kwaliteit die dezelfde indeling hebben, zouden vijf voorbeelddocumenten voldoende moeten zijn. Voor documenten van lage kwaliteit (bijvoorbeeld scans van lage kwaliteit) zijn mogelijk meer voorbeelddocumenten nodig. Gebruik 15 tot 20 voorbeelddocumenten om de resultaten te verbeteren.
Kan één formulierverwerkingsmodel informatie extraheren uit documenten met verschillende indelingen of sjablonen?
Ja. Door de verzamelingsfunctie te gebruiken, traint u één formulierverwerkingsmodel om documenten met verschillende indelingen te verwerken.
Meer documenten: Documenten groeperen op verzamelingen
Elk formulier moet in een apart bestand zitten. Als u bijvoorbeeld een PDF-document met meerdere facturen hebt, maakt u voor elke factuur een apart bestand voordat u deze naar het documentverwerkingsmodel verstuurt.
U kunt ook pagina's specificeren die door het documentverwerkingsmodel moeten worden verwerkt. Op deze manier kunt u profiteren van de functionaliteit van het model om pagina voor pagina te herhalen en formulier voor formulier te verwerken.
Meer informatie: Paginabereik
Ik heb een documentverwerkingsmodel getraind, maar ik krijg geen goede resultaten als het gaat om geëxtraheerde gegevens. Hoe kan ik het model verbeteren?
Als uw model na het trainen slechte resultaten oplevert, bewerkt u het model en geeft u meer voorbeelden voor training. Hoe meer voorbeelden u aanlevert, hoe meer het AI-model leert hoe gegevens uit uw documenten kunnen worden geëxtraheerd.
Meer informatie: De prestaties van uw documentverwerkingsmodel verbeteren
U kunt tot 360 documenten per omgeving verwerken, elke 60 seconden.
- Het kan voorkomen dat sommige tekens in de war raken: 0 (cijfer) en O (letter), 1 (cijfer) en l (letter), 4 (cijfer) en A (letter), en meer.
- Het kan voorkomen dat sommige tekens boven of dichtbij andere tekens verkeerd worden herkend: O (letter) over een verticale lijn wordt een 0 (cijfer), 5 (cijfer) over een lijn wordt een $ (Amerikaans dollarteken), l_ (kleine letter, onderstrepingsteken) wordt een L (hoofdletter) en meer.
- Het kan gebeuren dat sommige tekens op documenten van slechte kwaliteit verkeerd of helemaal niet worden herkend.
In de bovenstaande gevallen kan niets worden gedaan in AI Builder om de herkenning te verbeteren. We raden aan om de kwaliteit en lay-out van het brondocument te verbeteren om soortgelijke problemen op te lossen.
Notitie
De OCR-technologie om tekens te detecteren wordt voortdurend verbeterd door Microsoft, zodat dergelijke problemen minder vaak voorkomen.
U kunt maximaal 200 collecties per model maken. Het trainen van Algemene documentenmodellen met tientallen verzamelingen kan echter enkele uren duren en, in zeldzame gevallen, een time-out veroorzaken. Als uw model een groot aantal collecties heeft, kunt u rekenen op een wachttijd van maximaal 24 uur voordat de modeltraining is voltooid.
Momenteel is het niet mogelijk om een model in een oplossing te maken.
Ja, ongestructureerde documenten zoals contracten en brieven worden ondersteund door documentverwerking, met gebruik van de optie Algemene documenten.
Wat zijn de verschillen tussen documentverwerking, factuurverwerking, verwerking van betalingsbewijzen, identiteitsbewijzenlezer, visitekaartjeslezer en tekstherkenning?
Afhankelijk van uw situatie, moet u mogelijk een bepaald model of een combinatie hiervan gebruiken.
Gebruik tekstherkenning wanneer u alle tekst in een afbeelding of een PDF-bestand wilt extraheren. U kunt dan bijvoorbeeld zoeken naar een trefwoord in de geëxtraheerde tekst of een aantal vaste regels maken om bepaalde items te extraheren.
Als u informatie uit facturen, betalingsbewijzen, paspoorten, rijbewijzen of visitekaartjes wilt halen, begint u met het bijbehorende vooraf samengestelde model:
- Factuurverwerking
- Verwerking van aankoopbewijzen
- Lezer van identiteitsdocumenten (paspoorten en rijbewijzen)
- Visitekaartjeslezer
U kunt deze vooraf samengestelde modellen direct gebruiken, zonder dat u een nieuw model hoeft te maken. Deze modellen kunnen algemene informatie uit hun corresponderende documenttype extraheren.
Voor elk ander documenttype kunt u een aangepast documentverwerkingsmodel maken om de benodigde velden en tabellen te extraheren. Dit geldt ook als u aanvullende informatie nodig hebt die niet door het vooraf samengestelde model wordt verstrekt.
Meer informatie: Aangepast documentverwerkingsmodel
AI Builder-documentverwerking is gebaseerd op Azure Form Recognizer. Dit biedt beide producten de nieuwste ontwikkelingen in Microsoft AI.
AI Builder is onderdeel van Microsoft Power Platform. Hierdoor kan iedereen AI toevoegen aan apps en automatisering via een gebruiksvriendelijke interface. U hoeft geen ontwikkelaar of datawetenschapper te zijn.
Azure Form Recognizer is gericht op professionele ontwikkelaars. Ze kunnen eenvoudige REST-API's gebruiken om AI-mogelijkheden toe te voegen aan hun aangepaste codeoplossingen.
U kunt verwerking gratis uitproberen door te beginnen met een proefversie. Nadat u het hebt geëvalueerd, moet u AI Builder-tegoed kopen om documentverwerking te gebruiken. Elke pagina die u verwerkt met documentverwerking verbruikt AI Builder-tegoeden, zelfs als de pagina geen gegevens bevat die moeten worden opgehaald. AI Builder-tegoed kan worden gekocht via AI Builder-invoegtoepassingen.
Meer informatie: AI Builder-licenties