Document Intelligence-contractmodel

Artikel
12-12-2024

Deze inhoud is van toepassing op:v4.0 (GA) | Vorige versie: v3.1 (GA) ::moniker-end

Deze inhoud is van toepassing op:v3.1 (GA) | Nieuwste versie:v4.0 (GA)

Het Document Intelligence-contractmodel maakt gebruik van krachtige OCR-mogelijkheden (Optical Character Recognition) om belangrijke velden en regelitems te analyseren en te extraheren uit een bepaalde groep belangrijke contractentiteiten. Contracten kunnen van verschillende indelingen en kwaliteit zijn, waaronder door de telefoon vastgelegde afbeeldingen, gescande documenten en digitale PDF-bestanden. De API analyseert documenttekst; extraheert belangrijke informatie, zoals partijen, jurisdicties, contract-id en titel; en retourneert een gestructureerde JSON-gegevensweergave. Het model ondersteunt momenteel engelse documentindelingen.

Geautomatiseerde contractverwerking

Geautomatiseerde contractverwerking is het proces van het extraheren van sleutelcontractvelden uit documenten. Het proces van contractanalyse wordt in het verleden handmatig bereikt en dus zeer tijdrovend. Nauwkeurige extractie van belangrijke gegevens uit contracten is doorgaans de eerste en een van de meest kritieke stappen in het contractautomatiseringsproces.

Ontwikkelingsopties

Document Intelligence v4.0: 2024-11-30 (GA) ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie	Resources	Model-id
Contractmodel	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	vooraf samengesteld contract

Document Intelligence v3.1 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie	Resources	Model-id
Contractmodel	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	vooraf samengesteld contract

Document Intelligence v3.0 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie	Resources	Model-id
Contractmodel	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	vooraf samengesteld contract

Vereisten voor invoer

Ondersteunde bestandsindelingen:

Modelleren	PDF	Afbeelding: `JPEG/JPG`, `PNG`, `BMP`, , `TIFFHEIF`	Microsoft Office: Word (), Excel (`XLSXDOCX`), PowerPoint (`PPTX`), HTML
Read	✔	✔	✔
Indeling	✔	✔	✔
Algemeen document	✔	✔
Vooraf gebouwd	✔	✔
Aangepaste extractie	✔	✔
Aangepaste classificatie	✔	✔	✔

Geef voor de beste resultaten één duidelijke foto of een hoogwaardige scan per document op.
Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een gratis abonnement worden alleen de eerste twee pagina's verwerkt).
De bestandsgrootte voor het analyseren van documenten is 500 MB voor betaalde (S0) laag en 4 MB voor gratis (F0).
De afmetingen van de afbeelding moeten tussen 50 x 50 pixels en 10.000 pixels x 10.000 pixels zijn.
Als uw PDF's zijn vergrendeld met een wachtwoord, moet u de vergrendeling verwijderen voordat u ze indient.
De minimale hoogte van de tekst die moet worden geëxtraheerd, is 12 pixels voor een afbeelding van 1024 x 768 pixels. Deze dimensie komt overeen met punttekst 8 op 150 punten per inch (DPI).
Voor aangepaste modeltraining is het maximum aantal pagina's voor trainingsgegevens 500 voor het aangepaste sjabloonmodel en 50.000 voor het aangepaste neurale model.
- Voor het trainen van aangepaste extractiemodellen is de totale grootte van trainingsgegevens 50 MB voor het sjabloonmodel en 1 GB voor het neurale model.
- Voor het trainen van aangepast classificatiemodel is 1 de totale grootte van trainingsgegevens GB met maximaal 10.000 pagina's. Voor 2024-11-30 (GA) is 2 de totale grootte van trainingsgegevens GB met maximaal 10.000 pagina's.

Gegevensextractie van contractdocument proberen

Bekijk hoe gegevens, waaronder klantgegevens, details van leveranciers en regelitems, worden geëxtraheerd uit contracten. U hebt de volgende resources nodig:

Een Azure-abonnement: u kunt er gratis een maken.
Een Document Intelligence-exemplaar in Azure Portal. U kunt de gratis prijscategorie (F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource om uw sleutel en eindpunt op te halen.

Schermopname van sleutels en eindpuntlocatie in Azure Portal.

Document Intelligence Studio

Selecteer Belastingdocumenten op de startpagina van Document Intelligence Studio.
U kunt de voorbeeldbelastingdocumenten analyseren of uw eigen bestanden uploaden.
Selecteer de knop Analyse uitvoeren en configureer indien nodig de opties analyseren:

Document Intelligence Studio uitproberen

Ondersteunde talen en landinstellingen

Zie de pagina Vooraf samengestelde modellen voor een volledige lijst met ondersteunde talen.

Veldextractie

Zie de schemapagina van het contractmodel in onze GitHub-voorbeeldopslagplaats voor ondersteunde velden voor documentextractie.
De contractsleutel-waardeparen en regelitems die zijn geëxtraheerd, bevinden zich in de documentResults sectie van de JSON-uitvoer.

Volgende stappen

Probeer uw eigen formulieren en documenten te verwerken met Document Intelligence Studio.
Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.

Aanvullende resources

Documentatie

Document Intelligence payStub-model - Azure AI services

Automatiseer compensatie- en inkomstengegevens van loonbonnen en stubs.
Amerikaanse extractiemodel bankafschrift - Document Intelligence - Azure AI services

OCR en op machine learning gebaseerde bankafschriften amerikaanse extractie in Document Intelligence extraheert belangrijke gegevens uit bankafschriften.
Extractie controleren - Documentinformatie - Azure AI services

Met OCR en op machine learning gebaseerde controleextractie in Document Intelligence worden belangrijke gegevens uit cheques geëxtraheerd.
Gegevensextractie van amerikaanse belastingdocumenten documentinformatie - Azure AI services

Automatiseer gegevensextractie van amerikaanse belastingdocumenten met Document Intelligence US-belastingdocumentmodellen.
Mogelijkheden voor invoegtoepassingen - Document intelligence - Azure AI services

Hoe u de capaciteit van de servicelimiet kunt verhogen met mogelijkheden voor invoegtoepassingen.
Algemene sleutel-waardeextractie - Documentinformatie - Azure AI services

Extraheer sleutel-waardeparen, tabellen, selectiemarkeringen en tekst uit uw documenten met Document Intelligence.
Document Intelligence huwelijkscertificaat - Azure AI services

Automatiseer gegevensextractie van huwelijkscertificaten met het huwelijkscertificaatmodel van Document Intelligence.
Quickstart: Document Intelligence-clientbibliotheken - Azure AI services

Gebruik een Document Intelligence SDK of de REST API om een app voor formulierverwerking te maken waarmee belangrijke gegevens en structuurelementen uit uw documenten worden geëxtraheerd.

Training

Module

Gegevens extraheren uit formulieren met Azure Document Intelligence - Training

Met Azure Document Intelligence worden gegevens op schaal geëxtraheerd om het verzenden van documenten in realtime, op schaal, met nauwkeurigheid mogelijk te maken. Deze module biedt gebruikers de hulpprogramma's voor het gebruik van de Azure Document Intelligence Vision-API.

Certificering

Microsoft-gecertificeerd: Azure AI Ingenieur Medewerker (Associate) - Certifications

Ontwerp en implementeer een Azure AI-oplossing met behulp van Azure AI-services, Azure AI Search en Azure Open AI.

AI Skills Fest

Delen via