Delen via


Document Intelligence-contractmodel

Deze inhoud is van toepassing op:checkmarkvinkjev4.0 (GA) | Vorige versie:blue-checkmark v3.1 (GA) ::moniker-end

Deze inhoud is van toepassing op:checkmarkvinkjeNieuwste versie: | purple-checkmarkv4.0 (GA)

Het Document Intelligence-contractmodel maakt gebruik van krachtige OCR-mogelijkheden (Optical Character Recognition) om belangrijke velden en regelitems te analyseren en te extraheren uit een bepaalde groep belangrijke contractentiteiten. Contracten kunnen van verschillende indelingen en kwaliteit zijn, waaronder door de telefoon vastgelegde afbeeldingen, gescande documenten en digitale PDF-bestanden. De API analyseert documenttekst; extraheert belangrijke informatie, zoals partijen, jurisdicties, contract-id en titel; en retourneert een gestructureerde JSON-gegevensweergave. Het model ondersteunt momenteel engelse documentindelingen.

Geautomatiseerde contractverwerking

Geautomatiseerde contractverwerking is het proces van het extraheren van sleutelcontractvelden uit documenten. Het proces van contractanalyse wordt in het verleden handmatig bereikt en dus zeer tijdrovend. Nauwkeurige extractie van belangrijke gegevens uit contracten is doorgaans de eerste en een van de meest kritieke stappen in het contractautomatiseringsproces.

Ontwikkelingsopties

Document Intelligence v4.0: 2024-11-30 (GA) ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Contractmodel Document Intelligence Studio

• Python SDK
Java SDK
vooraf samengesteld contract

Document Intelligence v3.1 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Contractmodel Document Intelligence Studio

• Python SDK
Java SDK
vooraf samengesteld contract

Document Intelligence v3.0 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Contractmodel Document Intelligence Studio

• Python SDK
Java SDK
vooraf samengesteld contract

Vereisten voor invoer

De volgende bestandsindelingen worden ondersteund.

Modelleren PDF Afbeelding:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Read
Indeling
Algemeen document
Vooraf gebouwd
Aangepaste extractie
Aangepaste classificatie
  • Foto's en scans: geef één duidelijke foto of een hoogwaardige scan per document op voor de beste resultaten.
  • PDF's en TIFF's: Voor PDF-bestanden en TIFF's kunnen maximaal 2000 pagina's worden verwerkt. (Met een abonnement op de gratis laag worden alleen de eerste twee pagina's verwerkt.)
  • Bestandsgrootte: de bestandsgrootte voor het analyseren van documenten is 500 MB voor de betaalde laag (S0) en 4 MB voor de gratis laag (F0).
  • Afbeeldingsafmetingen: De afmetingen moeten tussen 50 pixels x 50 pixels en 10.000 pixels x 10.000 pixels zijn.
  • Wachtwoordvergrendelingen: als uw PDF-bestanden zijn vergrendeld met een wachtwoord, moet u de vergrendeling verwijderen voordat u ze inzendt.
  • Teksthoogte: de minimale hoogte van de tekst die moet worden geëxtraheerd, is 12 pixels voor een afbeelding van 1024 x 768 pixels. Deze dimensie komt overeen met ongeveer 8-punts tekst bij 150 punten per inch.
  • Aangepaste modeltraining: Het maximum aantal pagina's voor trainingsgegevens is 500 voor het aangepaste sjabloonmodel en 50.000 voor het aangepaste neurale model.
  • Aangepaste extractiemodeltraining: de totale grootte van trainingsgegevens is 50 MB voor het sjabloonmodel en 1 GB voor het neurale model.
  • Training voor aangepast classificatiemodel: de totale grootte van trainingsgegevens is 1 GB met maximaal 10.000 pagina's. Voor 2024-11-30 (GA) is de totale grootte van trainingsgegevens 2 GB met maximaal 10.000 pagina's.
  • Office-bestandstypen (DOCX, XLSX, PPTX): de maximale tekenreekslengte is 8 miljoen tekens.

Gegevensextractie van contractdocument proberen

Bekijk hoe gegevens, waaronder klantgegevens, details van leveranciers en regelitems, worden geëxtraheerd uit contracten. U hebt de volgende resources nodig:

  • Een Azure-abonnement: u kunt er gratis een maken.

  • Een Document Intelligence-exemplaar in Azure Portal. U kunt de gratis prijscategorie (F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource om uw sleutel en eindpunt op te halen.

Schermopname van sleutels en eindpuntlocatie in Azure Portal.

Document Intelligence Studio

  1. Selecteer Belastingdocumenten op de startpagina van Document Intelligence Studio.

  2. U kunt de voorbeeldbelastingdocumenten analyseren of uw eigen bestanden uploaden.

  3. Selecteer de knop Analyse uitvoeren en configureer indien nodig de opties analyseren:

    Schermopname van de knoppen Analyse uitvoeren en Opties analyseren in Document Intelligence Studio.

Ondersteunde talen en landinstellingen

Zie de pagina Vooraf samengestelde modellen voor een volledige lijst met ondersteunde talen.

Veldextractie

Volgende stappen

  • Probeer uw eigen formulieren en documenten te verwerken met Document Intelligence Studio.

  • Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.