Delen via


Document Intelligence-ontvangstmodel

Belangrijk

  • Openbare preview-versies van Document Intelligence bieden vroegtijdige toegang tot functies die actief zijn in ontwikkeling. Functies, benaderingen en processen kunnen veranderen, vóór algemene beschikbaarheid (GA), op basis van feedback van gebruikers.
  • De openbare preview-versie van Document Intelligence-clientbibliotheken is standaard ingesteld op REST API-versie 2024-07-31-preview.
  • Openbare preview-versie 2024-07-31-preview is momenteel alleen beschikbaar in de volgende Azure-regio's. Houd er rekening mee dat het aangepaste model voor generatieve (extractie van documentvelden) in AI Studio alleen beschikbaar is in de regio VS - noord-centraal:
    • VS - oost
    • VS - west 2
    • Europa -west
    • VS - noord-centraal

Deze inhoud is van toepassing op: vinkje v4.0 (preview) | Vorige versies:blauw-vinkje v3.1 (GA)blauw-vinkje v3.0 (GA)blauw-vinkje v2.1 (GA)

Deze inhoud is van toepassing op: vinkje v3.1 (GA) | Nieuwste versie:paars vinkje v4.0 (preview) | Vorige versies: blauw-vinkje v3.0blauw-vinkje v2.1

Deze inhoud is van toepassing op: vinkje v3.0 (GA) | Nieuwste versies:paars vinkje v4.0 (preview)paars vinkje v3.1 | Vorige versie: blauw-vinkje v2.1

Deze inhoud is van toepassing op: vinkje v2.1 | Nieuwste versie: blauw-vinkje v4.0 (preview)

Het Document Intelligence-ontvangstmodel combineert krachtige OCR-mogelijkheden (Optical Character Recognition) met deep learning-modellen om belangrijke informatie uit verkoopbevestigingen te analyseren en te extraheren. Ontvangstbewijzen kunnen van verschillende formaten en kwaliteit zijn, waaronder afgedrukte en handgeschreven ontvangstbewijzen. De API extraheert belangrijke informatie, zoals de naam van de verkoper, het telefoonnummer van de verkoper, transactiedatum, belasting en transactietotaal en retourneert gestructureerde JSON-gegevens.

Ondersteunde ontvangstbevestigingstypen:

  • Thermaal
  • Creditcard
  • Gas
  • Parkeren
  • Hotel
  • Transportsector
  • Communicatie
  • Vermaak
  • Vlucht
  • Training
  • Apotheek/Medisch

Extractie van ontvangstgegevens

Ontvangstbevestiging omvat de transformatie van verschillende soorten ontvangstbewijzen, waaronder gescande, gefotografeerde en afgedrukte kopieën, in een digitale indeling voor gestroomlijnde downstreamverwerking. Voorbeelden hiervan zijn onkostenbeheer, analyse van consumentengedrag, belastingautomatisering, enzovoort. Met behulp van documentinformatie met OCR-technologie (Optical Character Recognition) kunnen gegevens uit deze diverse ontvangstindelingen worden geëxtraheerd en geïnterpreteerd. Document Intelligence-verwerking vereenvoudigt het conversieproces, maar vermindert ook de benodigde tijd en moeite aanzienlijk, waardoor efficiënt gegevensbeheer en ophalen wordt vergemakkelijkt.

Voorbeeldbevestiging verwerkt met Document Intelligence Studio:

Schermopname van een voorbeeldbevestiging die is verwerkt in Document Intelligence Studio.

Voorbeeldbevestiging verwerkt met het hulpprogramma Document Intelligence-voorbeeldlabels:

Schermopname van een voorbeeldbevestiging die is verwerkt met het hulpprogramma Formuliervoorbeeld voor labelen.

Ontwikkelingsopties

Document Intelligence v4.0 (2024-07-31-preview) ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Ontvangstbewijsmodel Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
vooraf samengestelde ontvangstbevestiging

Document Intelligence v3.1 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Ontvangstbewijsmodel Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
vooraf samengestelde ontvangstbevestiging

Document Intelligence v3.0 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Ontvangstbewijsmodel Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
vooraf samengestelde ontvangstbevestiging

Document Intelligence v2.1 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources
Ontvangstbewijsmodel Hulpprogramma
voor documentinformatielabels• REST API
• Sdk
voor clientbibliotheek•
Document Intelligence Docker-container

Vereisten voor invoer

  • Ondersteunde bestandsindelingen:

    Modelleren PDF Afbeelding:
    JPEG/JPG, PNG, BMP, , TIFFHEIF
    Microsoft Office:
    Word (), Excel (XLSXDOCX), PowerPoint (PPTX), HTML
    Read
    Indeling ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Algemeen document
    Vooraf gebouwd
    Aangepaste extractie
    Aangepaste classificatie ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Geef voor de beste resultaten één duidelijke foto of een hoogwaardige scan per document op.

  • Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een gratis abonnement worden alleen de eerste twee pagina's verwerkt).

  • De bestandsgrootte voor het analyseren van documenten is 500 MB voor betaalde (S0) laag en 4 MB voor gratis (F0).

  • De afmetingen van de afbeelding moeten tussen 50 x 50 pixels en 10.000 pixels x 10.000 pixels zijn.

  • Als uw PDF's zijn vergrendeld met een wachtwoord, moet u de vergrendeling verwijderen voordat u ze indient.

  • De minimale hoogte van de tekst die moet worden geëxtraheerd, is 12 pixels voor een afbeelding van 1024 x 768 pixels. Deze dimensie komt overeen met punttekst 8 op 150 punten per inch (DPI).

  • Voor aangepaste modeltraining is het maximum aantal pagina's voor trainingsgegevens 500 voor het aangepaste sjabloonmodel en 50.000 voor het aangepaste neurale model.

    • Voor het trainen van aangepaste extractiemodellen is de totale grootte van trainingsgegevens 50 MB voor het sjabloonmodel en 1 GB voor het neurale model.

    • Voor het trainen van aangepast classificatiemodel is 1 de totale grootte van trainingsgegevens GB met maximaal 10.000 pagina's. Voor 2024-07-31-preview en hoger is 2 de totale grootte van trainingsgegevens GB met maximaal 10.000 pagina's.

  • Ondersteunde bestandsindelingen: JPEG, PNG, PDF en TIFF.
  • Ondersteunde paginavergoeding voor PDF en TIFF: Document Intelligence kan maximaal 2.000 pagina's verwerken voor abonnees van de standaardlaag of alleen de eerste twee pagina's voor abonnees met een gratis laag.
  • Ondersteunde bestandsgrootte: minder dan 50 MB; minimum pixels 50 x 50 px; maximum pixels 10.000 x 10.000 px.

Gegevensextractie van ontvangstmodel

Bekijk hoe Met Document Intelligence gegevens worden geëxtraheerd, waaronder de tijd en datum van transacties, informatie over de verkoper en de totale hoeveelheid van ontvangsten. U hebt de volgende resources nodig:

  • Een Azure-abonnement: u kunt er gratis een maken.

  • Een Document Intelligence-exemplaar in Azure Portal. U kunt de gratis prijscategorie (F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource om uw sleutel en eindpunt op te halen.

Schermopname van sleutels en eindpuntlocatie in Azure Portal.

Notitie

Document Intelligence Studio is beschikbaar met v3.1- en v3.0-API's en latere versies.

  1. Selecteer Ontvangstbewijzen op de startpagina van Document Intelligence Studio.

  2. U kunt het voorbeeldbevestiging analyseren of uw eigen bestanden uploaden.

  3. Selecteer de knop Analyse uitvoeren en configureer indien nodig de opties analyseren:

    Schermopname van de knoppen Analyse uitvoeren en Opties analyseren in Document Intelligence Studio.

Document Intelligence-voorbeeldhulpprogramma voor labelen

  1. Navigeer naar het voorbeeldprogramma documentinformatie.

  2. Selecteer op de startpagina van het voorbeeldhulpprogramma het vooraf samengestelde model gebruiken om de gegevenstegel op te halen.

    Schermopname van het proces voor het analyseren van resultaten van het indelingsmodel.

  3. Selecteer het formuliertype dat u wilt analyseren in de vervolgkeuzelijst.

  4. Kies een URL voor het bestand dat u wilt analyseren uit de onderstaande opties:

  5. Selecteer in het veld Bron de URL in de vervolgkeuzelijst, plak de geselecteerde URL en selecteer de knop Ophalen.

    Schermopname van het vervolgkeuzemenu bronlocatie.

  6. Plak in het veld Eindpunt van de Document Intelligence-service het eindpunt dat u hebt verkregen met uw Document Intelligence-abonnement.

  7. Plak in het sleutelveld de sleutel die u hebt verkregen uit uw Document Intelligence-resource.

    Schermopname van het vervolgkeuzemenu select-form-type.

  8. Selecteer Analyse uitvoeren. Met het hulpprogramma Document Intelligence-voorbeeldlabels wordt de vooraf samengestelde API analyseren aangeroepen en het document geanalyseerd.

  9. Bekijk de resultaten: bekijk de sleutel-waardeparen die zijn geëxtraheerd, regelitems, gemarkeerde tekst geëxtraheerd en tabellen gedetecteerd.

    Schermopname van de analysebewerking van het indelingsmodel.

Notitie

Het hulpprogramma Voorbeeldlabeling biedt geen ondersteuning voor de BMP-bestandsindeling. Dit is een beperking van het hulpprogramma niet van de Document Intelligence-service.

Ondersteunde talen en landinstellingen

Zie onze pagina met vooraf samengestelde taalondersteuning voor modellen voor een volledige lijst met ondersteunde talen.

Veldextractie

Name Type Description Gestandaardiseerde uitvoer
ReceiptType String Type verkoopbevestiging Gespecificeerde
MerchantName String Naam van de verkoper die het ontvangstbewijs uitgeeft
MerchantPhoneNumber phoneNumber Vermeld telefoonnummer van verkoper +1 xxx xxx xxxx
MerchantAddress String Vermeld adres van verkoper
TransactionDate Datum Datum waarop het ontvangstbewijs is uitgegeven jjjj-mm-dd
TransactionTime Tijd Tijdstip waarop het ontvangstbewijs is uitgegeven uu-mm-ss (24-uurs)
Totaal Getal (USD) Volledige transactietotaal van ontvangst Float met twee decimalen
Subtotaal Getal (USD) Subtotaal van ontvangst, vaak voordat belastingen worden toegepast Float met twee decimalen
Belasting Getal (USD) Totale belasting op ontvangstbewijs (vaak btw of gelijkwaardig). De naam is gewijzigd in 'TotalTax' in versie 2022-06-30. Float met twee decimalen
Tip Getal (USD) Tip inbegrepen door koper Float met twee decimalen
Artikelen Matrix van objecten Geëxtraheerde regelitems, met naam, hoeveelheid, eenheidsprijs en totale prijs geëxtraheerd
Naam String Beschrijving van item. De naam is gewijzigd in beschrijving in versie 2022-06-30.
Hoeveelheid Aantal Hoeveelheid van elk item Float met twee decimalen
Prijs Aantal Afzonderlijke prijs van elke artikeleenheid Float met twee decimalen
TotalPrice Aantal Totale prijs van regelitem Float met twee decimalen

Raadpleeg de schemapagina voor het ontvangstmodel in onze GitHub-voorbeeldopslagplaats voor ondersteunde velden voor documentextractie.

Migratiehandleiding en REST API v3.1

  • Volg onze migratiehandleiding voor Document Intelligence v3.1 voor meer informatie over het gebruik van de versie v3.1 in uw toepassingen en werkstromen.

Volgende stappen

  • Probeer uw eigen formulieren en documenten te verwerken met Document Intelligence Studio.

  • Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.

  • Probeer uw eigen formulieren en documenten te verwerken met het hulpprogramma Document Intelligence Sample Labeling.

  • Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.