Document Intelligence ID-documentmodel

Belangrijk

  • Openbare preview-versies van Document Intelligence bieden vroegtijdige toegang tot functies die actief zijn in ontwikkeling.
  • Functies, benaderingen en processen kunnen veranderen, vóór algemene beschikbaarheid (GA), op basis van feedback van gebruikers.
  • De openbare preview-versie van Document Intelligence-clientbibliotheken is standaard ingesteld op REST API-versie 2024-02-29-preview.
  • Openbare preview-versie 2024-02-29-preview is momenteel alleen beschikbaar in de volgende Azure-regio's:
  • VS - oost
  • VS - west 2
  • Europa -west

Deze inhoud is van toepassing op:Vinkjev4.0 (preview) | Vorige versies:blauw-vinkjev3.1 (GA)blauw-vinkjev3.0 (GA)blauw-vinkjev2.1 (GA)

Deze inhoud is van toepassing op:Vinkjev3.1 (GA) | Nieuwste versie:paars vinkjev4.0 (preview) | Vorige versies:blauw-vinkjev3.0blauw-vinkjev2.1

Deze inhoud is van toepassing op:Vinkjev3.0 (GA) | Nieuwste versies:paars vinkjev4.0 (preview)paars vinkjev3.1 | Vorige versie:blauw-vinkjev2.1

Deze inhoud is van toepassing op:Vinkjev2.1 | Nieuwste versie:blauw-vinkjev4.0 (preview)

Document Intelligence Identity Document -model (ID) combineert Optical Character Recognition (OCR) met Deep Learning-modellen om belangrijke informatie uit identiteitsdocumenten te analyseren en te extraheren. De API analyseert identiteitsdocumenten (inclusief de volgende) en retourneert een gestructureerde JSON-gegevensweergave:

  • Paspoortboek, paspoortkaart wereldwijd
  • Rijbewijs van Verenigde Staten, Europa, India, Canada en Australië
  • Verenigde Staten identificatiekaarten, verblijfsvergunning (groene kaart), burgerservicekaart, militaire id
  • Europese identificatiekaarten, verblijfsvergunningen
  • India PAN-kaart, Aadhaar-kaart
  • Canada-identificatiekaarten, verblijfsvergunning (maplekaart)
  • Australië fotokaart, sleutelpas-id (inclusief digitale versie)

Document Intelligence kan informatie analyseren en extraheren uit door de overheid uitgegeven identificatiedocumenten (ID's) met behulp van het vooraf gedefinieerde id-model. Het combineert onze krachtige OCR-mogelijkheden (Optical Character Recognition) met ID-herkenningsmogelijkheden om belangrijke informatie te extraheren uit Worldwide Passports en U.S. Driver's Licenses (alle 50 staten en D.C.). De API voor id's extraheert belangrijke informatie uit deze identiteitsdocumenten, zoals voornaam, achternaam, geboortedatum, documentnummer en meer. Deze API is beschikbaar in Document Intelligence v2.1 als een cloudservice.

Verwerking van identiteitsdocument

Identiteitsdocumentverwerking omvat het extraheren van gegevens uit identiteitsdocumenten handmatig of met behulp van op OCR gebaseerde technologie. Id-documentverwerking is een belangrijke stap in elke bedrijfsbewerking waarvoor een bewijs van identiteit is vereist. Voorbeelden hiervan zijn klantverificatie in banken en andere financiële instellingen, hypotheekaanvragen, medische bezoeken, claimverwerking, horeca en meer. Personen bieden een bewijs van hun identiteit via rijbewijs, paspoorten en andere vergelijkbare documenten, zodat het bedrijf ze efficiënt kan verifiëren voordat ze services en voordelen bieden.

Voorbeeld van een U.S. Driver's License verwerkt met Document Intelligence Studio

Afbeelding van een voorbeeld van een rijbewijs.

Gegevensextractie

De vooraf gemaakte id's-service haalt de belangrijkste waarden op uit wereldwijde paspoorten en Amerikaanse rijbewijs's en retourneert deze in een georganiseerd gestructureerd JSON-antwoord.

Voorbeeld van rijbewijs

Voorbeeld van rijbewijs

Passport-voorbeeld

Voorbeeld van Passport

Ontwikkelingsopties

Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Id-documentmodel Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
vooraf samengesteld-idDocument

Document Intelligence v3.1 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Id-documentmodel Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
vooraf samengesteld-idDocument

Document Intelligence v3.0 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Id-documentmodel Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
vooraf samengesteld-idDocument

Document Intelligence v2.1 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources
Id-documentmodel Hulpprogramma
voor documentinformatielabels• REST API
• Sdk
voor clientbibliotheek•
Document Intelligence Docker-container

Vereisten voor invoer

  • Geef voor de beste resultaten één duidelijke foto of een hoogwaardige scan per document op.

  • Ondersteunde bestandsindelingen:

    Model PDF Afbeelding:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) en HTML
    Read
    Indeling ✔ (2024-02-29-preview, 2023-10-31-preview)
    Algemeen document
    Vooraf gebouwd
    Aangepaste extractie
    Aangepaste classificatie ✔ (2024-02-29-preview)
  • Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een abonnement op de gratis laag worden alleen de eerste twee pagina's verwerkt).

  • De bestandsgrootte voor het analyseren van documenten is 500 MB voor betaalde (S0) laag en 4 MB gratis (F0).

  • De afmetingen van de afbeelding moeten tussen 50 x 50 pixels en 10.000 pixels x 10.000 pixels zijn.

  • Als uw PDF's zijn vergrendeld met een wachtwoord, moet u de vergrendeling verwijderen voordat u ze indient.

  • De minimale hoogte van de tekst die moet worden geëxtraheerd, is 12 pixels voor een afbeelding van 1024 x 768 pixels. Deze dimensie komt overeen met ongeveer 8-punttekst op 150 punten per inch (DPI).

  • Voor aangepaste modeltraining is het maximum aantal pagina's voor trainingsgegevens 500 voor het aangepaste sjabloonmodel en 50.000 voor het aangepaste neurale model.

    • Voor het trainen van aangepaste extractiemodellen is de totale grootte van trainingsgegevens 50 MB voor het sjabloonmodel en 1G-MB voor het neurale model.

    • Voor het trainen van aangepast classificatiemodel is 1GB de totale grootte van trainingsgegevens maximaal 10.000 pagina's.

  • Ondersteunde bestandsindelingen: JPEG, PNG, PDF en TIFF.

  • Ondersteund aantal pagina's voor PDF- en TIFF-bestanden: maximaal 2000 pagina's of alleen de eerste twee pagina's voor abonnees in de gratis laag.

  • Ondersteunde bestandsgrootte: minder dan 50 MB TOTAAL; minimum pixels: 50 x 50 px; maximum pixels 10.000 x 10.000 px.

Id-documentmodelgegevensextractie

Gegevens extraheren, inclusief naam, geboortedatum en vervaldatum, uit id-documenten. U hebt de volgende resources nodig:

  • Een Azure-abonnement: u kunt er gratis een maken.

  • Een Document Intelligence-exemplaar in Azure Portal. U kunt de gratis prijscategorie (F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource om uw sleutel en eindpunt op te halen.

Schermopname van sleutels en eindpuntlocatie in Azure Portal.

Notitie

Document Intelligence Studio is beschikbaar met v3.1- en v3.0-API's en latere versies.

  1. Selecteer identiteitsdocumenten op de startpagina van Document Intelligence Studio.

  2. U kunt de voorbeeldfactuur analyseren of uw eigen bestanden uploaden.

  3. Selecteer de knop Analyse uitvoeren en configureer indien nodig de opties analyseren:

    Schermopname van de knoppen Analyse uitvoeren en Opties analyseren in Document Intelligence Studio.

Document Intelligence-voorbeeldhulpprogramma voor labelen

  1. Navigeer naar het voorbeeldprogramma documentinformatie.

  2. Selecteer op de startpagina van het voorbeeldhulpprogramma het vooraf samengestelde model gebruiken om de gegevenstegel op te halen.

    Schermopname van de analysebewerking van het indelingsmodel.

  3. Selecteer het formuliertype dat u wilt analyseren in de vervolgkeuzelijst.

  4. Kies een URL voor het bestand dat u wilt analyseren uit de onderstaande opties:

  5. Selecteer in het veld Bron de URL in de vervolgkeuzelijst, plak de geselecteerde URL en selecteer de knop Ophalen.

    Schermopname van het vervolgkeuzemenu bronlocatie.

  6. Plak in het veld Eindpunt van de Document Intelligence-service het eindpunt dat u hebt verkregen met uw Document Intelligence-abonnement.

  7. Plak in het sleutelveld de sleutel die u hebt verkregen uit uw Document Intelligence-resource.

    Schermopname van het vervolgkeuzemenu documenttype selecteren.

  8. Selecteer Analyse uitvoeren. Het hulpprogramma Document Intelligence-voorbeeldlabels roept de vooraf samengestelde API analyseren aan en analyseert het document.

  9. Bekijk de resultaten: bekijk de sleutel-waardeparen die zijn geëxtraheerd, regelitems, gemarkeerde tekst geëxtraheerd en tabellen gedetecteerd.

    Schermopname van de analysebewerking van het identiteitsmodel.

  10. Download het JSON-uitvoerbestand om de gedetailleerde resultaten weer te geven.

    • Het knooppunt readResults bevat elke tekstregel met de bijbehorende plaatsing van het begrenzingsvak op de pagina.
    • Het knooppunt SelectionMarks toont elk selectieteken (selectievakje, keuzerondje) en of de status is geselecteerd of niet is geselecteerd.
    • De sectie pageResults bevat de geëxtraheerde tabellen. Voor elke tabel extraheert Document Intelligence de tekst, rij en kolomindex, rij- en kolomspanning, begrenzingsvak en meer.
    • Het veld documentResults bevat informatie over sleutel-waardeparen en regelitems voor de meest relevante onderdelen van het document.

Notitie

Het hulpprogramma Voorbeeldlabeling biedt geen ondersteuning voor de BMP-bestandsindeling. Dit is een beperking van het hulpprogramma niet van de Document Intelligence-service.

Ondersteunde documenttypen

Regio Documenttypen
Wereldwijd Passport Book, Passport Card
Verenigde Staten Rijbewijs, identificatiekaart, verblijfsvergunning (groene kaart), burgerservicekaart, militaire id
Europa Rijbewijs, identificatiekaart, verblijfsvergunning
India Rijbewijs, PAN-kaart, Aadhaar-kaart
Canada Rijbewijs, Identificatiekaart, Verblijfsvergunning (Maple Card)
Australië Rijbewijs, fotokaart, sleutelpas-id (inclusief digitale versie)

Veldextracties

Hier volgen de velden die per documenttype zijn geëxtraheerd. Het model documentinformatie-id prebuilt-idDocument extraheert de volgende velden in de documents.*.fields. De json-uitvoer bevat alle geëxtraheerde tekst in de documenten, woorden, regels en stijlen.

idDocument.driverLicense

Veld Type Description Voorbeeld
CountryRegion countryRegion Land- of regiocode USA
Region string Provincie Washington
DocumentNumber string Rijbewijsnummer WDLABCD456DG
DocumentDiscriminator string Rijbewijsdocumentdiscriminator 12645646464554646456464544
FirstName string De opgegeven naam en het middelste begin, indien van toepassing LIAM R.
LastName string Achternaam TALBOT
Address address Adres 123 STRAATADRES UW STAD WA 99999-1234
DateOfBirth date Geboortedatum 01/06/1958
DateOfExpiration date Vervaldatum 08/12/2020
DateOfIssue date Datum van probleem 08/12/2012
EyeColor string Oogkleur Blauw
HairColor string Haarkleur Bruin
Height string Hoogte 5'11"
Weight string Gewicht 185LB
Sex string Geslacht M
Endorsements string Goedkeuringen L
Restrictions string Beperkingen B
VehicleClassifications string Voertuigclassificatie D

idDocument.passport

Veld Type Description Voorbeeld
DocumentNumber string Paspoortnummer 340020013
FirstName string De opgegeven naam en het middelste begin, indien van toepassing JENNIFER
MiddleName string Naam tussen de opgegeven naam en achternaam REYES
LastName string Achternaam BROOKS
Aliases array
Aliases.* string Ook wel bekend als MAT LIN
DateOfBirth date Geboortedatum 01-01-1980
DateOfExpiration date Vervaldatum 2019-05-05
DateOfIssue date Datum van probleem 2014-05-06
Sex string Geslacht F
CountryRegion countryRegion Land of organisatie uitgeven USA
DocumentType string Documenttype P
Nationality countryRegion Nationaliteit USA
PlaceOfBirth string Geboorteplaats MASSACHUSETTS, V.S.A.
PlaceOfIssue string Plaats van probleem LISSABON
IssuingAuthority string Verlenende instantie Verenigde Staten Ministerie van Buitenlandse Zaken
PersonalNumber string Persoonlijke id. Nee A234567893
MachineReadableZone object Machineleesbare zone (MRZ) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string De opgegeven naam en het middelste begin, indien van toepassing JENNIFER
MachineReadableZone.LastName string Achternaam BROOKS
MachineReadableZone.DocumentNumber string Paspoortnummer 340020013
MachineReadableZone.CountryRegion countryRegion Land of organisatie uitgeven USA
MachineReadableZone.Nationality countryRegion Nationaliteit USA
MachineReadableZone.DateOfBirth date Geboortedatum 01-01-1980
MachineReadableZone.DateOfExpiration date Vervaldatum 2019-05-05
MachineReadableZone.Sex string Geslacht F

idDocument.nationalIdentityCard

Veld Type Description Voorbeeld
CountryRegion countryRegion Land- of regiocode USA
Region string Provincie Washington
DocumentNumber string Nummer van nationale identiteitskaart WDLABCD456DG
DocumentDiscriminator string Nationale identiteitskaartdocumentdiscriminator 12645646464554646456464544
FirstName string De opgegeven naam en het middelste begin, indien van toepassing LIAM R.
LastName string Achternaam TALBOT
Address address Adres 123 STRAATADRES UW STAD WA 99999-1234
DateOfBirth date Geboortedatum 01/06/1958
DateOfExpiration date Vervaldatum 08/12/2020
DateOfIssue date Datum van probleem 08/12/2012
EyeColor string Oogkleur BLAUW
HairColor string Haarkleur BROWN
Height string Hoogte 5'11"
Weight string Gewicht 185LB
Sex string Geslacht M

idDocument.residencePermit

Veld Type Description Voorbeeld
CountryRegion countryRegion Land- of regiocode USA
DocumentNumber string Nummer van verblijfsvergunning WDLABCD456DG
FirstName string De opgegeven naam en het middelste begin, indien van toepassing LIAM R.
LastName string Achternaam TALBOT
DateOfBirth date Geboortedatum 01/06/1958
DateOfExpiration date Vervaldatum 08/12/2020
DateOfIssue date Datum van probleem 08/12/2012
Sex string Geslacht M
PlaceOfBirth string Geboorteplaats Duitsland
Category string Categorie Toestaan DV2
Address string Adres 123 STRAATADRES UW STAD WA 99999-1234

idDocument.usSocialSecurityCard

Veld Type Description Voorbeeld
DocumentNumber string Burgerservicekaartnummer WDLABCD456DG
FirstName string De opgegeven naam en het middelste begin, indien van toepassing LIAM R.
LastName string Achternaam TALBOT
DateOfIssue date Datum van probleem 08/12/2012

idDocument

Veld Type Description Voorbeeld
Address address Adres 123 STRAATADRES UW STAD WA 99999-1234
DocumentNumber string Rijbewijsnummer WDLABCD456DG
FirstName string De opgegeven naam en het middelste begin, indien van toepassing LIAM R.
LastName string Achternaam TALBOT
DateOfBirth date Geboortedatum 01/06/1958
DateOfExpiration date Vervaldatum 08/12/2020

Ondersteunde documenttypen

Het id-documentmodel ondersteunt momenteel amerikaanse rijbewijss en de biografische pagina van internationale paspoorten (met uitzondering van visum en andere reisdocumenten) extractie.

Uitgepakte velden

Name Type Description Waarde
Country land Landcode conform ISO 3166-standaard "USA"
DateOfBirth datum DOB in JJJJ-MM-DD-indeling "1980-01-01"
DateOfExpiration datum Vervaldatum in JJJJ-MM-DD-indeling "2019-05-05"
DocumentNummer tekenreeks Relevant paspoortnummer, rijbewijsnummer, enz. "340020013"
Voornaam tekenreeks De opgegeven naam en het middelste begin, indien van toepassing, zijn geëxtraheerd "JENNIFER"
Achternaam tekenreeks Geëxtraheerde achternaam "BEEKJES"
Nationaliteit land Landcode conform ISO 3166-standaard "USA"
Geslacht geslacht Mogelijke geëxtraheerde waarden zijn 'M' 'F' 'X' "F"
MachineReadableZone object Geëxtraheerde Passport MRZ met elk twee regels van 44 tekens "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F19050505471000307<715816"
DocumentType tekenreeks Documenttype, bijvoorbeeld Passport, Rijbewijs "paspoort"
Adres tekenreeks Geëxtraheerd adres (alleen rijbewijs) "123 STRAATADRES UW STAD WA 99999-1234"
Regio tekenreeks Geëxtraheerde regio, staat, provincie, enzovoort (alleen rijbewijs) "Washington"

Migratiehandleiding

  • Volg onze migratiehandleiding voor Document Intelligence v3.1 voor meer informatie over het gebruik van de versie v3.0 in uw toepassingen en werkstromen.

Volgende stappen

  • Probeer uw eigen formulieren en documenten te verwerken met Document Intelligence Studio.

  • Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.

  • Probeer uw eigen formulieren en documenten te verwerken met het hulpprogramma Document Intelligence Sample Labeling.

  • Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.