Condividi tramite


Modello di documento Document Intelligence ID

Importante

  • Le versioni di anteprima pubblica di Document Intelligence consentono accesso anticipato alle funzionalità in fase di sviluppo attivo.
  • Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
  • Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Document Intelligence è la versione dell'API REST 2024-02-29-preview.
  • La versione di anteprima pubblica 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
  • Stati Uniti orientali
  • Stati Uniti occidentali 2
  • Europa occidentale

Questo contenuto si applica a: segno di spunta v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.1 (disponibilità generale) blue-checkmark v3.0 (disponibilità generale) blue-checkmark v2.1 (disponibilità generale)

Questo contenuto si applica a: segno di spunta v3.1 (disponibilità generale) | Ultima versione: segno di spunta viola v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.0 blue-checkmark v2.1

Questo contenuto si applica a: segno di spunta v3.0 (disponibilità generale) | Ultime versioni: segno di spunta viola v4.0 (anteprima) segno di spunta viola v3.1 | Versioni precedenti: blue-checkmark v2.1

Questo contenuto si applica a: segno di spunta v2.1 | Ultima versione: blue-checkmark v4.0 (anteprima)

Il modello di documento di identità (ID) di Document intelligence combina il riconoscimento ottico dei caratteri (OCR) con i modelli di Deep Learning per analizzare ed estrarre informazioni chiave dai documenti di identità. L'API analizza i documenti di identità (inclusi i seguenti) e restituisce una rappresentazione di dati JSON strutturati:

  • Passaporto (a libretto e a tessera) di tutto il mondo
  • Patente di guida di Stati Uniti, Europa, India, Canada e Australia
  • Carte d'identità degli Stati Uniti, permesso di soggiorno (green card), tessera di previdenza sociale, tesserino militare
  • Carte d'identità europee, permessi di soggiorno
  • Carta PAN dell'India, carta Aadhaar
  • Carte d'identità del Canada, permesso di soggiorno (maple card)
  • Photo card per l'Australia, key-pass ID (inclusa la versione digitale)

Document Intelligence può analizzare ed estrarre informazioni da documenti di identificazione rilasciati da enti pubblici (ID) usando il proprio modello di ID predefinito. Combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con funzionalità di riconoscimento di documenti di identità per estrarre le informazioni chiave da passaporti internazionali e USA. Patenti di guida (tutti i 50 stati e D.C.). L'API ID estrae le informazioni chiave da questi documenti di identità, ad esempio nome, cognome, data di nascita, numero del documento e altro ancora. Questa API è disponibile in Document Intelligence v2.1 come servizio cloud.

Elaborazione dei documenti di identità

L'elaborazione dei documenti di identità comporta l'estrazione dei dati dai documenti di identità manualmente o tramite la tecnologia basata su OCR. L'elaborazione dei documenti d'identità è un passaggio importante in qualsiasi operazione aziendale che richieda una prova di identità. Gli esempi includono la verifica dei clienti in banche e altri istituti finanziari, le richieste di mutuo, le visite mediche, l'elaborazione di reclami, il settore dell'ospitalità e altro ancora. Gli individui forniscono una prova della loro identità tramite patenti di guida, passaporti e altri documenti simili in modo che l'azienda possa verificarli in modo efficiente prima di fornire servizi e vantaggi.

di esempio degli Stati Uniti. Patente di guida elaborata con Document Intelligence Studio

Immagine di una patente di guida di esempio.

Estrazione dei dati

Il servizio ID predefinito estrae i valori chiave dai passaporti internazionali e patenti di guida USA e li restituisce in una risposta JSON strutturata e organizzata.

Esempio di patente di guida

Patente di guida di esempio

Esempio di passaporto

Esempio di passaporto

Opzioni di sviluppo

Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-anteprima) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di documento di identità Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v3. 1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di documento di identità Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di documento di identità Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse
Modello di documento di identità Strumento di etichettatura di Document Intelligence
API REST
Client-library SDK
Contenitore Docker di Document Intelligence

Requisiti di input

  • Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lettura
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-02-29-preview)
  • Per i formati PDF e TIFF, possono essere elaborate fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • La dimensione del file per l'analisi dei documenti è di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1GB con un massimo di 10.000 pagine.

  • Formati di file supportati: JPEG, PNG, PDF e TIFF.

  • Numero di pagine supportato per file PDF e TIFF: fino a 2.000 pagine o solo le prime due pagine per gli abbonati del livello gratuito.

  • Dimensioni del file supportate: meno di 50 MB TOTALI; pixel minimi: 50 x 50 px; pixel massimi 10.000 x 10.000 px.

Estrazione dati del modello di documento ID

Estrarre i dati, inclusi il nome, la data di nascita e la data di scadenza, dai documenti di identità. Sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Un'istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.

Screenshot della posizione di chiavi ed endpoint nel portale di Azure.

Nota

Document Intelligence Studio è disponibile con le API v3.1 e v3.0 e versioni successive.

  1. Nella home page di Document Intelligence Studio selezionare Documenti di identità.

  2. È possibile analizzare la fattura di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare Analizza opzioni:

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Document Intelligence Studio.

Strumento di etichettatura campioni di Document Intelligence

  1. Passare allo strumento di esempio di Document Intelligence.

  2. Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati.

    Screenshot dell'operazione di analisi dei risultati del modello di layout.

  3. Selezionare il Tipo di modulo da analizzare nel menu a discesa.

  4. Scegliere un URL per il file da analizzare dalle opzioni seguenti:

  5. Nel campo Origine selezionare URL nel menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.

    Screenshot del menu a discesa del percorso di origine.

  6. Nel campo endpoint servizio di Document Intelligence incollare l'endpoint ottenuto con l'abbonamento di Document Intelligence.

  7. Nel campo chiave incollare la chiave ottenuta dalla risorsa di Document Intelligence.

    Screenshot del menu a discesa di Seleziona tipo di documento.

  8. Selezionare Esegui analisi. Lo Strumento di etichettatura campioni di Document Intelligence chiama l'API Analyze Prebuilt e analizza il documento.

  9. Visualizzare i risultati: esaminare le coppie chiave-valore estratte, le voci, il testo evidenziato estratto e le tabelle rilevate.

    Screenshot dell'operazione di analisi dei risultati del modello di identità.

  10. Scaricare il file di output JSON per visualizzare i risultati dettagliati.

    • Il nodo "readResults" contiene ogni riga di testo con il rispettivo posizionamento del rettangolo di selezione nella pagina.
    • Il nodo "selectionMarks" mostra ogni indicatore di selezione (casella di controllo, indicatore di opzione) e se il relativo stato è selezionato o deselezionato.
    • La sezione "pageResults" include le tabelle estratte. Per ogni tabella, Document Intelligence estrae il testo, la riga e l'indice di colonna, la riga e la colonna che si estende, il rettangolo delimitatore e altro ancora.
    • Il campo "documentResults" contiene informazioni sulle coppie chiave-valore e informazioni sulle voci per le parti più pertinenti del documento.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Questa è una limitazione dello strumento non del servizio Document Intelligence.

Tipi di documenti supportati

Area Tipi di documento
Tutto il mondo Passaporto (a libretto e a tessera)
Stati Uniti Patente di guida, tessera di identificazione, permesso di residenza (Green Card), tessera di previdenza sociale, ID militare
Europa Patente di guida, carta d'identità, permesso di soggiorno
India Patente di guida, tessera PAN, tessera Aadhaar
Canada Patente di guida, tessera di identificazione, permesso di residenza (Maple Card)
Australia Patente di guida, tessera fotografica, ID scheda foto, ID Keypass (inclusa la versione digitale)

Estrazione dei campi

Di seguito sono riportati i campi estratti per tipo di documento. Il modello ID prebuilt-idDocument di Document Intelligence estrae i seguenti campi in documents.*.fields. L'output JSON include tutto il testo estratto in documenti, parole, righe e stili.

idDocument.driverLicense

Campo Tipo Descrizione Esempio
CountryRegion countryRegion Codice Paese o area geografica USA
Region string Stato/regione o provincia Washington
DocumentNumber string Numero di patente di guida WDLABCD456DG
DocumentDiscriminator string Discriminatore del documento di patente di guida 12645646464554646456464544
FirstName string Nome proprio e iniziale del secondo nome, se applicabile LIAM R.
LastName string Surname TALBOT
Address address Address 123 INDIRIZZO CITTÀ WA 99999-1234
DateOfBirth date Data di nascita 06/01/1958
DateOfExpiration date Data di scadenza 12/08/2020
DateOfIssue date Data del problema 12/08/2012
EyeColor string Colore occhi Blu
HairColor string Colore dei capelli Marrone
Height string Altezza 5'11"
Weight string Peso 185LB
Sex string Sex M
Endorsements string Approvazioni L
Restrictions string Restrizioni G
VehicleClassifications string Classificazione veicolo D

idDocument.passport

Campo Tipo Descrizione Esempio
DocumentNumber string Numero passaporto 340020013
FirstName string Nome proprio e iniziale del secondo nome, se applicabile JENNIFER
MiddleName string Nome compreso tra nome proprio e cognome REYES
LastName string Surname BROOKS
Aliases array
Aliases.* string Noto anche come MAT LIN
DateOfBirth date Data di nascita 1980-01-01
DateOfExpiration date Data di scadenza 05/05/2019
DateOfIssue date Data del problema 06/05/2014
Sex string Sex F
CountryRegion countryRegion Paese o organizzazione emittente USA
DocumentType string Tipo di documento P
Nationality countryRegion Nazionalità USA
PlaceOfBirth string Luogo di nascita MASSACHUSETTS, U.S.A.
PlaceOfIssue string Luogo di emissione LISBON
IssuingAuthority string Autorità emittente Dipartimento di Stato degli Stati Uniti
PersonalNumber string ID personale. No. A234567893
MachineReadableZone object Zona leggibile dal computer (MRZ) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string Nome proprio e iniziale del secondo nome, se applicabile JENNIFER
MachineReadableZone.LastName string Surname BROOKS
MachineReadableZone.DocumentNumber string Numero passaporto 340020013
MachineReadableZone.CountryRegion countryRegion Paese o organizzazione emittente USA
MachineReadableZone.Nationality countryRegion Nazionalità USA
MachineReadableZone.DateOfBirth date Data di nascita 1980-01-01
MachineReadableZone.DateOfExpiration date Data di scadenza 05/05/2019
MachineReadableZone.Sex string Sex F

idDocument.nationalIdentityCard

Campo Tipo Descrizione Esempio
CountryRegion countryRegion Codice Paese o area geografica USA
Region string Stato/regione o provincia Washington
DocumentNumber string Numero di carta di identità nazionale WDLABCD456DG
DocumentDiscriminator string Discriminazione del documento di carta di identità nazionale 12645646464554646456464544
FirstName string Nome proprio e iniziale del secondo nome, se applicabile LIAM R.
LastName string Surname TALBOT
Address address Address 123 INDIRIZZO CITTÀ WA 99999-1234
DateOfBirth date Data di nascita 06/01/1958
DateOfExpiration date Data di scadenza 12/08/2020
DateOfIssue date Data del problema 12/08/2012
EyeColor string Colore occhi BLU
HairColor string Colore dei capelli BROWN
Height string Altezza 5'11"
Weight string Peso 185LB
Sex string Sex M

idDocument.residencePermit

Campo Tipo Descrizione Esempio
CountryRegion countryRegion Codice Paese o area geografica USA
DocumentNumber string Numero di permesso di residenza WDLABCD456DG
FirstName string Nome proprio e iniziale del secondo nome, se applicabile LIAM R.
LastName string Surname TALBOT
DateOfBirth date Data di nascita 06/01/1958
DateOfExpiration date Data di scadenza 12/08/2020
DateOfIssue date Data del problema 12/08/2012
Sex string Sex M
PlaceOfBirth string Luogo di nascita Germania
Category string Categoria permesso DV2
Address string Address 123 INDIRIZZO CITTÀ WA 99999-1234

idDocument.usSocialSecurityCard

Campo Tipo Descrizione Esempio
DocumentNumber string Numero di tessera di previdenza sociale WDLABCD456DG
FirstName string Nome proprio e iniziale del secondo nome, se applicabile LIAM R.
LastName string Surname TALBOT
DateOfIssue date Data del problema 12/08/2012

idDocument

Campo Tipo Descrizione Esempio
Address address Address 123 INDIRIZZO CITTÀ WA 99999-1234
DocumentNumber string Numero di patente di guida WDLABCD456DG
FirstName string Nome proprio e iniziale del secondo nome, se applicabile LIAM R.
LastName string Surname TALBOT
DateOfBirth date Data di nascita 06/01/1958
DateOfExpiration date Data di scadenza 12/08/2020

Tipi di documenti supportati

Il modello di documento d'identità supporta attualmente le patenti di guida statunitensi e la pagina biografica dei passaporti internazionali (esclusi i visti e altri documenti di viaggio).

Campi estratti

Nome Tipo Descrizione Valore
Country country Codice paese conforme allo standard ISO 3166 "USA"
DateOfBirth data DOB in formato AAAA-MM-GG "1980-01-01"
DateOfExpiration data Data di scadenza nel formato AAAA-MM-GG "2019-05-05"
DocumentNumber string Numero di passaporto pertinente, numero di patente di guida e così via. "340020013"
Nome string Nome proprio e iniziale del secondo nome estratti, se applicabile "JENNIFER"
Cognome string Cognome estratto "BROOKS"
Nazionalità country Codice paese conforme allo standard ISO 3166 "USA"
Sex sesso I possibili valori estratti includono "M" "F" "X" "F"
MachineReadableZone oggetto Zona MRZ del passaporto estratta, con due righe di 44 caratteri ciascuno "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string Tipo di documento, ad esempio passaporto, patente di guida "passport"
Address string Indirizzo estratto (solo patente di guida) "123 INDIRIZZO CITTÀ WA 99999-1234"
Area string Area, stato, provincia e così via estratti. (solo patente di guida) "Washington"

Guida alla migrazione

Passaggi successivi