Modello di documento id intelligence documento
Importante
- Le versioni di anteprima pubblica di Document Intelligence consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
- Le funzionalità, gli approcci e i processi possono cambiare, prima della disponibilità generale, in base al feedback degli utenti.
- La versione di anteprima pubblica delle librerie client di Document Intelligence per impostazione predefinita è l'API REST versione 2024-02-29-preview.
- L'anteprima pubblica versione 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
- Stati Uniti orientali
- Stati Uniti occidentali2
- Europa occidentale
Questo contenuto si applica a:v4.0 (anteprima) | Versioni precedenti:v3.1 (GA)v3.0 (GA)v2.1 (GA)
Questo contenuto si applica a:v3.1 (GA) | Versione più recente:v4.0 (anteprima) | Versioni precedenti:v3.0v2.1
Questo contenuto si applica a:v3.0 (GA) | Versioni più recenti:v4.0 (anteprima)v3.1 | Versione precedente:v2.1
Questo contenuto si applica a:v2.1 | Versione più recente:v4.0 (anteprima)
Il modello document intelligence identity document (ID) combina il riconoscimento ottico dei caratteri (OCR) con i modelli di Deep Learning per analizzare ed estrarre informazioni chiave dai documenti di identità. L'API analizza i documenti di identità (inclusi i seguenti) e restituisce una rappresentazione di dati JSON strutturata:
- Libro passaporto, carta passaporto in tutto il mondo
- Patente di guida da Stati Uniti, Europa, India, Canada e Australia
- Stati Uniti carte di identificazione, permesso di residenza (carta verde), carta di sicurezza sociale, ID militare
- Carte di identificazione europee, permessi di residenza
- Scheda PAN india, scheda Aadhaar
- Carte di identificazione canada, permesso di residenza (carta mappa)
- Scheda foto Australia, ID pass chiave (inclusa la versione digitale)
Document Intelligence può analizzare ed estrarre informazioni dai documenti di identificazione rilasciati da enti pubblici usando il modello di ID predefinito. Combina le nostre potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con funzionalità di riconoscimento ID per estrarre le informazioni chiave da Passport in tutto il mondo e licenze di driver statunitensi (tutti i 50 stati e D.C.). L'API ID estrae informazioni chiave da questi documenti di identità, ad esempio nome, cognome, data di nascita, numero di documento e altro ancora. Questa API è disponibile in Document Intelligence v2.1 come servizio cloud.
Elaborazione dei documenti di identità
L'elaborazione dei documenti di identità comporta l'estrazione dei dati dai documenti di identità manualmente o tramite la tecnologia basata su OCR. L'elaborazione dei documenti ID è un passaggio importante in qualsiasi operazione aziendale che richiede la prova dell'identità. Ad esempio, la verifica dei clienti in banche e altre istituzioni finanziarie, le domande di mutuo, le visite mediche, l'elaborazione delle richieste, l'industria dell'ospitalità e altro ancora. Gli individui forniscono una prova della loro identità tramite patenti di guida, passaporti e altri documenti simili in modo che l'azienda possa verificarli in modo efficiente prima di fornire servizi e vantaggi.
Licenza del driver statunitense di esempio elaborata con Document Intelligence Studio
Estrazione dei dati
Il servizio ID predefinito estrae i valori chiave dai passaporti mondiali e dalle licenze del driver degli Stati Uniti e li restituisce in una risposta JSON strutturata organizzata.
Esempio di licenza del conducente
Esempio di Passport
Opzioni di sviluppo
Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di documento ID | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di documento ID | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di documento ID | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse |
---|---|
Modello di documento ID | • Strumento di etichettatura di Document Intelligence• API REST• SDK della libreria client• Contenitore Docker di Document Intelligence |
Requisiti di input
Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-02-29-preview) Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa
8
-point text a 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training del modello di estrazione personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
pari a un massimo di 10.000 pagine.
Formati di file supportati: JPEG, PNG, PDF e TIFF.
Numero supportato di pagine per file PDF e TIFF: fino a 2.000 pagine o solo le prime due pagine per i sottoscrittori di livello gratuito.
Dimensioni del file supportate: meno di 50 MB TOTALI; pixel minimi: 50 x 50 px; pixel massimi 10.000 x 10.000 px.
Estrazione dei dati del modello di documento ID
Estrarre dati, inclusi il nome, la data di nascita e la data di scadenza, dai documenti ID. Sono necessarie le risorse seguenti:
Una sottoscrizione di Azure: è possibile crearne una gratuitamente.
Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (
F0
). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.
Nota
Document Intelligence Studio è disponibile con le API v3.1 e v3.0 e versioni successive.
Nella home page di Document Intelligence Studio selezionare Documenti di identità.
È possibile analizzare la fattura di esempio o caricare i propri file.
Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:
Strumento di etichettatura di esempio di Document Intelligence
Passare allo strumento di esempio di intelligence per i documenti.
Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati .
Selezionare il tipo di modulo da analizzare dal menu a discesa.
Scegliere un URL per il file da analizzare dalle opzioni seguenti:
- Documento di fattura di esempio.
- Documento ID di esempio.
- Immagine della ricevuta di esempio.
- Immagine del biglietto da visita di esempio.
Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.
Nel campo Document Intelligence Service Endpoint (Endpoint servizio Document Intelligence) incollare l'endpoint ottenuto con la sottoscrizione di Document Intelligence.
Nel campo chiave incollare la chiave ottenuta dalla risorsa di Intelligence documenti.
Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Analisi intelligence dei documenti chiama l'API predefinita Analizza e analizza il documento.
Visualizzare i risultati: vedere le coppie chiave-valore estratte, voci, testo evidenziato estratto e tabelle rilevate.
Scaricare il file di output JSON per visualizzare i risultati dettagliati.
- Il nodo "readResults" contiene ogni riga di testo con il rispettivo posizionamento del rettangolo delimitatore nella pagina.
- Il nodo "selectionMarks" mostra ogni segno di selezione (casella di controllo, segno di opzione) e se lo stato è selezionato o deselezionato.
- La sezione "pageResults" include le tabelle estratte. Per ogni tabella, Document Intelligence estrae il testo, la riga e l'indice di colonna, la riga e la colonna che si estende, il rettangolo delimitatore e altro ancora.
- Il campo "documentResults" contiene informazioni sulle coppie chiave/valore e informazioni sugli elementi di riga per le parti più rilevanti del documento.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Di intelligence dei documenti.
Tipi di documenti supportati
Area | Tipi di documento |
---|---|
Tutto il mondo | Passport Book, Passport Card |
Stati Uniti | Patente di guida, carta di identificazione, permesso di residenza (carta verde), carta di sicurezza sociale, ID militare |
Europa | Patente di guida, carta di identificazione, permesso di residenza |
India | Patente di guida, scheda PAN, scheda Aadhaar |
Canada | Patente di guida, carta di identificazione, permesso di residenza (carta maple) |
Australia | Patente di guida, scheda foto, ID pass chiave (inclusa la versione digitale) |
Estrazione dei campi
Di seguito sono riportati i campi estratti per tipo di documento. Il modello prebuilt-idDocument
document intelligence ID estrae i campi seguenti in documents.*.fields
. L'output json include tutto il testo estratto nei documenti, parole, righe e stili.
idDocument.driverLicense
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
CountryRegion |
countryRegion |
Codice paese o area geografica | USA |
Region |
string |
Stato/regione o provincia | Washington |
DocumentNumber |
string |
Numero di licenza del driver | WDLABCD456DG |
DocumentDiscriminator |
string |
Discriminazione del documento di patente di guida | 12645646464554646456464544 |
FirstName |
string |
Nome e secondo nome specificati, se applicabile | LIAM R. |
LastName |
string |
Surname | TALBOT |
Address |
address |
Indirizzo | 123 STR edizione Enterprise T ADDRESS YOUR CITY WA 99999-1234 |
DateOfBirth |
date |
Data di nascita | 01/06/1958 |
DateOfExpiration |
date |
Data di scadenza | 08/12/2020 |
DateOfIssue |
date |
Data del problema | 08/12/2012 |
EyeColor |
string |
Colore degli occhi | Blu |
HairColor |
string |
Colore dei capelli | Marrone |
Height |
string |
Altezza | 5'11" |
Weight |
string |
Weight | 185LB |
Sex |
string |
Sex | M |
Endorsements |
string |
Approvazioni | L |
Restrictions |
string |
Restrizioni | G |
VehicleClassifications |
string |
Classificazione dei veicoli | D |
idDocument.passport
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
DocumentNumber |
string |
Numero passaporto | 340020013 |
FirstName |
string |
Nome e secondo nome specificati, se applicabile | JENNIFER |
MiddleName |
string |
Nome tra nome e cognome specificati | REYES |
LastName |
string |
Surname | BROOKS |
Aliases |
array |
||
Aliases.* |
string |
Noto anche come | MAT LIN |
DateOfBirth |
date |
Data di nascita | 1980-01-01 |
DateOfExpiration |
date |
Data di scadenza | 2019-05-05 |
DateOfIssue |
date |
Data del problema | 2014-05-06 |
Sex |
string |
Sex | F |
CountryRegion |
countryRegion |
Paese o organizzazione emittente | USA |
DocumentType |
string |
Tipo di documento | P |
Nationality |
countryRegion |
Nazionalità | USA |
PlaceOfBirth |
string |
Luogo di nascita | MASSACHU edizione Standard TTS, Stati Uniti |
PlaceOfIssue |
string |
Posizione del problema | LISBONA |
IssuingAuthority |
string |
Autorità emittente | Stati Uniti Dipartimento di Stato |
PersonalNumber |
string |
ID personale. No. | A234567893 |
MachineReadableZone |
object |
Area leggibile del computer (MRZ) | P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816 |
MachineReadableZone.FirstName |
string |
Nome e secondo nome specificati, se applicabile | JENNIFER |
MachineReadableZone.LastName |
string |
Surname | BROOKS |
MachineReadableZone.DocumentNumber |
string |
Numero passaporto | 340020013 |
MachineReadableZone.CountryRegion |
countryRegion |
Paese o organizzazione emittente | USA |
MachineReadableZone.Nationality |
countryRegion |
Nazionalità | USA |
MachineReadableZone.DateOfBirth |
date |
Data di nascita | 1980-01-01 |
MachineReadableZone.DateOfExpiration |
date |
Data di scadenza | 2019-05-05 |
MachineReadableZone.Sex |
string |
Sex | F |
idDocument.nationalIdentityCard
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
CountryRegion |
countryRegion |
Codice paese o area geografica | USA |
Region |
string |
Stato/regione o provincia | Washington |
DocumentNumber |
string |
Numero di carta di identità nazionale | WDLABCD456DG |
DocumentDiscriminator |
string |
Discriminazione del documento di carta di identità nazionale | 12645646464554646456464544 |
FirstName |
string |
Nome e secondo nome specificati, se applicabile | LIAM R. |
LastName |
string |
Surname | TALBOT |
Address |
address |
Indirizzo | 123 STR edizione Enterprise T ADDRESS YOUR CITY WA 99999-1234 |
DateOfBirth |
date |
Data di nascita | 01/06/1958 |
DateOfExpiration |
date |
Data di scadenza | 08/12/2020 |
DateOfIssue |
date |
Data del problema | 08/12/2012 |
EyeColor |
string |
Colore degli occhi | BLU |
HairColor |
string |
Colore dei capelli | MARRONE |
Height |
string |
Altezza | 5'11" |
Weight |
string |
Weight | 185LB |
Sex |
string |
Sex | M |
idDocument.residencePermit
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
CountryRegion |
countryRegion |
Codice paese o area geografica | USA |
DocumentNumber |
string |
Numero di permesso di residenza | WDLABCD456DG |
FirstName |
string |
Nome e secondo nome specificati, se applicabile | LIAM R. |
LastName |
string |
Surname | TALBOT |
DateOfBirth |
date |
Data di nascita | 01/06/1958 |
DateOfExpiration |
date |
Data di scadenza | 08/12/2020 |
DateOfIssue |
date |
Data del problema | 08/12/2012 |
Sex |
string |
Sex | M |
PlaceOfBirth |
string |
Luogo di nascita | Germania |
Category |
string |
Consenti categoria | DV2 |
Address |
string |
Indirizzo | 123 STR edizione Enterprise T ADDRESS YOUR CITY WA 99999-1234 |
idDocument.usSocialSecurityCard
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
DocumentNumber |
string |
Numero di carta di previdenza sociale | WDLABCD456DG |
FirstName |
string |
Nome e secondo nome specificati, se applicabile | LIAM R. |
LastName |
string |
Surname | TALBOT |
DateOfIssue |
date |
Data del problema | 08/12/2012 |
idDocument
Campo | Tipo | Descrizione | Esempio |
---|---|---|---|
Address |
address |
Indirizzo | 123 STR edizione Enterprise T ADDRESS YOUR CITY WA 99999-1234 |
DocumentNumber |
string |
Numero di licenza del driver | WDLABCD456DG |
FirstName |
string |
Nome e secondo nome specificati, se applicabile | LIAM R. |
LastName |
string |
Surname | TALBOT |
DateOfBirth |
date |
Data di nascita | 01/06/1958 |
DateOfExpiration |
date |
Data di scadenza | 08/12/2020 |
Tipi di documenti supportati
Il modello di documento ID supporta attualmente le patenti di guida statunitensi e la pagina biografica dei passaporti internazionali (esclusi i visti e altri documenti di viaggio).
Campi estratti
Nome | Tipo | Descrizione | Valore |
---|---|---|---|
Country | country | Codice paese conforme allo standard ISO 3166 | "USA" |
DateOfBirth | data | DOB in formato AAAA-MM-GG | "1980-01-01" |
DateOfExpiration | data | Data di scadenza nel formato AAAA-MM-GG | "2019-05-05" |
DocumentNumber | string | Numero di passaporto pertinente, numero di patente del conducente e così via. | "340020013" |
Nome | string | Estratto nome e secondo valore iniziale, se applicabile | "JENNIFER" |
Cognome | string | Cognome estratto | "BROOKS" |
Nazionalità | country | Codice paese conforme allo standard ISO 3166 | "USA" |
Sex | sesso | I valori estratti possibili includono "M" "F" "X" | "F" |
MachineReadableZone | oggetto | Estratto Passport MRZ, incluse due righe di 44 caratteri ciascuno | "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
DocumentType | string | Tipo di documento, ad esempio Passport, Patente di Guida | "passport" |
Indirizzo | string | Indirizzo estratto (solo patente) | "123 STR edizione Enterprise T ADDRESS YOUR CITY WA 99999-1234" |
Area | string | Area estratta, stato, provincia e così via (solo patente) | "Washington" |
Guida alla migrazione
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Document Intelligence.
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.