Modello di documento di identità di Azure Riconoscimento modulo
Questo articolo si applica a:Riconoscimento modulo v3.0. Versione precedente:Riconoscimento modulo v2.1
Questo articolo si applica a:Riconoscimento modulo v2.1. Versione successiva:Riconoscimento modulo v3.0
Riconoscimento modulo modello identity document (ID) combina il riconoscimento ottico dei caratteri (OCR) con i modelli di deep learning per analizzare ed estrarre informazioni chiave da documenti di identità come licenze per i driver statunitensi (tutti i 50 stati e distretto della Columbia), pagine biografiche di passaporto internazionale, ID stato degli Stati Uniti, carte di previdenza sociale e carte residenti permanenti e altro ancora. L'API analizza i documenti di identità, estrae le informazioni chiave e restituisce una rappresentazione di dati JSON strutturata.
Azure Riconoscimento modulo può analizzare ed estrarre informazioni da documenti di identificazione rilasciati da enti pubblici usando il modello di ID predefinito. Combina le nostre potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con funzionalità di riconoscimento ID per estrarre informazioni chiave da Passport in tutto il mondo e licenze di driver degli Stati Uniti (tutti i 50 stati e D.C.). L'API ID estrae informazioni chiave da questi documenti di identità, ad esempio nome, cognome, data di nascita, numero di documento e altro ancora. Questa API è disponibile nel Riconoscimento modulo v2.1 come servizio cloud.
Elaborazione dei documenti di identità
L'elaborazione dei documenti di identità comporta l'estrazione dei dati dai documenti di identità manualmente o tramite la tecnologia basata su OCR. Il documento ID elabora un passaggio importante in qualsiasi processo aziendale che richiede una prova di identità. Gli esempi includono la verifica dei clienti in banche e altre istituzioni finanziarie, applicazioni ipotecarie, visite mediche, trattamento delle richieste, settore dell'ospitalità e altro ancora. Le persone forniscono una prova della propria identità tramite patenti di guida, passaporti e altri documenti simili in modo che l'azienda possa verificarli in modo efficiente prima di fornire servizi e vantaggi.
Licenza del driver U.S. di esempio elaborata con Riconoscimento modulo Studio
Estrazione dei dati
Il servizio ID predefinito estrae i valori chiave dai passaporti mondiali e dalle licenze del driver degli Stati Uniti e li restituisce in una risposta JSON strutturata organizzata.
Esempio di patente di guida
Esempio di Passport
Opzioni di sviluppo
Gli strumenti seguenti sono supportati da Riconoscimento modulo v3.0:
Funzionalità | Risorse | ID modello |
---|---|---|
Modello di documento ID | prebuilt-idDocument |
Gli strumenti seguenti sono supportati da Riconoscimento modulo v2.1:
Funzionalità | Risorse |
---|---|
Modello di documento ID |
Requisiti di input
Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.
Formati di file supportati:
Modellare PDF Immagine:
JPEG/JPG, PNG, BMP e TIFFMicrosoft Office:
Word (DOCX), Excel (XLS), PowerPoint (PPT) e HTMLLettura ✔ ✔ ✱ versione dell'API REST 2022/06/30-preview
Layout ✔ ✔ Documento generale ✔ ✔ Predefinita ✔ ✔ Personalizzato ✔ ✔ ✱ i file di Microsoft Office non sono attualmente supportati per altri modelli o versioni.
Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti devono essere inferiori a 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.
Le dimensioni PDF sono fino a 17 x 17 pollici, corrispondenti alle dimensioni di carta Legal o A3 o più piccole.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine di 1024 x 768 pixel. Questa dimensione corrisponde a circa 8 punti di testo a 150 punti per pollice (DPI).
Per il training del modello personalizzato, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training del modello personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.
- Formati di file supportati: JPEG, PNG, PDF e TIFF
- Per PDF e TIFF, vengono elaborate fino a 2000 pagine. Per i sottoscrittori del livello gratuito, vengono elaborate solo le prime due pagine.
- Le dimensioni del file devono essere inferiori a 50 MB e dimensioni di almeno 50 x 50 pixel e al massimo 10.000 x 10.000 pixel.
Provare Riconoscimento modulo
Estrarre dati, tra cui nome, data di nascita e data di scadenza, dai documenti ID. Sono necessarie le risorse seguenti:
Una sottoscrizione di Azure: è possibile crearne una gratuitamente
Istanza di Riconoscimento modulo nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (
F0
). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.
Riconoscimento modulo Studio
Nota
Riconoscimento modulo Studio è disponibile con l'API v3.0 (versione API 2022-08-31 disponibile a livello generale)
Nella home page di Riconoscimento modulo Studio selezionare Documenti di identità
È possibile analizzare la fattura di esempio o selezionare il pulsante + Aggiungi per caricare il proprio esempio.
Selezionare il pulsante Analizza :
Riconoscimento modulo strumento di etichettatura di esempio
Passare allo strumento di esempio Riconoscimento modulo.
Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati .
Selezionare il tipo di modulo da analizzare dal menu a discesa.
Scegliere un URL per il file da analizzare dalle opzioni seguenti:
Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera .
Nel campo Endpoint servizio riconoscimento modulo incollare l'endpoint ottenuto con la sottoscrizione Riconoscimento modulo.
Nel campo chiave incollare la chiave ottenuta dalla risorsa Riconoscimento modulo.
Selezionare Esegui analisi. Lo strumento di etichettatura di esempio Riconoscimento modulo chiamerà l'API Analizza predefinita e analizzerà il documento.
Visualizzare i risultati: vedere le coppie chiave-valore estratte, voci, testo evidenziato estratto e tabelle rilevate.
Scaricare il file di output JSON per visualizzare i risultati dettagliati.
- Il nodo "readResults" contiene ogni riga di testo con il rispettivo posizionamento del riquadro nella pagina.
- Il nodo "selectionMarks" visualizza ogni segno di selezione (casella di controllo, segno di opzione) e se lo stato è "selezionato" o "deselezionato".
- La sezione "pageResults" include le tabelle estratte. Per ogni tabella, vengono estratti il testo, l'indice di riga e di colonna, la riga e la colonna, il rettangolo di selezione e altro ancora.
- Il campo "documentResults" contiene informazioni sulle coppie chiave/valore e informazioni sugli elementi di riga per le parti più rilevanti del documento.
Nota
Lo strumento Di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Riconoscimento modulo.
Lingue e impostazioni locali supportate
Nota
Non è necessario specificare le impostazioni locali. Questo parametro è facoltativo. La tecnologia di deep learning Riconoscimento modulo rileverà automaticamente la lingua del testo nell'immagine.
Modellare | Lingua: codice delle impostazioni locali | Predefinito |
---|---|---|
Documento di identità |
|
Inglese (Stati Uniti)- en-US |
Estrazione di campi
Di seguito sono riportati i campi estratti per tipo di documento. Il modello prebuilt-idDocument
ID di Azure Riconoscimento modulo estrae i campi seguenti in documents.*.fields
. Estrae anche tutto il testo nei documenti, parole, righe e stili inclusi nell'output JSON nelle diverse sezioni.
Nota
Oltre a specificare il modello IdDocument, è possibile designare il tipo di ID per (patente di guida, passaporto, carta di identità nazionale, permesso di residenza o carta di previdenza sociale degli Stati Uniti).
Estrazione dei dati (tutti i tipi)
ID modello | Estrazione del testo | Rilevamento della lingua | Segni di selezione | Tabelle | Paragrafi | Struttura | Coppie chiave-valore | Fields |
---|---|---|---|---|---|---|---|---|
prebuilt-idDocument | ✓ | ✓ | ✓ |
Tipo di documento : idDocument.driverLicense
campi estratti
Campo | Type | Descrizione | Esempio |
---|---|---|---|
CountryRegion |
countryRegion |
Codice paese o area geografica | USA |
Region |
string |
Stato o provincia | Washington |
DocumentNumber |
string |
Numero di licenza del conducente | WDLABCD456DG |
DocumentDiscriminator |
string |
Discriminazione del documento di patente di guida | 12645646464554646456464544 |
FirstName |
string |
Nome e secondo iniziali specificati, se applicabile | LIAM R. |
LastName |
string |
Surname | TALBOT |
Address |
address |
Indirizzo | 123 VIA ADDRESS YOUR CITY WA 99999-1234 |
DateOfBirth |
date |
Data di nascita | 01/06/1958 |
DateOfExpiration |
date |
Data di scadenza | 08/12/2020 |
DateOfIssue |
date |
Data del problema | 08/12/2012 |
EyeColor |
string |
Colore degli occhi | BLU |
HairColor |
string |
Colore dei capelli | Fra' |
Height |
string |
Altezza | 5'11" |
Weight |
string |
Peso | 185LB |
Sex |
string |
Sex | M |
Endorsements |
string |
Approvazioni | L |
Restrictions |
string |
Restrizioni | B |
VehicleClassifications |
string |
Classificazione dei veicoli | D |
Tipo di documento : idDocument.passport
campi estratti
Campo | Type | Descrizione | Esempio |
---|---|---|---|
DocumentNumber |
string |
Numero di passaporto | 340020013 |
FirstName |
string |
Nome e secondo iniziali specificati, se applicabile | JENNIFER |
MiddleName |
string |
Nome tra il nome e il cognome specificati | REYES |
LastName |
string |
Surname | BROOKS |
Aliases |
array |
||
Aliases.* |
string |
Noto anche come | MAY LIN |
DateOfBirth |
date |
Data di nascita | 1980-01-01 |
DateOfExpiration |
date |
Data di scadenza | 2019-05-05 |
DateOfIssue |
date |
Data del problema | 2014-05-06 |
Sex |
string |
Sex | F |
CountryRegion |
countryRegion |
Paese o organizzazione emittente | USA |
DocumentType |
string |
Document type | P |
Nationality |
countryRegion |
Nationality | USA |
PlaceOfBirth |
string |
Luogo di nascita | MASSACHUSETTS, Stati Uniti. |
PlaceOfIssue |
string |
Luogo del problema | LA PAZ |
IssuingAuthority |
string |
Autorità di emissione | Stati Uniti Dipartimento di Stato |
PersonalNumber |
string |
ID personale. No. | A234567893 |
MachineReadableZone |
object |
Area leggibile del computer (MRZ) | P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F190505471000307<715816 |
MachineReadableZone.FirstName |
string |
Nome e secondo iniziali specificati, se applicabile | JENNIFER |
MachineReadableZone.LastName |
string |
Surname | BROOKS |
MachineReadableZone.DocumentNumber |
string |
Numero di passaporto | 340020013 |
MachineReadableZone.CountryRegion |
countryRegion |
Paese o organizzazione emittente | USA |
MachineReadableZone.Nationality |
countryRegion |
Nationality | USA |
MachineReadableZone.DateOfBirth |
date |
Data di nascita | 1980-01-01 |
MachineReadableZone.DateOfExpiration |
date |
Data di scadenza | 2019-05-05 |
MachineReadableZone.Sex |
string |
Sex | F |
Tipo di documento : idDocument.nationalIdentityCard
campi estratti
Campo | Type | Descrizione | Esempio |
---|---|---|---|
CountryRegion |
countryRegion |
Codice paese o area geografica | USA |
Region |
string |
Stato o provincia | Washington |
DocumentNumber |
string |
Numero di carta di identità nazionale | WDLABCD456DG |
DocumentDiscriminator |
string |
Discriminatorio del documento di carta di identità nazionale | 12645646464554646456464544 |
FirstName |
string |
Nome e secondo iniziali specificati, se applicabile | LIAM R. |
LastName |
string |
Surname | TALBOT |
Address |
address |
Indirizzo | 123 VIA ADDRESS YOUR CITY WA 99999-1234 |
DateOfBirth |
date |
Data di nascita | 01/06/1958 |
DateOfExpiration |
date |
Data di scadenza | 08/12/2020 |
DateOfIssue |
date |
Data del problema | 08/12/2012 |
EyeColor |
string |
Colore degli occhi | BLU |
HairColor |
string |
Colore dei capelli | Fra' |
Height |
string |
Altezza | 5'11" |
Weight |
string |
Peso | 185LB |
Sex |
string |
Sex | M |
Tipo di documento : idDocument.residencePermit
campi estratti
Campo | Type | Descrizione | Esempio |
---|---|---|---|
CountryRegion |
countryRegion |
Codice paese o area geografica | USA |
DocumentNumber |
string |
Numero di permesso di residenza | WDLABCD456DG |
FirstName |
string |
Nome e secondo iniziali specificati, se applicabile | LIAM R. |
LastName |
string |
Surname | TALBOT |
DateOfBirth |
date |
Data di nascita | 01/06/1958 |
DateOfExpiration |
date |
Data di scadenza | 08/12/2020 |
DateOfIssue |
date |
Data del problema | 08/12/2012 |
Sex |
string |
Sex | M |
PlaceOfBirth |
string |
Luogo di nascita | Germania |
Category |
string |
Categoria consenti | DV2 |
Tipo di documento : idDocument.usSocialSecurityCard
campi estratti
Campo | Type | Descrizione | Esempio |
---|---|---|---|
DocumentNumber |
string |
Numero della carta di previdenza sociale | WDLABCD456DG |
FirstName |
string |
Nome e secondo iniziali specificati, se applicabile | LIAM R. |
LastName |
string |
Surname | TALBOT |
DateOfIssue |
date |
Data del problema | 08/12/2012 |
Tipo di documento - idDocument
campo estratto
Nome | Type | Descrizione | Output standardizzato |
---|---|---|---|
DateOfIssue | Data | Data di emissione | aaaa-mm-gg |
Altezza | string | Altezza del titolare. | |
Peso | string | Peso del supporto. | |
EyeColor | string | Colore degli occhi del titolare. | |
HairColor | string | Colore dei capelli del supporto. | |
DocumentDiscriminator | string | Il discriminatorio dei documenti è un codice di sicurezza che identifica dove e quando è stata rilasciata la licenza. | |
Approvazioni | string | Più privilegi di guida concessi a un conducente, ad esempio Motorcycle o School bus. | |
Restrizioni | string | Privilegi di guida limitati applicabili alle licenze sospese o revocate. | |
VehicleClassification | string | Tipi di veicoli che possono essere guidati da un conducente. | |
CountryRegion | countryRegion | Codice paese o area geografica conforme allo standard ISO 3166 | |
DateOfBirth | Data | Dob | aaaa-mm-gg |
DateOfExpiration | Data | Data di scadenza DOB | aaaa-mm-gg |
DocumentNumber | string | Numero di passaporto pertinente, numero di patente del conducente e così via. | |
FirstName | string | Nome estratto e secondo iniziale, se applicabile | |
LastName | string | Cognome estratto | |
Nationality | countryRegion | Codice paese o area geografica conforme allo standard ISO 3166 (solo Passport) | |
Sex | string | I valori estratti possibili includono "M", "F" e "X" | |
MachineReadableZone | Oggetto | Passport MRZ estratto, incluse due righe di 44 caratteri ciascuno | "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
DocumentType | string | Tipo di documento, ad esempio Passport, patente di guida, carta di previdenza sociale e altro ancora | "passport" |
Indirizzo | string | L'indirizzo estratto, l'indirizzo viene analizzato anche nei componenti: indirizzo, città, stato, paese, cap | |
Region | string | Area estratta, stato, provincia e così via (solo patente di guida) |
Tipi di documenti e impostazioni locali supportati
L'ID 2.1 predefinito estrae i valori delle chiavi da passport in tutto il mondo e le licenze dei driver statunitensi nelle impostazioni locali en-us .
Campi estratti
Nome | Type | Descrizione | valore |
---|---|---|---|
Paese | country | Codice paese conforme allo standard ISO 3166 | "USA" |
DateOfBirth | Data | DOB in formato AAAA-MM-GG | "1980-01-01" |
DateOfExpiration | Data | Data di scadenza nel formato AAAA-MM-GG | "2019-05-05" |
DocumentNumber | string | Numero di passaporto pertinente, numero di patente del conducente e così via. | "340020013" |
FirstName | string | Nome estratto e secondo iniziale, se applicabile | "JENNIFER" |
LastName | string | Cognome estratto | "BROOKS" |
Nationality | country | Codice paese conforme allo standard ISO 3166 | "USA" |
Sex | gender | I valori estratti possibili includono "M", "F" e "X" | "F" |
MachineReadableZone | object | Passport MRZ estratto, incluse due righe di 44 caratteri ciascuno | "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
DocumentType | string | Tipo di documento, ad esempio Passport, Patente di Guida | "passport" |
Indirizzo | string | Indirizzo estratto (solo patente di guida) | "123 VIA ADDRESS YOUR CITY WA 99999-1234" |
Region | string | Area estratta, stato, provincia e così via (solo patente di guida) | "Washington" |
Guida alla migrazione
- Seguire la guida alla migrazione Riconoscimento modulo v3.0 per informazioni su come usare la versione v3.0 nelle applicazioni e nei flussi di lavoro.
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Riconoscimento modulo Studio
Completare una guida introduttiva Riconoscimento modulo e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio Riconoscimento modulo
Completare una guida introduttiva Riconoscimento modulo e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.