Modello di documento di identità di Azure Riconoscimento modulo

Questo articolo si applica a:Riconoscimento modulo segno di spunta v3.0Riconoscimento modulo v3.0. Versione precedente:Riconoscimento modulo v2.1

Questo articolo si applica a:Riconoscimento modulo v2.1 segno di spuntaRiconoscimento modulo v2.1. Versione successiva:Riconoscimento modulo v3.0

Riconoscimento modulo modello identity document (ID) combina il riconoscimento ottico dei caratteri (OCR) con i modelli di deep learning per analizzare ed estrarre informazioni chiave da documenti di identità come licenze per i driver statunitensi (tutti i 50 stati e distretto della Columbia), pagine biografiche di passaporto internazionale, ID stato degli Stati Uniti, carte di previdenza sociale e carte residenti permanenti e altro ancora. L'API analizza i documenti di identità, estrae le informazioni chiave e restituisce una rappresentazione di dati JSON strutturata.

Azure Riconoscimento modulo può analizzare ed estrarre informazioni da documenti di identificazione rilasciati da enti pubblici usando il modello di ID predefinito. Combina le nostre potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con funzionalità di riconoscimento ID per estrarre informazioni chiave da Passport in tutto il mondo e licenze di driver degli Stati Uniti (tutti i 50 stati e D.C.). L'API ID estrae informazioni chiave da questi documenti di identità, ad esempio nome, cognome, data di nascita, numero di documento e altro ancora. Questa API è disponibile nel Riconoscimento modulo v2.1 come servizio cloud.

Elaborazione dei documenti di identità

L'elaborazione dei documenti di identità comporta l'estrazione dei dati dai documenti di identità manualmente o tramite la tecnologia basata su OCR. Il documento ID elabora un passaggio importante in qualsiasi processo aziendale che richiede una prova di identità. Gli esempi includono la verifica dei clienti in banche e altre istituzioni finanziarie, applicazioni ipotecarie, visite mediche, trattamento delle richieste, settore dell'ospitalità e altro ancora. Le persone forniscono una prova della propria identità tramite patenti di guida, passaporti e altri documenti simili in modo che l'azienda possa verificarli in modo efficiente prima di fornire servizi e vantaggi.

Licenza del driver U.S. di esempio elaborata con Riconoscimento modulo Studio

Immagine della patente di guida di esempio.

Estrazione dei dati

Il servizio ID predefinito estrae i valori chiave dai passaporti mondiali e dalle licenze del driver degli Stati Uniti e li restituisce in una risposta JSON strutturata organizzata.

Esempio di patente di guida

Patente di guida di esempio

Esempio di Passport

Passport di esempio

Opzioni di sviluppo

Gli strumenti seguenti sono supportati da Riconoscimento modulo v3.0:

Funzionalità Risorse ID modello
Modello di documento ID prebuilt-idDocument

Gli strumenti seguenti sono supportati da Riconoscimento modulo v2.1:

Funzionalità Risorse
Modello di documento ID

Requisiti di input

  • Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.

  • Formati di file supportati:

    Modellare PDF Immagine:
    JPEG/JPG, PNG, BMP e TIFF
    Microsoft Office:
    Word (DOCX), Excel (XLS), PowerPoint (PPT) e HTML
    Lettura versione dell'API REST
    2022/06/30-preview
    Layout
    Documento generale
    Predefinita
    Personalizzato

    ✱ i file di Microsoft Office non sono attualmente supportati per altri modelli o versioni.

  • Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti devono essere inferiori a 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.

  • Le dimensioni PDF sono fino a 17 x 17 pollici, corrispondenti alle dimensioni di carta Legal o A3 o più piccole.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine di 1024 x 768 pixel. Questa dimensione corrisponde a circa 8 punti di testo a 150 punti per pollice (DPI).

  • Per il training del modello personalizzato, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.

  • Per il training del modello personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.

  • Formati di file supportati: JPEG, PNG, PDF e TIFF
  • Per PDF e TIFF, vengono elaborate fino a 2000 pagine. Per i sottoscrittori del livello gratuito, vengono elaborate solo le prime due pagine.
  • Le dimensioni del file devono essere inferiori a 50 MB e dimensioni di almeno 50 x 50 pixel e al massimo 10.000 x 10.000 pixel.

Provare Riconoscimento modulo

Estrarre dati, tra cui nome, data di nascita e data di scadenza, dai documenti ID. Sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente

  • Istanza di Riconoscimento modulo nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.

Screenshot: chiavi e posizione dell'endpoint nel portale di Azure.

Riconoscimento modulo Studio

Nota

Riconoscimento modulo Studio è disponibile con l'API v3.0 (versione API 2022-08-31 disponibile a livello generale)

  1. Nella home page di Riconoscimento modulo Studio selezionare Documenti di identità

  2. È possibile analizzare la fattura di esempio o selezionare il pulsante + Aggiungi per caricare il proprio esempio.

  3. Selezionare il pulsante Analizza :

    Screenshot: menu di analisi del documento ID.

Riconoscimento modulo strumento di etichettatura di esempio

  1. Passare allo strumento di esempio Riconoscimento modulo.

  2. Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati .

    Screenshot dell'operazione di analisi dei risultati del modello di layout.

  3. Selezionare il tipo di modulo da analizzare dal menu a discesa.

  4. Scegliere un URL per il file da analizzare dalle opzioni seguenti:

  5. Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera .

    Screenshot del menu a discesa percorso di origine.

  6. Nel campo Endpoint servizio riconoscimento modulo incollare l'endpoint ottenuto con la sottoscrizione Riconoscimento modulo.

  7. Nel campo chiave incollare la chiave ottenuta dalla risorsa Riconoscimento modulo.

    Screenshot: selezionare il menu a discesa tipo di modulo.

  8. Selezionare Esegui analisi. Lo strumento di etichettatura di esempio Riconoscimento modulo chiamerà l'API Analizza predefinita e analizzerà il documento.

  9. Visualizzare i risultati: vedere le coppie chiave-valore estratte, voci, testo evidenziato estratto e tabelle rilevate.

    Screenshot dell'operazione di analisi dei risultati del modello di identità.

  10. Scaricare il file di output JSON per visualizzare i risultati dettagliati.

    • Il nodo "readResults" contiene ogni riga di testo con il rispettivo posizionamento del riquadro nella pagina.
    • Il nodo "selectionMarks" visualizza ogni segno di selezione (casella di controllo, segno di opzione) e se lo stato è "selezionato" o "deselezionato".
    • La sezione "pageResults" include le tabelle estratte. Per ogni tabella, vengono estratti il testo, l'indice di riga e di colonna, la riga e la colonna, il rettangolo di selezione e altro ancora.
    • Il campo "documentResults" contiene informazioni sulle coppie chiave/valore e informazioni sugli elementi di riga per le parti più rilevanti del documento.

Nota

Lo strumento Di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Riconoscimento modulo.

Lingue e impostazioni locali supportate

Nota

Non è necessario specificare le impostazioni locali. Questo parametro è facoltativo. La tecnologia di deep learning Riconoscimento modulo rileverà automaticamente la lingua del testo nell'immagine.

Modellare Lingua: codice delle impostazioni locali Predefinito
Documento di identità
  • Inglese (Stati Uniti)- en-US (patente di guida)
  • Pagine biografiche di passaporti
    internazionali (escluso il visto e altri documenti di viaggio)
  • Inglese (Stati Uniti)- en-US (ID stato)
  • Inglese (Stati Uniti)- en-US (carta di previdenza sociale)
  • Inglese (Stati Uniti)- en-US (carta residente permanente)

Inglese (Stati Uniti)- en-US

Estrazione di campi

Di seguito sono riportati i campi estratti per tipo di documento. Il modello prebuilt-idDocument ID di Azure Riconoscimento modulo estrae i campi seguenti in documents.*.fields. Estrae anche tutto il testo nei documenti, parole, righe e stili inclusi nell'output JSON nelle diverse sezioni.

Nota

Oltre a specificare il modello IdDocument, è possibile designare il tipo di ID per (patente di guida, passaporto, carta di identità nazionale, permesso di residenza o carta di previdenza sociale degli Stati Uniti).

Estrazione dei dati (tutti i tipi)

ID modello Estrazione del testo Rilevamento della lingua Segni di selezione Tabelle Paragrafi Struttura Coppie chiave-valore Fields
prebuilt-idDocument

Tipo di documento : idDocument.driverLicense campi estratti

Campo Type Descrizione Esempio
CountryRegion countryRegion Codice paese o area geografica USA
Region string Stato o provincia Washington
DocumentNumber string Numero di licenza del conducente WDLABCD456DG
DocumentDiscriminator string Discriminazione del documento di patente di guida 12645646464554646456464544
FirstName string Nome e secondo iniziali specificati, se applicabile LIAM R.
LastName string Surname TALBOT
Address address Indirizzo 123 VIA ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date Data di nascita 01/06/1958
DateOfExpiration date Data di scadenza 08/12/2020
DateOfIssue date Data del problema 08/12/2012
EyeColor string Colore degli occhi BLU
HairColor string Colore dei capelli Fra'
Height string Altezza 5'11"
Weight string Peso 185LB
Sex string Sex M
Endorsements string Approvazioni L
Restrictions string Restrizioni B
VehicleClassifications string Classificazione dei veicoli D

Tipo di documento : idDocument.passport campi estratti

Campo Type Descrizione Esempio
DocumentNumber string Numero di passaporto 340020013
FirstName string Nome e secondo iniziali specificati, se applicabile JENNIFER
MiddleName string Nome tra il nome e il cognome specificati REYES
LastName string Surname BROOKS
Aliases array
Aliases.* string Noto anche come MAY LIN
DateOfBirth date Data di nascita 1980-01-01
DateOfExpiration date Data di scadenza 2019-05-05
DateOfIssue date Data del problema 2014-05-06
Sex string Sex F
CountryRegion countryRegion Paese o organizzazione emittente USA
DocumentType string Document type P
Nationality countryRegion Nationality USA
PlaceOfBirth string Luogo di nascita MASSACHUSETTS, Stati Uniti.
PlaceOfIssue string Luogo del problema LA PAZ
IssuingAuthority string Autorità di emissione Stati Uniti Dipartimento di Stato
PersonalNumber string ID personale. No. A234567893
MachineReadableZone object Area leggibile del computer (MRZ) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F190505471000307<715816
MachineReadableZone.FirstName string Nome e secondo iniziali specificati, se applicabile JENNIFER
MachineReadableZone.LastName string Surname BROOKS
MachineReadableZone.DocumentNumber string Numero di passaporto 340020013
MachineReadableZone.CountryRegion countryRegion Paese o organizzazione emittente USA
MachineReadableZone.Nationality countryRegion Nationality USA
MachineReadableZone.DateOfBirth date Data di nascita 1980-01-01
MachineReadableZone.DateOfExpiration date Data di scadenza 2019-05-05
MachineReadableZone.Sex string Sex F

Tipo di documento : idDocument.nationalIdentityCard campi estratti

Campo Type Descrizione Esempio
CountryRegion countryRegion Codice paese o area geografica USA
Region string Stato o provincia Washington
DocumentNumber string Numero di carta di identità nazionale WDLABCD456DG
DocumentDiscriminator string Discriminatorio del documento di carta di identità nazionale 12645646464554646456464544
FirstName string Nome e secondo iniziali specificati, se applicabile LIAM R.
LastName string Surname TALBOT
Address address Indirizzo 123 VIA ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date Data di nascita 01/06/1958
DateOfExpiration date Data di scadenza 08/12/2020
DateOfIssue date Data del problema 08/12/2012
EyeColor string Colore degli occhi BLU
HairColor string Colore dei capelli Fra'
Height string Altezza 5'11"
Weight string Peso 185LB
Sex string Sex M

Tipo di documento : idDocument.residencePermit campi estratti

Campo Type Descrizione Esempio
CountryRegion countryRegion Codice paese o area geografica USA
DocumentNumber string Numero di permesso di residenza WDLABCD456DG
FirstName string Nome e secondo iniziali specificati, se applicabile LIAM R.
LastName string Surname TALBOT
DateOfBirth date Data di nascita 01/06/1958
DateOfExpiration date Data di scadenza 08/12/2020
DateOfIssue date Data del problema 08/12/2012
Sex string Sex M
PlaceOfBirth string Luogo di nascita Germania
Category string Categoria consenti DV2

Tipo di documento : idDocument.usSocialSecurityCard campi estratti

Campo Type Descrizione Esempio
DocumentNumber string Numero della carta di previdenza sociale WDLABCD456DG
FirstName string Nome e secondo iniziali specificati, se applicabile LIAM R.
LastName string Surname TALBOT
DateOfIssue date Data del problema 08/12/2012

Tipo di documento - idDocument campo estratto

Nome Type Descrizione Output standardizzato
DateOfIssue Data Data di emissione aaaa-mm-gg
Altezza string Altezza del titolare.
Peso string Peso del supporto.
EyeColor string Colore degli occhi del titolare.
HairColor string Colore dei capelli del supporto.
DocumentDiscriminator string Il discriminatorio dei documenti è un codice di sicurezza che identifica dove e quando è stata rilasciata la licenza.
Approvazioni string Più privilegi di guida concessi a un conducente, ad esempio Motorcycle o School bus.
Restrizioni string Privilegi di guida limitati applicabili alle licenze sospese o revocate.
VehicleClassification string Tipi di veicoli che possono essere guidati da un conducente.
CountryRegion countryRegion Codice paese o area geografica conforme allo standard ISO 3166
DateOfBirth Data Dob aaaa-mm-gg
DateOfExpiration Data Data di scadenza DOB aaaa-mm-gg
DocumentNumber string Numero di passaporto pertinente, numero di patente del conducente e così via.
FirstName string Nome estratto e secondo iniziale, se applicabile
LastName string Cognome estratto
Nationality countryRegion Codice paese o area geografica conforme allo standard ISO 3166 (solo Passport)
Sex string I valori estratti possibili includono "M", "F" e "X"
MachineReadableZone Oggetto Passport MRZ estratto, incluse due righe di 44 caratteri ciascuno "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string Tipo di documento, ad esempio Passport, patente di guida, carta di previdenza sociale e altro ancora "passport"
Indirizzo string L'indirizzo estratto, l'indirizzo viene analizzato anche nei componenti: indirizzo, città, stato, paese, cap
Region string Area estratta, stato, provincia e così via (solo patente di guida)

Tipi di documenti e impostazioni locali supportati

L'ID 2.1 predefinito estrae i valori delle chiavi da passport in tutto il mondo e le licenze dei driver statunitensi nelle impostazioni locali en-us .

Campi estratti

Nome Type Descrizione valore
Paese country Codice paese conforme allo standard ISO 3166 "USA"
DateOfBirth Data DOB in formato AAAA-MM-GG "1980-01-01"
DateOfExpiration Data Data di scadenza nel formato AAAA-MM-GG "2019-05-05"
DocumentNumber string Numero di passaporto pertinente, numero di patente del conducente e così via. "340020013"
FirstName string Nome estratto e secondo iniziale, se applicabile "JENNIFER"
LastName string Cognome estratto "BROOKS"
Nationality country Codice paese conforme allo standard ISO 3166 "USA"
Sex gender I valori estratti possibili includono "M", "F" e "X" "F"
MachineReadableZone object Passport MRZ estratto, incluse due righe di 44 caratteri ciascuno "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string Tipo di documento, ad esempio Passport, Patente di Guida "passport"
Indirizzo string Indirizzo estratto (solo patente di guida) "123 VIA ADDRESS YOUR CITY WA 99999-1234"
Region string Area estratta, stato, provincia e così via (solo patente di guida) "Washington"

Guida alla migrazione

Passaggi successivi