Modello di certificato di matrimonio di Document Intelligence

Questo contenuto si applica a:segno di spuntav4.0 (anteprima)segno di spunta

Il modello Document Intelligence Marriage Certificate usa potenti funzionalità di riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre campi chiave dai certificati di matrimonio. I certificati di matrimonio possono essere di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. L'API analizza il testo del documento; estrae informazioni chiave come nomi coniugi, data di emissione e luogo di matrimonio; e restituisce una rappresentazione di dati JSON strutturata. Il modello supporta attualmente i formati di documento in lingua inglese.

Elaborazione automatica dei certificati di matrimonio

L'elaborazione automatica dei certificati di matrimonio è il processo di estrazione dei campi chiave dai certificati di matrimonio. Storicamente, il processo di analisi del certificato di matrimonio viene ottenuto manualmente e, di conseguenza, molto dispendioso in termini di tempo. L'estrazione accurata dei dati chiave dai certificati di matrimonio è in genere il primo e uno dei passaggi più critici del processo di automazione dei certificati di matrimonio.

Opzioni di sviluppo

Document Intelligence v4.0 (2024-02-29-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
prebuilt-marriageCertificate.us Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-marriageCertificate.us

Requisiti di input

  • Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lettura
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-02-29-preview)
  • Per i formati PDF e TIFF, possono essere elaborate fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1GB con un massimo di 10.000 pagine.

Provare l'estrazione dei dati dei documenti del certificato di matrimonio

Per vedere come funziona l'estrazione dei dati per il servizio di carte del certificato di matrimonio, sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.

Screenshot delle chiavi e della posizione dell'endpoint nella portale di Azure.

Document Intelligence Studio

  1. Nella home page di Document Intelligence Studio selezionare Certificato di matrimonio.

  2. È possibile analizzare i certificati di matrimonio di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Document Intelligence Studio.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina Dei modelli predefiniti.

Estrazione di campi

Di seguito sono riportati i campi estratti da un certificato di matrimonio nella risposta di output JSON.

Nome Tipo Descrizione Output di esempio
Spouse1FirstName String Nome del coniuge 1 Wesley
Spouse1MiddleName String Secondo nome del coniuge 1 M.
Spouse1LastName String Cognome del coniuge 1 Perry
Spouse1Age Intero Età del coniuge 1 26
Spouse1BirthDate Data Data di nascita del coniuge 1 16 novembre 1997
Spouse1Address Address Indirizzo del coniuge 1 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302
Spouse1BirthPlace String Luogo di nascita del coniuge 1 Michigan
Spouse2FirstName String Nome del coniuge 2 Beth
Spouse2MiddleName String Secondo nome del coniuge 2 .R
Spouse2LastName String Cognome del coniuge 2 Mason
Spouse2Age Intero Età del coniuge 2 23
Spouse2BirthDate Data Data di nascita del coniuge 2 22 luglio 2000
Spouse2Address Address Indirizzo del coniuge 2 2671 Comfort Court, Madison, Wisconsin 53704
Spouse2BirthPlace String Luogo di nascita del coniuge 2 Wisconsin
DocumentNumber String Numero documento 01976/202
IssueDate Data Data di rilascio del certificato 10 ottobre 2023
IssuePlace String Luogo del rilascio del certificato 2398 Echo Lane, Hastings, Michigan 49058
MarriageDate Data Data matrimonio 10 ottobre 2023
MarriagePlace String Luogo matrimonio 105 Coal Street, Galloway, Wisconsin 54432

Le coppie chiave-valore del certificato di matrimonio e gli elementi di riga estratti sono nella documentResults sezione dell'output JSON.

Passaggi successivi

  • Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.

  • Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.