Modelli di documento ipotecario di Intelligence sui documenti

Questo contenuto si applica a:segno di spuntav4.0 (anteprima)segno di spunta

I modelli ipotecari di Document Intelligence usano potenti funzionalità di riconoscimento ottico dei caratteri (OCR) e modelli di Deep Learning per analizzare ed estrarre campi chiave dai documenti ipotecari. I documenti ipotecari possono essere di vari formati e qualità. L'API analizza i documenti ipotecari e restituisce una rappresentazione di dati JSON strutturata. I modelli attualmente supportano solo documenti in lingua inglese.

Tipi di documenti supportati:

  • Richiesta di prestito residenziale uniforme (modulo 1003)
  • Uniform Underwriting and Transmittal Summary (Modulo 1008)
  • Modulo di divulgazione di chiusura

Opzioni di sviluppo

Document Intelligence v4.0 (2024-02-29-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello ipotecario Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
• precompilt-mutuo.us.1003
• mutuo predefinito.us.1008
• precompilt-mutuo.us.closingDisclosure

Requisiti di input

  • Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lettura
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-02-29-preview)
  • Per i formati PDF e TIFF, possono essere elaborate fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1GB con un massimo di 10.000 pagine.

Provare l'estrazione dei dati dei documenti ipotecari

Per vedere come funziona l'estrazione dei dati per il servizio documenti ipotecari, sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.

Screenshot delle chiavi e della posizione dell'endpoint nella portale di Azure.

Document Intelligence Studio

  1. Nella home page di Document Intelligence Studio selezionare mutuo.

  2. È possibile analizzare i documenti ipotecari di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Document Intelligence Studio.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina Dei modelli predefiniti.

Estrazione campi 1003 Richiesta di prestito residenziale uniforme (URLA)

Di seguito sono riportati i campi estratti da un modulo URLA 1003 nella risposta di output JSON.

Nome Tipo Descrizione Output di esempio
LenderLoanNumber String Numero di prestito o identificatore di prestito universale 10Bx939c5543TqA1144M999143X38
AgencyCaseNumber String Numero di caso agenzia 115894
Mutuatario Object Oggetto che contiene i marcatori di identità del mutuatario, ad esempio nome, SSN, data di nascita.
Co-prestitore Object Oggetto che contiene i nomi del co-prestitore e la data firmata.
CurrentEmployment Object Oggetto che contiene informazioni sull'attuale impiego, tra cui: nome del datore di lavoro, numero del datore di lavoro Telefono, indirizzo datore di lavoro.
Finanziamento Object Oggetto che contiene informazioni sul prestito, tra cui: importo, tipo di scopo, tipo refinanziamento.
Proprietà oggetto Oggetto che contiene informazioni sulla proprietà, tra cui: indirizzo, numero di unità, valore.

Le coppie chiave-valore URLA 1003 e gli elementi di riga estratti si trovano nella documentResults sezione dell'output JSON.

Estrazione campi 1008 Sottoscrizioni uniformi e riepilogo di trasmissione

Di seguito sono riportati i campi estratti da un modulo 1008 nella risposta di output JSON.

Nome Tipo Descrizione Output di esempio
Mutuatario Object Oggetto che contiene informazioni sul prestito, tra cui: nome e numero di mutuatari.
Proprietà Object Oggetto che contiene informazioni sulla proprietà, tra cui: indirizzo, stato di occupazione, prezzo di vendita.
Ipoteca Object Oggetto che contiene informazioni sul mutuo, tra cui: tipo di prestito, tipo di ammortamento, tipo di scopo del prestito.
Sottoscrizione Object Oggetto che contiene informazioni sulle informazioni di sottoscrizione, tra cui: nome del sottoscrittore, nome della valutazione, reddito del mutuatario.
Venditore Object Oggetto che contiene informazioni sul venditore, tra cui: Nome, indirizzo, numero.

Il formato 1008 coppie chiave-valore e gli elementi di riga estratti si trovano nella documentResults sezione dell'output JSON.

Divulgazione della chiusura di mutui per estrazione sul campo

Di seguito sono riportati i campi estratti da un modulo di divulgazione di chiusura ipotecaria nella risposta di output JSON.

Nome Tipo Descrizione Output di esempio
Chiusura Object Oggetto che contiene informazioni sulle informazioni di chiusura, tra cui data di emissione, data di chiusura, data di rilascio.
Transazione Object Oggetto che contiene informazioni sulle informazioni sulle transazioni, tra cui: nome dei mutuatari, indirizzo dei mutuatari, nome venditore.
Finanziamento Object Oggetto che contiene informazioni sui prestiti, tra cui: termine, scopo, prodotto.

Le coppie chiave-valore di chiusura ipotecaria e gli elementi di riga estratti si trovano nella documentResults sezione dell'output JSON.

Passaggi successivi

  • Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.

  • Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.