Modely hypoték Document Intelligence

Tento obsah se vztahuje na:Zaškrtnutív4.0 (Preview)Zaškrtnutí

Modely hypoték Document Intelligence používají výkonné funkce optického rozpoznávání znaků (OCR) a modely hlubokého učení k analýze a extrakci klíčových polí z hypoték. Hypotéky mohou být různé formáty a kvalita. Rozhraní API analyzuje dokumenty hypotéky a vrací strukturovanou reprezentaci dat JSON. Modely aktuálně podporují pouze dokumenty anglického jazyka.

Podporované typy dokumentů:

  • Jednotné žádosti o půjčku na bydlení (formulář 1003)
  • Jednotný přepis a přenosový souhrn (formulář 1008)
  • Formulář pro uzavření zpřístupnění

Možnosti vývoje

Document Intelligence v4.0 (2024-02-02-29-preview) podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model hypotéky Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
• předem připravená hypotéka.us.1003
• předem připravená hypotéka.us.1008
• předem připravená hypotéka.us.closingDisclosure

Požadavky na vstup

  • Nejlepšíchvýsledkůch

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) a HTML
    Čteno
    Rozložení ✔ (2024-02-29-preview, 2023-10-31-preview)
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace ✔ (29. 2024. 2024)
  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2000 stránek (s předplatným úrovně Free se zpracovávají pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 x 50 pixelů a 10 000 px x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8150 bodům na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1G MB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1GB celková velikost trénovacích dat s maximálně 10 000 stránkami.

Vyzkoušení extrakce údajů o hypotékách

Pokud chcete zjistit, jak extrakce dat funguje pro službu hypoték, potřebujete následující zdroje informací:

  • Předplatné Azure – můžete si ho zdarma vytvořit.

  • Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

Snímek obrazovky s klíči a umístěním koncového bodu na webu Azure Portal

Document Intelligence Studio

  1. Na domovské stránce Aplikace Document Intelligence Studio vyberte hypotéku.

  2. Můžete analyzovat ukázkové dokumenty hypotéky nebo nahrát vlastní soubory.

  3. Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

    Snímek obrazovky s tlačítky Možnosti Spustit analýzu a Analýza v nástroji Document Intelligence Studio

Podporované jazyky a národní prostředí

Úplný seznam podporovaných jazyků najdete na stránce podpory jazyků – předem připravená stránka modelů .

Extrakce polí 1003 Uniform Residential Loan Application (URLA)

Následuje pole extrahovaná z formuláře URLA 1003 ve výstupní odpovědi JSON.

Name Typ Popis Příklad výstupu
LenderLoanNumber String Číslo půjčky věřitele nebo identifikátor univerzální půjčky 10Bx939c5543TqA1144M999143X38
AgencyCaseNumber String Číslo případu agentury 115894
Dlužník Object Objekt, který obsahuje značky identity dlužníka, jako je jméno, SSN, datum narození.
Spolužákyní Object Objekt, který obsahuje jména spolužáka a podepsané datum.
Aktuální nasazení Object Objekt, který obsahuje informace o aktuálním zaměstnání, včetně: jméno zaměstnavatele, zaměstnavatel Telefon číslo, adresa zaměstnavatele.
Úvěr Object Objekt, který obsahuje informace o půjčkách, včetně: částka, typ účelu, typ zpřesnění.
Vlastnost objekt Objekt, který obsahuje informace o vlastnosti, včetně: adresa, počet jednotek, hodnota.

Páry klíč-hodnota URLA 1003 a extrahované řádkové položky jsou v documentResults části výstupu JSON.

Extrakce polí 1008 Uniform Underwriting and Transmital Summary

Následuje pole extrahovaná z formuláře 1008 ve výstupní odpovědi JSON.

Name Typ Popis Příklad výstupu
Dlužník Object Objekt, který obsahuje informace o dlužníku, včetně: jméno a počet dlužníků.
Vlastnost Object Objekt, který obsahuje informace o nemovitosti, včetně: adresa, stav obsazenosti, prodejní cena.
Hypoteční Object Objekt, který obsahuje informace o hypotékě, včetně: Typ půjčky, typ amortizace, typ půjčky účelu.
Upisování Object Objekt, který obsahuje informace o upisování informací, včetně: jméno autora, jméno appraiseru, příjem dlužníka.
Prodejce Object Objekt, který obsahuje informace o prodejci, včetně: Jméno, adresa, číslo.

Extrahované položky formuláře 1008 klíč-hodnota jsou v documentResults části výstupu JSON.

Zveřejnění uzavření hypotéky extrakce polí

Následuje pole extrahovaná z formuláře pro zveřejnění hypotéky ve výstupní odpovědi JSON.

Name Typ Popis Příklad výstupu
Zavření Object Objekt, který obsahuje informace o závěrečných informacích, včetně: Datum emise, Datum uzavření, Datum splatnosti.
Transakce Object Objekt, který obsahuje informace o transakcích včetně: Jméno dlužníků, adresa dlužníků, jméno prodejce.
Úvěr Object Objekt, který obsahuje informace o půjčkách, včetně výrazu, účelu, produktu.

Páry klíč-hodnota a extrahované řádkové položky jsou v documentResults části výstupu JSON.

Další kroky