Modely hypoték Document Intelligence
Tento obsah se vztahuje na: v4.0 (Preview)
Modely hypoték Document Intelligence používají výkonné funkce optického rozpoznávání znaků (OCR) a modely hlubokého učení k analýze a extrakci klíčových polí z hypoték. Hypotéky mohou být různé formáty a kvalita. Rozhraní API analyzuje dokumenty hypotéky a vrací strukturovanou reprezentaci dat JSON. Modely aktuálně podporují pouze dokumenty anglického jazyka.
Podporované typy dokumentů:
- Jednotné žádosti o půjčku na bydlení (formulář 1003)
- Jednotný přepis a přenosový souhrn (formulář 1008)
- Formulář pro uzavření zpřístupnění
Možnosti vývoje
Document Intelligence v4.0 (2024-02-02-29-preview) podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model hypotéky | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
• předem připravená hypotéka.us.1003 • předem připravená hypotéka.us.1008 • předem připravená hypotéka.us.closingDisclosure |
Požadavky na vstup
Nejlepšíchvýsledkůch
Podporované formáty souborů:
Model PDF Obrázek:
JPEG/JPG, PNG, BMP, TIFF, HEIFsystém Microsoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) a HTMLČteno ✔ ✔ ✔ Rozložení ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Obecný dokument ✔ ✔ Předpřipravený ✔ ✔ Vlastní extrakce ✔ ✔ Vlastní klasifikace ✔ ✔ ✔ (29. 2024. 2024) U SOUBORŮ PDF a TIFF je možné zpracovat až 2000 stránek (s předplatným úrovně Free se zpracovávají pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).
Rozměry obrázku musí být mezi 50 x 50 pixelů a 10 000 px x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá
8
150 bodům na palec (DPI).Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1G MB pro neurální model.
Pro trénování modelu vlastní klasifikace je
1GB
celková velikost trénovacích dat s maximálně 10 000 stránkami.
Vyzkoušení extrakce údajů o hypotékách
Pokud chcete zjistit, jak extrakce dat funguje pro službu hypoték, potřebujete následující zdroje informací:
Předplatné Azure – můžete si ho zdarma vytvořit.
Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (
F0
). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.
Document Intelligence Studio
Na domovské stránce Aplikace Document Intelligence Studio vyberte hypotéku.
Můžete analyzovat ukázkové dokumenty hypotéky nebo nahrát vlastní soubory.
Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:
Podporované jazyky a národní prostředí
Úplný seznam podporovaných jazyků najdete na stránce podpory jazyků – předem připravená stránka modelů .
Extrakce polí 1003 Uniform Residential Loan Application (URLA)
Následuje pole extrahovaná z formuláře URLA 1003 ve výstupní odpovědi JSON.
Name | Typ | Popis | Příklad výstupu |
---|---|---|---|
LenderLoanNumber | String | Číslo půjčky věřitele nebo identifikátor univerzální půjčky | 10Bx939c5543TqA1144M999143X38 |
AgencyCaseNumber | String | Číslo případu agentury | 115894 |
Vypůjčovatel | Object | Objekt, který obsahuje značky identity dlužníka, jako je jméno, SSN, datum narození. | |
Spolužákyní | Object | Objekt, který obsahuje jména spolužáka a podepsané datum. | |
Aktuální nasazení | Object | Objekt, který obsahuje informace o aktuálním zaměstnání, včetně: jméno zaměstnavatele, telefonní číslo zaměstnavatele, adresa zaměstnavatele. | |
Půjčka | Object | Objekt, který obsahuje informace o půjčkách, včetně: částka, typ účelu, typ zpřesnění. | |
Vlastnost | objekt | Objekt, který obsahuje informace o vlastnosti, včetně: adresa, počet jednotek, hodnota. |
Páry klíč-hodnota URLA 1003 a extrahované řádkové položky jsou v documentResults
části výstupu JSON.
Extrakce polí 1008 Uniform Underwriting and Transmital Summary
Následuje pole extrahovaná z formuláře 1008 ve výstupní odpovědi JSON.
Name | Typ | Popis | Příklad výstupu |
---|---|---|---|
Vypůjčovatel | Object | Objekt, který obsahuje informace o dlužníku, včetně: jméno a počet dlužníků. | |
Vlastnost | Object | Objekt, který obsahuje informace o nemovitosti, včetně: adresa, stav obsazenosti, prodejní cena. | |
Hypotéka | Object | Objekt, který obsahuje informace o hypotékě, včetně: Typ půjčky, typ amortizace, typ půjčky účelu. | |
Upisování | Object | Objekt, který obsahuje informace o upisování informací, včetně: jméno autora, jméno appraiseru, příjem dlužníka. | |
Prodejce | Object | Objekt, který obsahuje informace o prodejci, včetně: Jméno, adresa, číslo. |
Extrahované položky formuláře 1008 klíč-hodnota jsou v documentResults
části výstupu JSON.
Zveřejnění uzavření hypotéky extrakce polí
Následuje pole extrahovaná z formuláře pro zveřejnění hypotéky ve výstupní odpovědi JSON.
Name | Typ | Popis | Příklad výstupu |
---|---|---|---|
Zavření | Object | Objekt, který obsahuje informace o závěrečných informacích, včetně: Datum emise, Datum uzavření, Datum splatnosti. | |
Transakce | Object | Objekt, který obsahuje informace o transakcích včetně: Jméno dlužníků, adresa dlužníků, jméno prodejce. | |
Půjčka | Object | Objekt, který obsahuje informace o půjčkách, včetně výrazu, účelu, produktu. |
Páry klíč-hodnota a extrahované řádkové položky jsou v documentResults
části výstupu JSON.
Další kroky
Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty.
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro