Dela via


Dokumentmodeller för inteckningsdokument för Dokumentinformation

Det här innehållet gäller för:Bockmarkeringv4.0 (förhandsversion)Bockmarkering

Modellerna document intelligence mortgage använder kraftfulla OCR-funktioner (Optisk teckenigenkänning) och djupinlärningsmodeller för att analysera och extrahera nyckelfält från inteckningsdokument. Inteckning dokument kan vara av olika format och kvalitet. API:et analyserar inteckningsdokument och returnerar en strukturerad JSON-datarepresentation. Modellerna stöder för närvarande endast engelskspråkiga dokument.

Dokumenttyper som stöds:

  • Enhetlig bostadslåneansökan (formulär 1003)
  • Enhetlig försäkrings- och överföringssammanfattning (formulär 1008)
  • Formulär för att stänga offentliggörande

Utvecklingsalternativ

Document Intelligence v4.0 (2024-02-29-preview) stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Hypoteksmodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-mortgage.us.1003
• prebuilt-mortgage.us.1008
• prebuilt-mortgage.us.closingDisclosure

Indatakrav

  • För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.

  • Filformat som stöds:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) och HTML
    Lästa
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Allmänt dokument
    Inbyggda
    Anpassad extrahering
    Anpassad klassificering ✔ (2024-02-29-preview)
  • För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en kostnadsfri nivåprenumeration bearbetas endast de två första sidorna).

  • Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).

  • Bilddimensionerna måste vara mellan 50 x 50 bildpunkter och 10 000 px x 10 000 bildpunkter.

  • Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.

  • Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar ungefär 8-punkttext vid 150 punkter per tum (DPI).

  • För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.

    • För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och 1G-MB för den neurala modellen.

    • För anpassad klassificeringsmodellträning är 1GB den totala storleken på träningsdata med högst 10 000 sidor.

Prova dataextrahering av inteckningsdokument

Om du vill se hur dataextrahering fungerar för tjänsten för inteckningsdokument behöver du följande resurser:

  • En Azure-prenumeration – du kan skapa en kostnadsfritt.

  • En instans av dokumentinformation i Azure-portalen. Du kan använda den kostnadsfria prisnivån (F0) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.

Skärmbild av nycklar och slutpunktsplats i Azure-portalen.

Document Intelligence Studio

  1. På startsidan för Document Intelligence Studio väljer du inteckning.

  2. Du kan analysera exempeldokumenten eller ladda upp dina egna filer.

  3. Välj knappen Kör analys och konfigurera vid behov alternativen Analysera:

    Skärmbild av knapparna Kör analys och Analysera alternativ i Document Intelligence Studio.

Språk och nationella inställningar som stöds

Se sidan Språkstöd – fördefinierade modeller för en fullständig lista över språk som stöds.

Fältextrahering 1003 Uniform Residential Loan Application (URLA)

Följande är fälten som extraheras från ett 1003 URLA-formulär i JSON-utdatasvaret.

Namn Type Beskrivning Exempel på utdata
LenderLoanNumber String Långivarens lånenummer eller universella låneidentifierare 10Bx939c5543TqA1144M999143X38
AgencyCaseNumber String Ärendenummer för byrå 115894
Låntagaren Objekt Ett objekt som innehåller låntagarens identitetsmarkörer, till exempel namn, SSN, födelsedatum.
Medlånare Objekt Ett objekt som innehåller medlånarens namn och signerat datum.
CurrentEmployment Objekt Ett objekt som innehåller information om den aktuella anställningen, inklusive: Employer name, Employer Telefon number, Employer address.
Lån Objekt Ett objekt som innehåller låneinformation, inklusive: belopp, användningstyp, refinansieringstyp.
Property objekt Ett objekt som innehåller information om egenskapen, inklusive: adress, antal enheter, värde.

Nyckel/värde-paren 1003 URLA och radobjekt som extraheras finns i avsnittet i documentResults JSON-utdata.

Fältextrahering 1008 Enhetlig garanti och överföringssammanfattning

Följande är fälten som extraheras från ett 1008-formulär i JSON-utdatasvaret.

Namn Type Beskrivning Exempel på utdata
Låntagaren Objekt Ett objekt som innehåller information om låntagaren, inklusive: namn och antal låntagare.
Property Objekt Ett objekt som innehåller information om egenskapen, inklusive: adress, beläggningsstatus, försäljningspris.
Inteckning Objekt Ett objekt som innehåller information om inteckningen, inklusive: Lånetyp, amorteringstyp, typ av lån.
Emissionsgarantier Objekt Ett objekt som innehåller information om försäkringsinformationen, inklusive: underwriter name, appraiser name, borrower income.
Säljare Objekt Ett objekt som innehåller information om säljaren, inklusive: Namn, adress, nummer.

Formuläret 1008 nyckel/värde-par och radobjekt som extraheras finns i documentResults avsnittet i JSON-utdata.

Fältextrahering av information om stängning av bolån

Följande är fälten som extraheras från ett informationsformulär för inteckningsstängning i JSON-utdatasvaret.

Namn Type Beskrivning Exempel på utdata
Stänga Objekt Ett objekt som innehåller information om den avslutande informationen, inklusive: Utfärdandedatum, Slutdatum, Utbetalningsdatum.
Transaktion Objekt Ett objekt som innehåller information om transaktionsinformationen, inklusive: Låntagarens namn, Låntagares adress, Säljarnamn.
Lån Objekt Ett objekt som innehåller låneinformation inklusive: term, syfte, produkt.

Nyckel/värde-par och radobjekt som extraheras finns i avsnittet i documentResults JSON-utdata.

Nästa steg

  • Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.