Freigeben über


Dokumentintelligenzmodelle für Hypothekendokumente

Dieser Inhalt gilt für:HäkchenVersion 4.0 (Vorschau)Häkchen

Die Dokumentintelligenzmodelle für Hypotheken verwendet leistungsstarke OCR (Optical Character Recognition)-Funktionen und Deep Learning-Modelle, um Schlüsselfelder aus Hypothekendokumenten zu analysieren und zu extrahieren. Hypothekendarlehen können in verschiedenen Formaten und Qualitäten vorliegen. Die API analysiert Hypothekendokumente und gibt eine strukturierte JSON-Datendarstellung zurück. Die Modelle unterstützen derzeit nur Dokumente in englischer Sprache.

Unterstützte Dokumenttypen:

  • Einheitlicher Antrag für ein Wohnungsbaudarlehen (Formular 1003)
  • Einheitliche Zeichnungs- und Übertragungszusammenfassung (Formular 1008)
  • Offenlegung des Abschlusses-Formular

Entwicklungsoptionen

Dokument-Intelligence v4.0 (2024-02-29-preview) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Funktion Ressourcen Modell-ID
Hypothekenmodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-hypothek.us.1003
• prebuilt-hypothek.us.1008
• prebuilt-hypothek.us.closingDisclosure

Eingabeanforderungen

  • Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.

  • Unterstützte Dateiformate:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) und HTML
    Lesen
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Allgemeines Dokument
    Vordefiniert
    Benutzerdefinierte Extraktion
    Benutzerdefinierte Klassifizierung ✔ (2024-02-29-preview)
  • In den Formaten PDF und TIFF können bis zu 2.000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).

  • Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige (S0) und 4 MB für die kostenlose (F0) Stufe.

  • Die Bildgrößen müssen im Bereich zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.

  • Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.

  • Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem 8-Punkt-Text bei 150 Punkten pro Zoll (Dots per Inch, DPI).

  • Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.

    • Für das Training des benutzerdefinierten Extraktionsmodells beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1G-MB für das neuronale Modell.

    • Für das Training des benutzerdefinierten Klassifizierungsmodells beträgt die Gesamtgröße der Trainingsdaten 1GB mit einem Maximum von 10 000 Seiten.

Testen der Datenextraktion für Hypothekendokumente

Um zu sehen, wie die Datenextraktion für den Hypothekendokumentdienst funktioniert, benötigen Sie die folgenden Ressourcen:

  • Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).

  • Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot: Schlüssel und Endpunkt im Azure-Portal

Dokument Intelligenz Studio

  1. Wählen Sie auf der Startseite von Dokument Intelligenz Studio die Option Hypothek aus.

  2. Sie können die Muster-Hypothekendokumente analysieren oder Ihre eigenen Dateien hochladen.

  3. Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:

    Screenshot der Schaltflächen „Analyse ausführen“ und „Analyseoptionen“ im Document Intelligence Studio.

Unterstützte Sprachen und Gebietsschemas

Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung ‒ vordefinierte Modelle.

Feldauszug 1003 Einheitlicher Darlehensantrag für Wohnimmobilien (URLA)

Im Folgenden finden Sie die Felder, die aus einem 1003 URLA-Formular in der JSON-Ausgabeantwort extrahiert wurden.

Name Typ Beschreibung Beispielausgabe
LenderLoanNumber String Kreditnummer des Kreditgebers oder Universalkreditbezeichners 10Bx939c5543TqA1144M999143X38
AgencyCaseNumber String Fallnummer der Agentur 115894
Borrower Objekt Ein Objekt, das die Identitätsmarker des Darlehensnehmers enthält, z. B. Name, SSN, Geburtsdatum.
Co-Darlehensnehmer Objekt Ein Objekt, das die Namen des Mitleidnehmers und das signierte Datum enthält.
CurrentEmployment Objekt Ein Objekt, das Informationen über die aktuelle Beschäftigung enthält, einschließlich: Arbeitgebername, Arbeitgebertelefonnummer, Arbeitgeberadresse.
Darlehen Objekt Ein Objekt, das Kreditinformationen enthält, einschließlich: Betrag, Zwecktyp, Refinanzierungstyp.
Eigenschaft Objekt Ein Objekt, das Informationen zur Eigenschaft enthält, einschließlich: Adresse, Anzahl der Einheiten, Wert.

Die aus 1003 extrahierten URLA-Schlüsselwertpaare und -Zeilen befinden sich im Abschnitt documentResults der JSON-Ausgabe.

Feldauszug 1008 Einheitliche Zeichnungs- und Übertragungszusammenfassung (Formular 1008)

Im Folgenden finden Sie die Felder, die aus einem 1008-Formular in der JSON-Ausgabeantwort extrahiert wurden.

Name Typ Beschreibung Beispielausgabe
Borrower Objekt Ein Objekt, das Informationen über den Darlehensnehmer enthält, einschließlich Name und Anzahl der Darlehensnehmer.
Eigenschaft Objekt Ein Objekt, das Informationen über die Immobilie enthält, einschließlich Adresse, Belegungsstatus, Verkaufspreis.
Hypothek Objekt Ein Objekt, das Informationen zur Hypothek enthält, einschließlich: Kredittyp, Tilgungstyp, Kreditzwecktyp.
Underwriting Objekt Ein Objekt, das Informationen über die Unterschreibungsinformationen enthält, einschließlich: Unterschreibname, Appraisername, Darlehensnehmereinkommen.
Verkäufer Objekt Ein Objekt, das Informationen zum Verkäufer enthält, einschließlich Name, Adresse, Nummer.

Das Formular 1008 Schlüssel-Wert-Paare und die extrahierten Positionen befinden sich im Abschnitt documentResults der JSON-Ausgabe.

Offenlegung von Hypothekenabschluss für Die Feldextraktion

Im Folgenden sind die Felder aufgeführt, die aus einem Offenlegungsformular für Hypothekenabschluss in der JSON-Ausgabeantwort extrahiert wurden.

Name Typ Beschreibung Beispielausgabe
Schließen Objekt Ein Objekt, das Informationen zu den Abschlussinformationen enthält, einschließlich: Ausgabedatum, Abschlussdatum, Auszahlungsdatum.
Transaktion Objekt Ein Objekt, das Informationen zu den Transaktionsinformationen enthält, einschließlich: Name der Darlehensnehmer, Adresse des Darlehensnehmers, Verkäufername.
Darlehen Objekt Ein Objekt, das Kreditinformationen enthält, einschließlich: Laufzeit, Zweck, Produkt.

Die schlüsselwertbasierten Veröffentlichungspaare und die extrahierten Positionen des Hypothekenabschlusses befinden sich im documentResults Abschnitt der JSON-Ausgabe.

Nächste Schritte