Dokumentintelligenzmodelle für Hypothekendokumente
Dieser Inhalt gilt für: Version 4.0 (Vorschau)
Die Dokumentintelligenzmodelle für Hypotheken verwendet leistungsstarke OCR (Optical Character Recognition)-Funktionen und Deep Learning-Modelle, um Schlüsselfelder aus Hypothekendokumenten zu analysieren und zu extrahieren. Hypothekendarlehen können in verschiedenen Formaten und Qualitäten vorliegen. Die API analysiert Hypothekendokumente und gibt eine strukturierte JSON-Datendarstellung zurück. Die Modelle unterstützen derzeit nur Dokumente in englischer Sprache.
Unterstützte Dokumenttypen:
- Einheitlicher Antrag für ein Wohnungsbaudarlehen (Formular 1003)
- Einheitliche Zeichnungs- und Übertragungszusammenfassung (Formular 1008)
- Offenlegung des Abschlusses-Formular
Entwicklungsoptionen
Dokument-Intelligence v4.0 (2024-02-29-preview) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
Funktion | Ressourcen | Modell-ID |
---|---|---|
Hypothekenmodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-hypothek.us.1003 • prebuilt-hypothek.us.1008 • prebuilt-hypothek.us.closingDisclosure |
Eingabeanforderungen
Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.
Unterstützte Dateiformate:
Modell PDF Bild:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) und HTMLLesen ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Allgemeines Dokument ✔ ✔ Vordefiniert ✔ ✔ Benutzerdefinierte Extraktion ✔ ✔ Benutzerdefinierte Klassifizierung ✔ ✔ ✔ (2024-02-29-preview) In den Formaten PDF und TIFF können bis zu 2.000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).
Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige (S0) und 4 MB für die kostenlose (F0) Stufe.
Die Bildgrößen müssen im Bereich zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.
Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.
Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem
8
-Punkt-Text bei 150 Punkten pro Zoll (Dots per Inch, DPI).Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.
Für das Training des benutzerdefinierten Extraktionsmodells beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1G-MB für das neuronale Modell.
Für das Training des benutzerdefinierten Klassifizierungsmodells beträgt die Gesamtgröße der Trainingsdaten
1GB
mit einem Maximum von 10 000 Seiten.
Testen der Datenextraktion für Hypothekendokumente
Um zu sehen, wie die Datenextraktion für den Hypothekendokumentdienst funktioniert, benötigen Sie die folgenden Ressourcen:
Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).
Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (
F0
) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.
Dokument Intelligenz Studio
Wählen Sie auf der Startseite von Dokument Intelligenz Studio die Option Hypothek aus.
Sie können die Muster-Hypothekendokumente analysieren oder Ihre eigenen Dateien hochladen.
Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:
Unterstützte Sprachen und Gebietsschemas
Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung ‒ vordefinierte Modelle.
Feldauszug 1003 Einheitlicher Darlehensantrag für Wohnimmobilien (URLA)
Im Folgenden finden Sie die Felder, die aus einem 1003 URLA-Formular in der JSON-Ausgabeantwort extrahiert wurden.
Name | Typ | Beschreibung | Beispielausgabe |
---|---|---|---|
LenderLoanNumber | String | Kreditnummer des Kreditgebers oder Universalkreditbezeichners | 10Bx939c5543TqA1144M999143X38 |
AgencyCaseNumber | String | Fallnummer der Agentur | 115894 |
Borrower | Objekt | Ein Objekt, das die Identitätsmarker des Darlehensnehmers enthält, z. B. Name, SSN, Geburtsdatum. | |
Co-Darlehensnehmer | Objekt | Ein Objekt, das die Namen des Mitleidnehmers und das signierte Datum enthält. | |
CurrentEmployment | Objekt | Ein Objekt, das Informationen über die aktuelle Beschäftigung enthält, einschließlich: Arbeitgebername, Arbeitgebertelefonnummer, Arbeitgeberadresse. | |
Darlehen | Objekt | Ein Objekt, das Kreditinformationen enthält, einschließlich: Betrag, Zwecktyp, Refinanzierungstyp. | |
Eigenschaft | Objekt | Ein Objekt, das Informationen zur Eigenschaft enthält, einschließlich: Adresse, Anzahl der Einheiten, Wert. |
Die aus 1003 extrahierten URLA-Schlüsselwertpaare und -Zeilen befinden sich im Abschnitt documentResults
der JSON-Ausgabe.
Feldauszug 1008 Einheitliche Zeichnungs- und Übertragungszusammenfassung (Formular 1008)
Im Folgenden finden Sie die Felder, die aus einem 1008-Formular in der JSON-Ausgabeantwort extrahiert wurden.
Name | Typ | Beschreibung | Beispielausgabe |
---|---|---|---|
Borrower | Objekt | Ein Objekt, das Informationen über den Darlehensnehmer enthält, einschließlich Name und Anzahl der Darlehensnehmer. | |
Eigenschaft | Objekt | Ein Objekt, das Informationen über die Immobilie enthält, einschließlich Adresse, Belegungsstatus, Verkaufspreis. | |
Hypothek | Objekt | Ein Objekt, das Informationen zur Hypothek enthält, einschließlich: Kredittyp, Tilgungstyp, Kreditzwecktyp. | |
Underwriting | Objekt | Ein Objekt, das Informationen über die Unterschreibungsinformationen enthält, einschließlich: Unterschreibname, Appraisername, Darlehensnehmereinkommen. | |
Verkäufer | Objekt | Ein Objekt, das Informationen zum Verkäufer enthält, einschließlich Name, Adresse, Nummer. |
Das Formular 1008 Schlüssel-Wert-Paare und die extrahierten Positionen befinden sich im Abschnitt documentResults
der JSON-Ausgabe.
Offenlegung von Hypothekenabschluss für Die Feldextraktion
Im Folgenden sind die Felder aufgeführt, die aus einem Offenlegungsformular für Hypothekenabschluss in der JSON-Ausgabeantwort extrahiert wurden.
Name | Typ | Beschreibung | Beispielausgabe |
---|---|---|---|
Schließen | Objekt | Ein Objekt, das Informationen zu den Abschlussinformationen enthält, einschließlich: Ausgabedatum, Abschlussdatum, Auszahlungsdatum. | |
Transaktion | Objekt | Ein Objekt, das Informationen zu den Transaktionsinformationen enthält, einschließlich: Name der Darlehensnehmer, Adresse des Darlehensnehmers, Verkäufername. | |
Darlehen | Objekt | Ein Objekt, das Kreditinformationen enthält, einschließlich: Laufzeit, Zweck, Produkt. |
Die schlüsselwertbasierten Veröffentlichungspaare und die extrahierten Positionen des Hypothekenabschlusses befinden sich im documentResults
Abschnitt der JSON-Ausgabe.
Nächste Schritte
Versuchen Sie, Ihre eigenen Formulare und Dokumente mithilfe von Dokument Intelligenz Studio zu verarbeiten.
Führen Sie eine Dokument Intelligenz-Schnellstartanleitung durch, und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Tickets als Feedbackmechanismus für Inhalte auslaufen lassen und es durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unter:Einreichen und Feedback anzeigen für