Modele dokumentów hipotecznych analizy dokumentów
Ta zawartość dotyczy: wersja 4.0 (wersja zapoznawcza)
Modele kredytów hipotecznych analizy dokumentów wykorzystują zaawansowane funkcje optycznego rozpoznawania znaków (OCR) i modeli uczenia głębokiego do analizowania i wyodrębniania kluczowych pól z dokumentów hipotecznych. Dokumenty hipoteczne mogą mieć różne formaty i jakość. Interfejs API analizuje dokumenty hipoteczne i zwraca ustrukturyzowaną reprezentację danych JSON. Modele obsługują obecnie tylko dokumenty w języku angielskim.
Obsługiwane typy dokumentów:
- Jednolity wniosek o pożyczkę mieszkaniową (formularz 1003)
- Uniform Underwriting and Transmital Summary (Formularz 1008)
- Formularz ujawnienia zamykającego
Opcje programowania
Analiza dokumentów w wersji 4.0 (2024-02-29-preview) obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby | Model ID |
---|---|---|
Model kredytów hipotecznych | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK |
• prebuilt-mortgage.us.1003 • prebuilt-mortgage.us.1008 • prebuilt-mortgage.us.closingDisclosure |
Wymagania dotyczące danych wejściowych
Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
Obsługiwane formaty plików:
Model PDF Obraz:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i HTMLPrzeczytaj ✔ ✔ ✔ Układ ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Dokument ogólny ✔ ✔ Wstępnie utworzona ✔ ✔ Niestandardowe wyodrębnianie ✔ ✔ Klasyfikacja niestandardowa ✔ ✔ ✔ (2024-02-29-preview) W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko pierwsze dwie strony).
Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).
Wymiary obrazu muszą mieć od 50 x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.
Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada około
8
-point text na 150 kropek na cal (DPI).W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1G-MB dla modelu neuronowego.
W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi
1GB
maksymalnie 10 000 stron.
Wypróbuj wyodrębnianie danych dokumentów hipotecznych
Aby zobaczyć, jak działa wyodrębnianie danych dla usługi dokumentów hipotecznych, potrzebne są następujące zasoby:
Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (
F0
). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.
Document Intelligence Studio
Na stronie głównej Document Intelligence Studio wybierz pozycję kredyt hipoteczny.
Możesz przeanalizować przykładowe dokumenty hipoteczne lub przekazać własne pliki.
Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:
Obsługiwane języki i ustawienia regionalne
Zobacz naszą stronę Obsługa języków — wstępnie utworzone modele , aby uzyskać pełną listę obsługiwanych języków.
Wyodrębnianie pól 1003 Jednolity wniosek o pożyczkę mieszkaniową (URLA)
Poniżej przedstawiono pola wyodrębnione z formularza 1003 URLA w odpowiedzi wyjściowej JSON.
Nazwisko | Pisz | Opis | Przykładowe dane wyjściowe |
---|---|---|---|
LenderLoanNumber | String | Numer pożyczki kredytodawcy lub uniwersalny identyfikator pożyczki | 10Bx939c5543TqA1144M999143X38 |
AgencyCaseNumber | String | Numer sprawy agencji | 115894 |
Kredytobiorca | Objekt | Obiekt zawierający znaczniki tożsamości kredytobiorcy, takie jak nazwa, SSN, data urodzenia. | |
Współ-Kredytobiorca | Objekt | Obiekt, który zawiera nazwy Współ-Kredytobiorcy i podpisaną datę. | |
Bieżące bezrobocie | Objekt | Obiekt zawierający informacje o bieżącym zatrudnieniu, w tym: Imię i nazwisko pracodawcy, Numer telefonu pracodawcy, Adres pracodawcy. | |
Pożyczka | Objekt | Obiekt zawierający informacje o pożyczki, w tym: kwota, typ przeznaczenia, typ refinansowania. | |
Właściwości | obiekt | Obiekt zawierający informacje o właściwości, w tym: adres, liczba jednostek, wartość. |
Pary klucz-wartość 1003 URLA i wyodrębnione elementy wiersza znajdują się w documentResults
sekcji danych wyjściowych JSON.
Wyodrębnianie pól 1008 Uniform Underwriting and Transmital Summary
Poniżej przedstawiono pola wyodrębnione z formularza 1008 w odpowiedzi wyjściowej JSON.
Nazwisko | Pisz | Opis | Przykładowe dane wyjściowe |
---|---|---|---|
Kredytobiorca | Objekt | Obiekt, który zawiera informacje o kredytobiorcy, w tym: nazwa, i liczba kredytobiorców. | |
Właściwości | Objekt | Obiekt zawierający informacje o właściwości, w tym: adres, stan zajętości, cena sprzedaży. | |
Hipoteka | Objekt | Obiekt zawierający informacje na temat kredytu hipotecznego, w tym: typ pożyczki, typ amortyzacji, typ przeznaczenia pożyczki. | |
Ubezpieczeniowych | Objekt | Obiekt, który zawiera informacje o zapisie informacji, w tym: imię i nazwisko autora, nazwa rzeczoznawcy, dochód kredytobiorcy. | |
Sprzedawca | Objekt | Obiekt zawierający informacje o sprzedawcy, w tym: Imię i nazwisko, adres, numer. |
Pary klucz-wartość formularza 1008 i wyodrębnione elementy wiersza znajdują się w documentResults
sekcji danych wyjściowych JSON.
Ujawnienie zamknięcia kredytów hipotecznych wydobycia pól
Poniżej przedstawiono pola wyodrębnione z formularza ujawnienia zamknięcia kredytu hipotecznego w odpowiedzi wyjściowej JSON.
Nazwisko | Pisz | Opis | Przykładowe dane wyjściowe |
---|---|---|---|
Zamykanie | Objekt | Obiekt zawierający informacje o zamknięciu, w tym: Data wydania, Data zamknięcia, Data wypłaty. | |
Transakcja | Objekt | Obiekt zawierający informacje o transakcji, w tym: Nazwa kredytobiorców, Adres kredytobiorców, Nazwa sprzedawcy. | |
Pożyczka | Objekt | Obiekt zawierający informacje o pożyczki, w tym: termin, cel, produkt. |
Pary klucz-wartość zamknięcia kredytu hipotecznego i elementy liniowe wyodrębnione są w documentResults
sekcji danych wyjściowych JSON.
Następne kroki
Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla