Model dokumen hipotret Kecerdasan Dokumen
Konten ini berlaku untuk:v4.0 (pratinjau)
Model Mortgage Kecerdasan Dokumen menggunakan kemampuan Optical Character Recognition (OCR) yang kuat dan model pembelajaran mendalam untuk menganalisis dan mengekstrak bidang utama dari dokumen hipotek. Dokumen KPR dapat memiliki berbagai format dan kualitas. API menganalisis dokumen hipotek dan mengembalikan representasi data JSON terstruktur. Model saat ini hanya mendukung dokumen berbahasa Inggris.
Jenis dokumen yang didukung:
- Aplikasi Pinjaman Residensial Seragam (Formulir 1003)
- Ringkasan Underwriting dan Transmittal Seragam (Formulir 1008)
- Formulir Pengungkapan Penutupan
Opsi pengembangan
Kecerdasan Dokumen v4.0 (pratinjau 2024-02-29) mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model hipotret | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-mortgage.us.1003 • prebuilt-mortgage.us.1008 • prebuilt-mortgage.us.closingDisclosure |
Persyaratan input
Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.
Format file yang didukung:
Model PDF Gambar:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), dan HTMLRead ✔ ✔ ✔ Tata letak ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Dokumen Umum ✔ ✔ Bawaan ✔ ✔ Ekstraksi kustom ✔ ✔ Klasifikasi kustom ✔ ✔ ✔ (Pratinjau 2024-02-29) Untuk PDF dan TIFF, hingga 2000 halaman yang dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).
Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan 4 MB secara gratis (F0).
Dimensi gambar harus antara 50 x 50 piksel dan 10.000 piksel x 10.000 piksel.
Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.
Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan teks sekitar
8
-point pada 150 titik per inci (DPI).Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.
Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan 1G-MB untuk model neural.
Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah
1GB
dengan maksimum 10.000 halaman.
Coba ekstraksi data dokumen hipotek
Untuk melihat cara kerja ekstraksi data untuk layanan dokumen hipotek, Anda memerlukan sumber daya berikut:
Langganan Azure—Anda dapat membuatnya secara gratis.
Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.
Studio Kecerdasan Dokumen
Pada beranda Studio Kecerdasan Dokumen, pilih hipotek.
Anda dapat menganalisis sampel dokumen hipotret atau mengunggah file Anda sendiri.
Pilih tombol Jalankan analisis dan, jika perlu, konfigurasikan opsi Analisis:
Bahasa dan lokal yang didukung
Lihat halaman Dukungan Bahasa— model bawaan untuk daftar lengkap bahasa yang didukung.
Ekstraksi bidang 1003 Aplikasi Pinjaman Residensial Seragam (URLA)
Berikut ini adalah bidang yang diekstrak dari formulir URLA 1003 dalam respons output JSON.
Nama | Tipe | Deskripsi | Contoh output |
---|---|---|---|
LenderLoanNumber | String | Nomor pinjaman pemberi pinjaman atau pengidentifikasi pinjaman universal | 10Bx939c5543TqA1144M999143X38 |
AgencyCaseNumber | String | Nomor kasus agensi | 115894 |
Peminjam | Objek | Objek yang berisi penanda identitas peminjam seperti nama, SSN, tanggal lahir. | |
Peminjam Bersama | Objek | Objek yang berisi nama Co-Borrower, dan tanggal yang ditandatangani. | |
CurrentEmployment | Objek | Objek yang berisi informasi tentang pekerjaan saat ini termasuk: Nama perusahaan, nomor Telepon Majikan, alamat Majikan. | |
Pinjaman | Objek | Objek yang berisi informasi pinjaman termasuk: jumlah, jenis tujuan, jenis pembilangan. | |
Properti | object | Objek yang berisi informasi tentang properti termasuk: alamat, jumlah unit, nilai. |
Pasangan kunci-nilai URLA 1003 dan item baris yang diekstrak berada di bagian documentResults
output JSON.
Ekstraksi bidang 1008 Uniform Underwriting dan Ringkasan Transmittal
Berikut ini adalah bidang yang diekstrak dari formulir 1008 dalam respons output JSON.
Nama | Tipe | Deskripsi | Contoh output |
---|---|---|---|
Peminjam | Objek | Objek yang berisi informasi tentang peminjam termasuk: nama, dan jumlah peminjam. | |
Properti | Objek | Objek yang berisi informasi tentang properti termasuk: alamat, status hunian, harga penjualan. | |
Hipotek | Objek | Objek yang berisi informasi tentang hipotek termasuk: Jenis pinjaman, jenis amortisasi, jenis tujuan pinjaman. | |
Underwriting | Objek | Objek yang berisi informasi tentang informasi penjaminan termasuk: nama penjamin, nama penilain, pendapatan peminjam. | |
Penjual | Objek | Objek yang berisi informasi tentang penjual termasuk: Nama, alamat, nomor. |
Pasangan kunci-nilai formulir 1008 dan item baris yang diekstrak ada di bagian documentResults
output JSON.
Pengungkapan penutupan hipotek ekstraksi bidang
Berikut ini adalah bidang yang diekstrak dari formulir pengungkapan penutupan hipotek dalam respons output JSON.
Nama | Tipe | Deskripsi | Contoh output |
---|---|---|---|
Penutupan | Objek | Objek yang berisi informasi tentang informasi penutupan termasuk: Tanggal penerbitan, Tanggal penutupan, Tanggal pencairan. | |
Transaksi | Objek | Objek yang berisi informasi tentang informasi transaksi termasuk: Nama peminjam, alamat Peminjam, nama Penjual. | |
Pinjaman | Objek | Objek yang berisi informasi pinjaman termasuk: istilah, tujuan, produk. |
Pengungkapan pengungkapan penutupan hipotek pasangan kunci-nilai dan item baris yang diekstrak berada di bagian documentResults
output JSON.
Langkah berikutnya
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk