文件智慧抵押貸款文件模型
此內容適用於: v4.0 (預覽版)
文件智慧抵押貸款模型使用強大的光學字元辨識 (OCR) 功能和深度學習模型來分析和擷取抵押貸款文件中的關鍵欄位。 抵押貸款文件可能有多種格式和品質。 此 API 會分析抵押貸款文件並傳回結構化 JSON 資料表示法。 這些模型目前僅支援英文文件。
支援的文件類型:
- 統一住宅貸款申請表 (表單 1003)
- 統一核貸和傳遞摘要表 (表單 1008)
- 結算披露表單
開發選項
文件智慧服務 v4.0 (2024-02-29-preview) 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
抵押貸款模型 | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-mortgage.us.1003 • prebuilt-mortgage.us.1008 • prebuilt-mortgage.us.closingDisclosure |
輸入需求
若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。
支援的檔案格式:
模型 PDF 影像:
JPEG/JPG、PNG、BMP、TIFF、HEIFMicrosoft Office:
Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX) 和 HTML參閱 ✔ ✔ ✔ 版面配置 ✔ ✔ ✔ (2024-02-29-preview、2023-10-31-preview) 一般文件 ✔ ✔ 預建 ✔ ✔ 自訂擷取 ✔ ✔ 自訂分類 ✔ ✔ ✔ (2024-02-29-preview) 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。
分析文件的檔案大小付費 (S0) 層為 500 MB,而免費 (F0) 層為 4 MB。
影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。
如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。
針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於
8
點文字。針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。
針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。
針對自訂分類模型定型,定型資料的大小總計為
1GB
(上限為 10,000 頁)。
嘗試抵押貸款文件資料擷取
若要了解抵押貸款文件服務的資料擷取如何運作,您需要以下資源:
Azure 訂用帳戶 — 您可建立一個免費訂用帳戶。
Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (
F0
) 來試用服務。 部署資源後,選取 [前往資源] 以取得金鑰和端點。
Document Intelligence Studio
在 Document Intelligence Studio 首頁上,選取 [抵押貸款]。
您可以分析樣本抵押貸款文件或上傳您自己的檔案。
選取 [執行分析] 按鈕,並視需要設定 [分析選項]:
支援的語言和地區設定
如需支援語言的完整清單,請參閱我們的語言支援—預先建置模型頁面。
欄位擷取 1003 統一住宅貸款申請表 (URLA)
以下是從 JSON 輸出回應中的 1003 URLA 表單中擷取的欄位。
名稱 | 類型 | 描述 | 範例輸出 |
---|---|---|---|
LenderLoanNumber | String | 貸款人貸款編號或通用貸款識別碼 | 10Bx939c5543TqA1144M999143X38 |
AgencyCaseNumber | String | 機構案件編號 | 115894 |
借款人 | Object | 包含借款人身分標記的物件,例如姓名、SSN、出生日期。 | |
共同借款人 | Object | 包含共同借款人姓名和簽名日期的物件。 | |
CurrentEmployment | Object | 包含有關目前就業資訊的物件,其中包括:雇主名稱、雇主電話號碼、雇主地址。 | |
貸款 | Object | 包含貸款資訊的物件,其中包括:金額、用途類型、再融資類型。 | |
屬性 | object | 包含有關房產的資訊的物件,其中包括:地址、單位數量、價值。 |
擷取的 1003 URLA 索引鍵值組和明細行項目位於 JSON 輸出的 documentResults
區段中。
欄位擷取 1008 統一核貸和傳遞摘要表
以下是從 JSON 輸出回應中的 1008 表單中擷取的欄位。
名稱 | 類型 | 描述 | 範例輸出 |
---|---|---|---|
借款人 | Object | 包含有關借款人的資訊的物件,其中包括:借款人的姓名和電話號碼。 | |
屬性 | Object | 包含有關房產的資訊的物件,其中包括:地址、佔用狀態、銷售價格。 | |
抵押貸款 | Object | 包含有關抵押貸款的資訊的物件,其中包括:貸款類型、攤還類型、貸款目的類型。 | |
核貸 | Object | 包含有關核貸資訊的物件,其中包括:核貸人姓名、鑒定人姓名、借款人收入等資訊。 | |
賣家 | Object | 包含有關賣方資訊的物件,其中包括:姓名、地址、電話號碼等。 |
擷取的表單 1008 索引鍵值組和明細行項目位於 JSON 輸出的 documentResults
區段中。
欄位擷取抵押貸款結算披露
以下是從 JSON 輸出回應中的抵押貸款結算揭露表單中擷取的欄位。
名稱 | 類型 | 描述 | 範例輸出 |
---|---|---|---|
關閉 | Object | 包含有關結算資訊的物件,其中包括:核發日期、結算日期、撥款日期。 | |
交易 | Object | 包含有關交易資訊的物件,其中包括:借款人姓名、借款人地址、賣方姓名。 | |
貸款 | Object | 包含貸款資訊的物件,其中包括:期限、目的、產品。 |
擷取的抵押貸款結算揭露索引鍵值組和明細行項目位於 JSON 輸出的 documentResults
區段中。
下一步
使用 Document Intelligence Studio 嘗試處理自己的表單和文件。
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應