共用方式為


檔智慧抵押貸款檔模型

此內容適用於:複選標記v4.0(預覽版)複選標記

檔智慧抵押貸款模型使用強大的光學字元辨識(OCR)功能和深度學習模型,從抵押貸款檔分析和擷取關鍵字段。 抵押貸款檔可以是各種格式和品質。 API 會分析抵押貸款檔,並傳回結構化 JSON 數據表示法。 模型目前僅支援英文檔。

支援的文件類型:

  • 統一住宅貸款申請(表格1003)
  • 統一承銷和傳輸摘要 (表單 1008)
  • 關閉披露表單

開發選項

Document Intelligence v4.0 (2024-02-29-preview) 支援下列工具、應用程式和連結庫:

功能 資源 Model ID
抵押貸款模型 Document Intelligence Studio
REST API
C# SDK• Python SDK
Java SDK
JavaScript SDK
• prebuilt-mortgage.us.1003
• prebuilt-mortgage.us.1008
• prebuilt-mortgage.us.closingDisclosure

輸入需求

  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 支援的檔案格式:

    模型 PDF 圖片:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word(DOCX)、Excel(XLSX)、PowerPoint(PPTX)和 HTML
    參閱
    版面配置 ✔ (2024-02-29-preview, 2023-10-31-preview)
    一般文件
    預建
    自訂擷取
    自訂分類 ✔ (2024-02-29-preview)
  • 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 用於分析文件的檔案大小是付費 (S0) 層的 500 MB,免費 #F0 層為 4 MB。

  • 影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1GB (上限為 10,000 頁)。

試用抵押貸款文件數據擷取

若要查看數據擷取對抵押貸款檔服務的運作方式,您需要下列資源:

  • Azure 訂用帳戶-您可以 免費建立一個訂用帳戶。

  • Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (F0) 來試用服務。 部署資源後,選取 [前往資源] 以取得金鑰和端點。

Azure 入口網站 中金鑰和端點位置的螢幕快照。

Document Intelligence Studio

  1. 在 [Document Intelligence Studio] 首頁上,選取 [ 抵押貸款]。

  2. 您可以分析範例抵押貸款檔,或上傳您自己的檔案。

  3. 選取 [ 執行分析] 按鈕,並視需要設定 [分析] 選項

    Document Intelligence Studio 中 [執行分析和分析選項] 按鈕的螢幕快照。

支援的語言和地區設定

如需支援語言的完整清單,請參閱 我們的 語言支援 — 預先建置的模型 頁面。

現場提取 1003 統一住宅貸款申請(URLA)

以下是從 JSON 輸出回應中 1003 URLA 表單擷取的欄位。

名稱 類型​​ 描述 範例輸出
LenderLoanNumber String 貸款人貸款編號或通用貸款標識符 10Bx939c5543TqA1144M999143X38
AgencyCaseNumber String 機構案例號碼 115894
借款人 Object 物件,其中包含借用者的識別標記,例如名稱、SSN、出生日期。
共同借款人 Object 物件,其中包含共同借用者的名稱和帶正負號的日期。
目前就業 Object 物件,包含目前就業的相關信息,包括:僱主名稱、僱主 電話 號碼、僱主位址。
貸款 Object 物件,包含貸款資訊,包括:金額、用途類型、再融資類型。
屬性 object 物件,包含屬性的相關信息,包括:位址、單位數目、值。

擷取的 1003 URLA 機碼/值組和行項目位於 documentResults JSON 輸出的 區段中。

欄位擷取 1008 統一承銷和傳輸摘要

以下是從 JSON 輸出回應中擷取自 1008 窗體的欄位。

名稱 類型​​ 描述 範例輸出
借款人 Object 物件,包含借款人的相關信息,包括:名稱和借款人數目。
屬性 Object 物件,包含屬性的相關信息,包括:位址、佔用狀態、銷售價格。
抵押貸款 Object 物件,包含抵押貸款的相關信息,包括:貸款類型、攤銷類型、貸款目的類型。
承 保 Object 物件,包含承銷資訊的相關信息,包括:承銷商名稱、鑒定人名稱、借款人收入。
賣家 Object 物件,包含賣方的相關信息,包括:名稱、位址、數位。

擷取的 1008 機碼/值組和明細專案格式位於 documentResults JSON 輸出的 區段中。

現場擷取抵押貸款關閉披露

以下是 JSON 輸出回應中從抵押貸款關閉披露窗體擷取的欄位。

名稱 類型​​ 描述 範例輸出
關閉 Object 物件,包含關閉資訊的相關信息,包括:發行日期、結束日期、支付日期。
交易 Object 物件,包含交易資訊的相關信息,包括:借款人名稱、借款人位址、賣方名稱。
貸款 Object 物件,包含貸款資訊,包括:詞彙、目的、產品。

擷取的抵押貸款關閉披露索引鍵/值組和明細項目位於 documentResults JSON 輸出的 區段中。

下一步