Share via


Document Intelligence の住宅ローン ドキュメント モデル

このコンテンツの適用対象: checkmarkv4.0 (プレビュー)checkmark

Document Intelligenceの 住宅ローン モデルでは、強力な光学式文字認識 (OCR) 機能とディープ ラーニング モデルを使用して、住宅ローン ドキュメントの主要なフィールドを分析して抽出します。 住宅ローンのドキュメントには、さまざまな形式と品質のものがあります。 API により、住宅ローン ドキュメントが分析され、構造化された JSON データ表現が返されます。 このモデルでは、現在、英語のドキュメントをサポートしています。

サポートされているドキュメントの種類:

  • 統一住宅ローン申請書 (様式 1003)
  • 統一引受転送概要書 (様式 1008)
  • 決算開示様式

開発オプション

Document Intelligence v4.0 (2024-02-29-preview) では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース モデル ID
住宅ローン モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-mortgage.us.1003
• prebuilt-mortgage.us.1008
• prebuilt-mortgage.us.closingDisclosure

入力の要件

  • 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。

  • サポートされているファイル形式:

    モデル PDF 画像:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLS)、PowerPoint (PPT)、HTML
    既読
    Layout ✔ (2024-02-29-preview、2023-10-31-preview)
    一般的なドキュメント
    事前構築済み
    カスタム抽出
    カスタム分類 ✔ (2024-02-29-preview)
  • PDF および TIFF の場合、最大 2000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。

  • ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。

  • 画像のディメンションは、50 x 50 ピクセルから 10,000 x 10,000 ピクセルの間である必要があります。

  • PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。

  • 抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約 8 ポイントのテキストに相当します。

  • カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。

    • カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1GB です。

    • カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは 1GB で、最大 10,000 ページです。

住宅ローン ドキュメントのデータ抽出を試す

住宅ローン ドキュメント サービスのデータ抽出のしくみを確認するには、次のリソースが必要です。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

Document Intelligence Studio

  1. Document Intelligence Studio ホーム ページで、[住宅ローン] を選択します。

  2. サンプルの住宅ローン ドキュメントを分析したり、自身のファイルをアップロードしたりできます。

  3. 分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:

    Document Intelligence Studio の [分析の実行] と [分析オプション] ボタンのスクリーンショット。

サポートされている言語とロケール

サポートされている言語の完全なリストについては、言語サポート — 事前構築済みモデルに関するページを "参照" してください。.

フィールド抽出 1003 統一住宅ローン申請書 (URLA)

1003 URLA フォームから JSON 出力応答に抽出されたフィールドを次に示します。

名前 種類 説明 出力例
LenderLoanNumber String 貸し手のローン番号またはユニバーサル ローン ID 10Bx939c5543TqA1144M999143X38
AgencyCaseNumber String Agency case number 115894
り手 Object 名前、SSN、生年月日など、借り手の ID マーカーを含むオブジェクト。
共同借用者 Object 共同借用者の名前と署名の日付を含むオブジェクト。
CurrentEmployment Object 現在の雇用状況に関する情報 (雇用主名、雇用主の電話番号、雇用主の住所など) を含むオブジェクト。
Loan Object ローン情報 (金額、目的タイプ、借換タイプなど) を含むオブジェクト。
プロパティ オブジェクト 不動産物件に関する情報 (住所、単位数、価値など) を含むオブジェクト。

抽出された 1003 URLA のキーと値のペアとライン項目は、JSON 出力の documentResults セクションにあります。

フィールド抽出 1008 統一引受転送概要書

JSON 出力応答で 1008 フォームから抽出されたフィールドを次に示します。

名前 種類 説明 出力例
り手 Object 借り手に関する情報 (名前、借り手の番号など) を含むオブジェクト。
プロパティ Object 不動産物件に関する情報 (住所、居住状態、販売価格など) を含むオブジェクト。
Mortgage Object 住宅ローンに関する情報 (ローンの種類、償却の種類、ローンの目的の種類など) を含むオブジェクト。
Underwriting Object 引受情報に関する情報 (引受人名、鑑定人名、借り手の収入など、) を含むオブジェクト。
営業担当者 Object 売り手に関する情報 (名前、住所、番号など) を含むオブジェクト。

抽出されたフォーム 1008 のキーと値のペアと項目は、JSON 出力の documentResults セクションにあります。

フィールド抽出住宅ローン決算開示

JSON 出力応答で住宅ローン決算開示フォームから抽出されたフィールドを次に示します。

名前 種類 説明 出力例
閉じる Object 決算情報に関する情報 (発行日、決算日、出金日など) を含むオブジェクト。
取引 Object 取引情報に関する情報 (借り手名、借り手住所、販売者名) を含むオブジェクト。
Loan Object ローン情報 (期間、目的、商品など) を含むオブジェクト。

抽出された住宅ローン決算開示のキーと値のペアと品目は、JSON 出力の documentResults セクションにあります。

次のステップ