다음을 통해 공유


문서 인텔리전스 모기지 문서 모델

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v4.0(미리 보기)확인 표시

문서 인텔리전스 모기지 모델은 강력한 OCR(광학 인식) 기능과 딥 러닝 모델을 사용하여 모기지 문서에서 주요 필드를 분석하고 추출합니다. 모기지 문서 형식과 품질은 다양할 수 있습니다. API는 모기지 문서를 분석하고 구조화된 JSON 데이터 표현을 반환합니다. 모델은 현재 영어 문서만 지원합니다.

지원되는 문서 유형:

  • 공통 주택 담보 대출 신청서(양식 1003)
  • 공통 인수 및 송금 요약(양식 1008)
  • 마감 공시 양식

개발 옵션

문서 인텔리전스 v4.0(2024-02-29-미리 보기)은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
모기지 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-mortgage.us.1003
• prebuilt-mortgage.us.1008
• prebuilt-mortgage.us.closingDisclosure

입력 요구 사항

  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX) 및 HTML
    읽음
    레이아웃 ✔ (2024-02-29-미리 보기, 2023-10-31-미리 보기)
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류 ✔ (2024-02-29-미리 보기)
  • PDF 및 TIFF의 경우 최대 2000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서 분석을 위한 파일 크기는 유료(S0) 계층의 경우 500MB, 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50 x 50픽셀에서 10,000 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8포인트 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB, 신경망 모델의 경우 1G-MB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 최대 10,000페이지인 1GB입니다.

모기지 문서 데이터 추출 시도

모기지 문서 서비스에서 데이터 추출이 작동하는 방식을 확인하려면 다음 리소스가 필요합니다.

  • Azure 구독은 무료로 만들 수 있습니다.

  • Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(F0)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.

Azure Portal에서 키 및 엔드포인트 위치의 스크린샷

Document Intelligence Studio

  1. 문서 인텔리전스 스튜디오 홈페이지에서 모기지를 선택합니다.

  2. 샘플 모기지 문서를 분석하거나 사용자 고유의 파일을 업로드할 수 있습니다.

  3. 분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.

    문서 인텔리전스 스튜디오의 분석 실행과 분석 옵션 버튼 스크린샷.

지원되는 언어 및 로캘

지원되는 언어의 전체 목록은 언어 지원 - 미리 빌드된 모델 페이지를 참조하세요.

필드 추출 1003 URLA(공통 주택 담보 대출 신청서)

다음은 JSON 출력 응답의 1003 URLA 양식에서 추출된 필드입니다.

속성 형식 설명 예제 출력
LenderLoanNumber 문자열 대출 번호 또는 범용 대출 식별자 10Bx939c5543TqA1144M999143X38
AgencyCaseNumber 문자열 에이전시 사례 번호 115894
빌어 쓰는 사람 Object 이름, SSN, 생년월일 등 차용자의 ID 표식을 포함하는 개체입니다.
공동 대출자 Object 공동 대출자의 이름과 서명된 날짜가 포함된 개체입니다.
CurrentEmployment Object 고용주 이름, 고용주 전화 번호, 고용주 주소 등 현재 고용에 대한 정보를 포함하는 개체입니다.
대출 Object 금액, 목적 유형, 재융자 유형 등 대출 정보를 포함하는 개체입니다.
속성 개체 주소, 단위 수, 값 등 속성에 대한 정보를 포함하는 개체입니다.

추출된 1003 URLA 키-값 쌍 및 품목은 JSON 출력의 documentResults 섹션에 있습니다.

필드 추출 1008 공통 인수 및 송금 요약

다음은 JSON 출력 응답의 1008 양식에서 추출된 필드입니다.

속성 형식 설명 예제 출력
빌어 쓰는 사람 Object 이름 및 대출자 수를 포함하여 대출자에 대한 정보를 포함하는 개체입니다.
속성 Object 주소, 점유율 상태, 판매 가격 등 속성에 대한 정보를 포함하는 개체입니다.
모기지 Object 대출 유형, 상각 유형, 대출 목적 유형 등 모기지에 대한 정보를 포함하는 개체입니다.
인수 Object 보험업자 이름, 평가자 이름, 대출자 소득 등 인수 정보에 대한 정보가 포함된 개체입니다.
판매자 Object 이름, 주소, 번호 등 판매자에 대한 정보를 포함하는 개체입니다.

추출된 양식 1008 키-값 쌍 및 줄 항목은 JSON 출력의 documentResults 섹션에 있습니다.

현장 추출 모기지 마감 공시

다음은 JSON 출력 응답의 모기지 마감 공시 양식에서 추출된 필드입니다.

속성 형식 설명 예제 출력
닫기 Object 발급 날짜, 마감 날짜, 지출 날짜 등 닫는 정보에 대한 정보가 들어 있는 개체입니다.
트랜잭션 Object 대출자 이름, 대출자 주소, 판매자 이름 등 거래 정보에 대한 정보를 포함하는 개체입니다.
대출 Object 용어, 목적, 제품 등 대출 정보를 포함하는 개체입니다.

추출된 모기지 마감 공시 키-값 쌍 및 품목은 JSON 출력의 documentResults 섹션에 있습니다.

다음 단계