다음을 통해 공유


Document Intelligence payStub 모델

Document Intelligence payStub 모델은 강력한 OCR(광학 인식) 기능을 딥 러닝 모델과 결합하여 급여 명세서에서 보상 및 수입 데이터를 분석하고 추출합니다. API는 급여 관련 정보를 포함하는 문서 및 파일을 분석하고, 주요 정보를 추출하고, 구조화된 JSON 데이터 표현을 반환합니다.

기능 version Model ID
payStub 모델 • v4.0:2024-07-31(미리 보기) prebuilt-payStub.us

payStub 데이터 추출 시도

급여 명세서는 고용주가 직원에게 발행한 필수 문서로, 특정 급여 기간에 대한 수입, 공제 및 순 급여 정보를 제공합니다. prebuilt-payStub.us 모델을 사용하여 데이터를 추출하는 방법을 확인합니다. 다음 리소스가 필요합니다.

  • Azure 구독 – 체험 구독 만들기

  • Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(F0)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.

    Azure Portal에서 키 및 엔드포인트 위치의 스크린샷

Document Intelligence Studio

  1. 문서 인텔리전스 스튜디오 홈페이지에서 payStub을 선택합니다.

  2. 샘플 급여 명세서를 분석하거나 자체 파일을 업로드할 수 있습니다.

  3. 분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.

입력 요구 사항

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX), HTML
    읽기
    레이아웃 ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류 ✔ (2024-07-31-preview, 2024-02-29-preview)
  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • PDF 및 TIFF의 경우 최대 2,000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서를 분석하기 위한 파일 크기는 유료(S0) 계층의 경우 500MB이고 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50픽셀 x 50픽셀에서 10,000픽셀 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8점 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB이고 인공신경망 모델의 경우 1GB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 1GB이고 최대 10,000페이지입니다. 2024-07-31-preview 및 이후 버전의 경우 학습 데이터의 총 크기는 2GB이고 최대 10,000페이지입니다.

지원되는 언어 및 로캘

지원되는 언어의 전체 목록은 미리 빌드된 모델 언어 지원 페이지를 참조하세요.

필드 추출

지원되는 문서 추출 필드는 GitHub 샘플 리포지토리의 payStub 모델 스키마 페이지를 참조하세요.

지원되는 로캘

prebuilt-payStub.us 버전 2027-07-31-preview는 en-us 로캘을 지원합니다.

다음 단계