Document Intelligence payStub 모델

아티클
10/17/2024

Document Intelligence payStub 모델은 강력한 OCR(광학 인식) 기능을 딥 러닝 모델과 결합하여 급여 명세서에서 보상 및 수입 데이터를 분석하고 추출합니다. API는 급여 관련 정보를 포함하는 문서 및 파일을 분석하고, 주요 정보를 추출하고, 구조화된 JSON 데이터 표현을 반환합니다.

기능	version	Model ID
payStub 모델	• v4.0:2024-07-31(미리 보기)	`prebuilt-payStub.us`

payStub 데이터 추출 시도

급여 명세서는 고용주가 직원에게 발행한 필수 문서로, 특정 급여 기간에 대한 수입, 공제 및 순 급여 정보를 제공합니다. prebuilt-payStub.us 모델을 사용하여 데이터를 추출하는 방법을 확인합니다. 다음 리소스가 필요합니다.

Azure 구독 – 체험 구독 만들기
Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(F0)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.

Document Intelligence Studio

문서 인텔리전스 스튜디오 홈페이지에서 payStub을 선택합니다.
샘플 급여 명세서를 분석하거나 자체 파일을 업로드할 수 있습니다.
분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.

입력 요구 사항

지원 파일 형식:

모델	PDF	이미지: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	Microsoft Office: Word(`DOCX`), Excel(`XLSX`), PowerPoint(`PPTX`), HTML
읽기	✔	✔	✔
레이아웃	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
일반 문서	✔	✔
사전 제작	✔	✔
사용자 지정 추출	✔	✔
사용자 지정 분류	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview)

최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.
PDF 및 TIFF의 경우 최대 2,000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).
문서를 분석하기 위한 파일 크기는 유료(S0) 계층의 경우 500MB이고 무료(F0) 계층의 경우 4MB입니다.
이미지 크기는 50픽셀 x 50픽셀에서 10,000픽셀 x 10,000픽셀 사이여야 합니다.
PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.
추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8점 텍스트에 해당합니다.
사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.
- 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB이고 인공신경망 모델의 경우 1GB입니다.
- 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 1GB이고 최대 10,000페이지입니다. 2024-07-31-preview 및 이후 버전의 경우 학습 데이터의 총 크기는 2GB이고 최대 10,000페이지입니다.

지원되는 언어 및 로캘

지원되는 언어의 전체 목록은 미리 빌드된 모델 언어 지원 페이지를 참조하세요.

필드 추출

지원되는 문서 추출 필드는 GitHub 샘플 리포지토리의 payStub 모델 스키마 페이지를 참조하세요.

지원되는 로캘

prebuilt-payStub.us 버전 2027-07-31-preview는 en-us 로캘을 지원합니다.

다음 단계

문서 인텔리전스 스튜디오를 사용하여 고유의 양식과 문서를 처리해 보세요.
Document Intelligence 빠른 시작을 완료하고 원하는 개발 언어로 문서 처리 앱 만들기를 시작해 보세요.

다음을 통해 공유