Document Intelligence payStub 모델
Document Intelligence payStub 모델은 강력한 OCR(광학 인식) 기능을 딥 러닝 모델과 결합하여 급여 명세서에서 보상 및 수입 데이터를 분석하고 추출합니다. API는 급여 관련 정보를 포함하는 문서 및 파일을 분석하고, 주요 정보를 추출하고, 구조화된 JSON 데이터 표현을 반환합니다.
기능 | version | Model ID |
---|---|---|
payStub 모델 | • v4.0:2024-07-31(미리 보기) | prebuilt-payStub.us |
payStub 데이터 추출 시도
급여 명세서는 고용주가 직원에게 발행한 필수 문서로, 특정 급여 기간에 대한 수입, 공제 및 순 급여 정보를 제공합니다. prebuilt-payStub.us
모델을 사용하여 데이터를 추출하는 방법을 확인합니다. 다음 리소스가 필요합니다.
Azure 구독 – 체험 구독 만들기
Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(
F0
)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.
Document Intelligence Studio
문서 인텔리전스 스튜디오 홈페이지에서 payStub을 선택합니다.
샘플 급여 명세서를 분석하거나 자체 파일을 업로드할 수 있습니다.
분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.
입력 요구 사항
지원 파일 형식:
모델 PDF 이미지: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word(DOCX
), Excel(XLSX
), PowerPoint(PPTX
), HTML읽기 ✔ ✔ ✔ 레이아웃 ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) 일반 문서 ✔ ✔ 사전 제작 ✔ ✔ 사용자 지정 추출 ✔ ✔ 사용자 지정 분류 ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.
PDF 및 TIFF의 경우 최대 2,000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).
문서를 분석하기 위한 파일 크기는 유료(S0) 계층의 경우 500MB이고 무료(F0) 계층의 경우
4
MB입니다.이미지 크기는 50픽셀 x 50픽셀에서 10,000픽셀 x 10,000픽셀 사이여야 합니다.
PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.
추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약
8
점 텍스트에 해당합니다.사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.
사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB이고 인공신경망 모델의 경우
1
GB입니다.사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는
1
GB이고 최대 10,000페이지입니다. 2024-07-31-preview 및 이후 버전의 경우 학습 데이터의 총 크기는2
GB이고 최대 10,000페이지입니다.
지원되는 언어 및 로캘
지원되는 언어의 전체 목록은 미리 빌드된 모델 언어 지원 페이지를 참조하세요.
필드 추출
지원되는 문서 추출 필드는 GitHub 샘플 리포지토리의 payStub 모델 스키마 페이지를 참조하세요.
지원되는 로캘
prebuilt-payStub.us 버전 2027-07-31-preview는 en-us 로캘을 지원합니다.
다음 단계
문서 인텔리전스 스튜디오를 사용하여 고유의 양식과 문서를 처리해 보세요.
Document Intelligence 빠른 시작을 완료하고 원하는 개발 언어로 문서 처리 앱 만들기를 시작해 보세요.