다음을 통해 공유


문서 처리 모델

Important

  • 문서 인텔리전스 공개 미리 보기 릴리스에서는 현재 개발 중인 기능에 대한 조기 액세스를 제공합니다. 기능, 방식 및 프로세스는 GA(일반 공급) 전에 사용자 피드백에 따라 변경될 수 있습니다.
  • 문서 인텔리전스 클라이언트 라이브러리의 공개 미리 보기 버전은 기본적으로 REST API 버전 2024-07-31-preview입니다.
  • 공개 미리 보기 버전 2024-07-31-preview는 현재 다음 Azure 지역에서만 사용할 수 있습니다. AI Studio의 사용자 지정 생성(문서 필드 추출) 모델은 미국 중북부 지역에서만 사용할 수 있습니다.
    • 미국 동부
    • 미국 서부2
    • 서유럽
    • 미국 중북부

이 콘텐츠의 적용 대상: 확인 표시 v4.0(미리 보기) | 이전 버전: 파란색 확인 표시 v3.1(GA) 파란색 확인 표시 v3.0(GA) 파란색 확인 표시 v2.1(GA)

이 콘텐츠의 적용 대상: 확인 표시 v3.1(GA) | 최신 버전: 보라색 확인 표시 v4.0(미리 보기) | 이전 버전: 파란색 확인 표시 v3.0 파란색 확인 표시 v2.1

이 콘텐츠의 적용 대상: 확인 표시 v3.0(GA) | 최신 버전: 보라색 확인 표시 v4.0(미리 보기) 보라색 확인 표시 v3.1 | 이전 버전: 파란색 확인 표시 v2.1

이 콘텐츠의 적용 대상: 확인 표시 v2.1 | 최신 버전:파란색 확인 표시 v4.0(미리 보기)

Azure AI 문서 인텔리전스는 앱 및 흐름에 지능형 문서 처리를 추가할 수 있는 다양한 모델을 지원합니다. 미리 빌드된 도메인별 모델을 사용하거나 특정 비즈니스 요구 사항과 사용 사례에 맞게 조정된 사용자 지정 모델을 학습시킬 수 있습니다. 문서 인텔리전스는 REST API 또는 Python, C#, Java 및 JavaScript 클라이언트 라이브러리와 함께 사용할 수 있습니다.

참고 항목

  • 재무 데이터, 보호된 건강 데이터, 개인 데이터 또는 매우 중요한 데이터를 포함하는 문서 처리 프로젝트에는 주의가 필요합니다.
  • 모든 국가/지역 및 산업별 요구 사항을 준수해야 합니다.

모델 개요

다음 표에서는 각 현재 미리 보기 및 안정적인 API에 사용 가능한 모델을 보여 줍니다.

모델 형식 모델 2024-02-29-미리 보기
2023-10-31-preview
2023-07-31(GA) 2022-08-31(GA) v2.1(GA)
문서 분석 모델 읽음 ✔️ ✔️ ✔️ 해당 없음
문서 분석 모델 레이아웃 ✔️ ✔️ ✔️ ✔️
문서 분석 모델 일반 문서 레이아웃으로 이동** ✔️ ✔️ 해당 없음
미리 빌드된 모델 은행 수표 ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 은행 명세서 ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 Paystub ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 계약 ✔️ ✔️ 해당 없음 해당 없음
미리 빌드된 모델 의료 보험 카드 ✔️ ✔️ ✔️ 해당 없음
미리 빌드된 모델 ID 문서 ✔️ ✔️ ✔️ ✔️
미리 빌드된 모델 청구서 ✔️ ✔️ ✔️ ✔️
미리 빌드된 모델 영수증 ✔️ ✔️ ✔️ ✔️
미리 빌드된 모델 미국 통합세* ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 US 1040 세금* ✔️ ✔️ 해당 없음 해당 없음
미리 빌드된 모델 US 1098 세금* ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 US 1099 세금* ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 미국 W2 세금 ✔️ ✔️ ✔️ 해당 없음
미리 빌드된 모델 미국 모기지 1003 URLA ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 미국 모기지 1004 URAR ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 미국 모기지 1005 ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 미국 모기지 1008 요약 ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 미국 모기지 마감 공시 ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 결혼 인증서 ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 신용 카드 ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 명함 사용되지 않음 ✔️ ✔️ ✔️
사용자 지정 분류 모델 사용자 지정 분류자 ✔️ ✔️ 해당 없음 해당 없음
사용자 지정 생성 모델 사용자 지정 생성 모델 ✔️ 해당 없음 해당 없음 해당 없음
사용자 지정 추출 모델 사용자 지정 인공신경망 ✔️ ✔️ ✔️ 해당 없음
Customextraction 모델 사용자 지정 템플릿 ✔️ ✔️ ✔️ ✔️
사용자 지정 추출 모델 사용자 지정 구성형 ✔️ ✔️ ✔️ ✔️
모든 모델 추가 기능 ✔️ ✔️ 해당 없음 해당 없음

* - 하위 모델을 포함함. 지원되는 변형 및 하위 형식에 대한 모델 관련 정보를 참조하세요.

대기 시간

대기 시간은 API 서버가 들어오는 요청을 처리하고 클라이언트에 나가는 응답을 전달하는 데 걸리는 시간의 양입니다. 문서를 분석하는 데 걸리는 시간은 크기(예: 페이지 수) 및 각 페이지의 관련 콘텐츠에 따라 다릅니다. 문서 인텔리전스는 유사한 문서의 대기 시간이 비슷하지만 항상 동일하지는 않은 다중 테넌트 서비스입니다. 대기 시간 및 성능의 가변성은 이미지 및 대량의 문서를 대규모로 처리하는 마이크로 서비스 기반의 상태 비저장 비동기 서비스의 고유한 특성입니다. 하드웨어 및 용량과 스케일링 기능을 지속적으로 스케일 업하고 있지만, 아직은 런타임에 대기 시간 문제가 발생할 수 있습니다.

추가 기능 추가 기능/무료 2024-02-29-미리 보기
&bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-v4.0%20(2024-07-31-preview)&preserve-view=true
2023-07-31(GA) 2022-08-31(GA) v2.1(GA)
Font 속성 추출 추가 기능 ✔️ ✔️ 해당 없음 해당 없음
수식 추출 추가 기능 ✔️ ✔️ 해당 없음 해당 없음
고해상도 추출 추가 기능 ✔️ ✔️ 해당 없음 해당 없음
바코드 추출 Free ✔️ ✔️ 해당 없음 해당 없음
언어 감지 Free ✔️ ✔️ 해당 없음 해당 없음
키 값 쌍 Free ✔️ 해당 없음 해당 없음 해당 없음
쿼리 필드 추가 기능* ✔️ 해당 없음 해당 없음 해당 없음
검색 가능한 pdf 추가 기능* ✔️ 해당 없음 해당 없음 해당 없음

모델 분석 기능

Model ID 콘텐츠 추출 쿼리 필드 단락 단락 역할 선택 표시 테이블 키/값 쌍 언어 바코드 문서 분석 수식* 스타일 글꼴* 고해상도* 검색 가능한 PDF
prebuilt-read O O O O O
prebuilt-layout O O O O O
prebuilt-document O O O O O
prebuilt-businessCard
prebuilt-contract O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(변형) O O O O O
prebuilt-tax.us.1040(변형) O O O O O
{ customModelName } O O O O O

✓ - 사용함
O - 선택적
* - 프리미엄 기능에는 추가 비용이 발생합니다

추가 기능* - 쿼리 필드 가격은 다른 추가 기능과 다르게 책정됩니다. 자세한 내용은 가격 책정을 참조하세요.

경계 상자 및 다각형 좌표

경계 상자(v3.0 이상 버전의 polygon)는 문서에서 텍스트 요소를 둘러싸고 개체 감지를 위한 참조점으로 사용되는 추상적 사각형입니다.

  • 경계 상자는 4개의 숫자 쌍 배열로 표시되는 x 및 y 좌표 평면을 사용하여 위치를 지정합니다. 각 쌍은 상자의 모서리를 왼쪽 위, 오른쪽 위, 오른쪽 아래, 왼쪽 아래 순서로 나타냅니다.

  • 이미지 좌표는 픽셀 단위로 표시됩니다. PDF의 경우 좌표가 인치 단위로 표시됩니다.

명함 모델을 제외한 모든 모델에 대해 문서 인텔리전스는 이제 더 정교한 분석을 허용하는 추가 기능 기능을 지원합니다. 이러한 선택적 기능은 문서 추출 시나리오에 따라 활성화 및 비활성화할 수 있습니다. 2023-07-31(GA) 이상 API 버전에 사용할 수 있는 7가지 추가 기능입니다.

언어 지원

문서 인텔리전스의 딥 러닝 기반 유니버설 모델은 혼합 언어가 포함된 텍스트 줄을 포함하여 이미지와 문서에서 다국어 텍스트를 추출할 수 있는 다양한 언어를 지원합니다. 언어 지원은 문서 인텔리전스 서비스 기능에 따라 다릅니다. 전체 목록은 다음 문서를 참조하세요.

국가별 가용성

문서 인텔리전스는 일반적으로 60개 이상의 Azure 글로벌 인프라 지역에서 사용할 수 있습니다.

자세한 내용은 Azure 지역 페이지를 참조하여 사용자와 고객에게 가장 적합한 지역을 선택할 수 있습니다.

모델 세부 정보

이 섹션에서는 각 모델에서 예상할 수 있는 출력에 대해 설명합니다. 추가 기능을 사용하여 대부분 모델의 출력을 확장할 수 있습니다.

OCR 읽기

Read API는 줄, 단어, 위치, 감지된 언어, 필기 입력 스타일(감지된 경우)을 분석하고 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 문서 샘플:

문서 인텔리전스 스튜디오를 사용하여 처리된 샘플 문서 스크린샷 읽기

레이아웃 분석

레이아웃 분석 모델은 텍스트, 테이블, 선택 표시 및 제목, 섹션 머리글, 페이지 머리글, 페이지 바닥글 등과 같은 기타 구조 요소를 분석하고 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 문서 샘플:

문서 인텔리전스 스튜디오를 사용하여 처리한 샘플 신문 페이지 스크린샷.

의료 보험 카드

의료 보험 카드 모델은 강력한 OCR(광학 인식) 기능과 딥 러닝 모델을 결합하여 미국 의료 보험 카드에서 주요 정보를 분석하고 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 미국 의료 보험 카드:

문서 인텔리전스 스튜디오에서 미국 의료 보험 카드 분석 샘플 스크린샷.

미국 세금 문서

미국 세금 문서 모델은 선택한 세금 문서 그룹에서 주요 필드와 품목을 분석하고 추출합니다. API는 전화 캡처 이미지, 스캔한 문서 및 디지털 PDF를 포함하여 다양한 형식과 품질의 영어 미국 세금 문서의 분석을 지원합니다. 현재 지원되는 모델은 다음과 같습니다.

모델 설명 ModelID
미국 세금 W-2 과세 보상 세부 정보를 추출합니다. prebuilt-tax.us.w2
미국 세금 1040 모기지 이자 세부 정보를 추출합니다. prebuilt-tax.us.1040(변형)
미국 세금 1098 모기지 이자 세부 정보를 추출합니다. prebuilt-tax.us.1098(변형)
미국 세금 1099 고용주 이외의 출처에서 받은 소득을 추출합니다. prebuilt-tax.us.1099(변형)

문서 인텔리전스 스튜디오를 사용하여 처리한 W-2 문서 샘플:

샘플 W-2의 스크린샷

미국 모기지 문서

미국 모기지 문서 모델은 선택한 모기지 문서 그룹에서 대출자, 대출 및 부동산 정보를 포함한 주요 분야를 분석하고 추출합니다. API는 전화 캡처 이미지, 스캔한 문서 및 디지털 PDF를 포함하여 다양한 형식과 품질의 영어 미국 모기지 문서의 분석을 지원합니다. 현재 지원되는 모델은 다음과 같습니다.

모델 설명 ModelID
1003 EULA(최종 사용자 사용권 계약) 대출, 대출자, 부동산 세부 정보를 추출합니다. prebuilt-mortgage.us.1003
1008 요약 문서 대출자, 판매자, 부동산, 모기지 및 인수 세부 정보를 추출합니다. prebuilt-mortgage.us.1008
마감 공시 마감, 거래 비용 및 대출 세부 정보를 추출합니다. prebuilt-mortgage.us.closingDisclosure
결혼 증명서 공동 대출 신청자에 대한 결혼 정보 세부 정보를 추출합니다. prebuilt-marriageCertificate
미국 세금 W-2 소득 확인을 위해 과세 보상 세부 정보를 추출합니다. prebuilt-tax.us.w2

문서 인텔리전스 스튜디오를 사용하여 처리된 샘플 닫기 공개 문서:

샘플 닫는 공개의 스크린샷.

Contract

계약 모델은 당사자, 관할권, 계약 ID 및 타이틀을 포함한 체결한 계약에서 주요 필드 및 품목을 분석하고 추출합니다. 이 모델은 현재 영어 계약 문서를 지원합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 계약 샘플:

문서 인텔리전스 스튜디오를 사용하는 계약 모델 추출 스크린샷.

송장

청구서 모델은 청구서 처리를 자동화하여 고객 이름, 청구 주소, 기한, 지불액, 품목 및 기타 주요 데이터를 추출합니다. 현재 이 모델은 영어, 스페인어, 독일어, 프랑스어, 이탈리아어, 포르투갈어 및 네덜란드어 청구서를 지원합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 청구서 샘플:

샘플 청구서의 스크린샷

Receipt

영수증 모델을 사용하여 판매자 이름, 날짜, 항목, 수량, 인쇄 및 필기 영수증의 합계에 대한 판매 영수증을 검사합니다. 버전 v3.0은 단일 페이지 호텔 영수증 처리도 지원합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 영수증 샘플:

샘플 영수증의 스크린샷

ID 문서(ID)

ID 문서(ID) 모델을 사용하여 미국 운전 면허증(50개 주 전체 및 컬럼비아 특별구) 및 국가별 여권의 전기 페이지(비자 및 기타 여행 문서 제외)를 처리하여 키 필드를 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 미국 운전면허증 샘플:

샘플 ID 카드의 스크린샷

결혼 증명서

결혼 인증서 모델을 사용하여 미국 결혼 인증서를 처리하여 개인, 날짜 및 위치를 포함한 주요 필드를 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리된샘플 미국 결혼 인증서:

샘플 결혼 인증서의 스크린샷.

신용 카드

신용 카드 모델을 사용하여 신용 카드 및 직불 카드를 처리하여 키 필드를 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리된 샘플 신용 카드:

샘플 신용 카드의 스크린샷.

사용자 지정 모델

사용자 지정 모델은 크게 두 가지 유형으로 분류할 수 있습니다. 특정 문서 형식에서 정의된 스키마를 추출할 수 있는 "문서 형식" 및 사용자 지정 추출 모델의 분류를 지원하는 사용자 지정 분류 모델입니다.

사용자 지정 모델 및 관련 모델 빌드 모드 형식의 다이어그램

사용자 지정 문서 모델은 사용자의 비즈니스에 특정한 양식 및 문서에서 데이터를 분석하고 추출합니다. 고유한 콘텐츠 내에서 양식 필드를 인식하고 키-값 쌍과 테이블 데이터를 추출합니다. 시작하려면 양식 형식의 한 가지 예제만 있으면 됩니다.

버전 v3.0 이상 사용자 지정 모델은 템플릿과 인공신경망 모델 모두에서 사용자 지정 템플릿(양식)과 페이지 간 테이블에서 서명 검색을 지원합니다. 서명 감지는 문서에 서명하는 사람의 ID가 아니라 서명의 존재를 찾습니다. 모델이 서명 감지에 대해 unsigned를 반환하면 모델이 정의된 필드에서 서명을 찾지 못한 것입니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 사용자 지정 템플릿 샘플:

문서 인텔리전스 도구의 사용자 지정 양식 분석 창 스크린샷.

사용자 지정 추출

사용자 지정 추출 모델은 사용자 지정 템플릿 또는 사용자 지정 인공신경망의 두 가지 유형 중 하나일 수 있습니다. 사용자 지정 추출 모델을 만들려면 추출하려는 값으로 문서의 데이터 세트에 레이블을 지정하고 레이블이 지정된 데이터 세트를 모델에 학습시킵니다. 시작하려면 동일한 양식 또는 문서 유형의 5개 예제만 있으면 됩니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 사용자 지정 추출 샘플:

문서 인텔리전스 스튜디오에서 사용자 지정 추출 모델 분석 스크린샷.

사용자 지정 분류자

사용자 지정 분류 모델을 사용하면 추출 모델을 호출하기 전에 문서 유형을 식별할 수 있습니다. 분류 모델은 2023-07-31 (GA) API부터 사용할 수 있습니다. 사용자 지정 분류 모델을 학습시키려면 두 개 이상의 고유 클래스와 클래스당 최소 5개의 샘플이 필요합니다.

구성된 모델

구성형 모델은 사용자 지정 모델 컬렉션을 가져와서 사용자의 양식 유형에서 빌드된 단일 모델에 할당하여 만듭니다. 단일 모델 ID로 호출되는 구성 모델에 여러 사용자 지정 모델을 할당할 수 있습니다. 구성된 단일 모델에 최대 200개의 학습시킨 사용자 지정 모델을 할당할 수 있습니다.

문서 인텔리전스 스튜디오에서 구성된 모델 대화창:

문서 인텔리전스 스튜디오의 사용자 지정 모델 작성 대화 상자 창 스크린샷.

입력 요구 사항

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX), HTML
    읽기
    레이아웃 ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류 ✔ (2024-07-31-preview, 2024-02-29-preview)
  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • PDF 및 TIFF의 경우 최대 2,000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서를 분석하기 위한 파일 크기는 유료(S0) 계층의 경우 500MB이고 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50픽셀 x 50픽셀에서 10,000픽셀 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8점 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB이고 인공신경망 모델의 경우 1GB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 1GB이고 최대 10,000페이지입니다. 2024-07-31-preview 및 이후 버전의 경우 학습 데이터의 총 크기는 2GB이고 최대 10,000페이지입니다.

참고 항목

샘플 레이블 지정 도구는 BMP 파일 형식을 지원하지 않습니다. 이는 문서 인텔리전스 Service가 아닌 도구의 제한 사항입니다.

버전 마이그레이션

문서 인텔리전스 v3.1 마이그레이션 가이드를 참조하여 애플리케이션에서 문서 인텔리전스 v3.0을 사용하는 방법을 알아보세요.

모델 설명
문서 분석
레이아웃 문서에서 텍스트 및 레이아웃 정보를 추출합니다.
미리 빌드된
청구서 영어 및 스페인어 청구서에서 주요 정보를 추출합니다.
영수증 영어 영수증에서 주요 정보를 추출합니다.
ID 문서 미국 운전 면허증과 국제 여권에서 주요 정보를 추출합니다.
명함 영어 명함에서 주요 정보를 추출합니다.
사용자 지정
사용자 지정 사용자 비즈니스와 관련된 양식 및 문서에서 데이터를 추출합니다. 사용자 지정 모델은 고객의 고유한 데이터 및 사용 사례를 학습합니다.
구성 사용자 지정 모델 컬렉션을 구성하고 양식 유형으로부터 빌드된 단일 모델에 할당합니다.

레이아웃

Layout API는 문서에서 텍스트, 테이블 및 헤더, 선택 표시 및 구조 정보를 분석하고 추출합니다.

샘플 레이블 지정 도구를 사용하여 처리된 샘플 문서:

샘플 레이블 지정 도구를 사용한 '레이아웃' 분석의 스크린샷

송장

청구서 모델은 판매 청구서에서 주요 정보를 분석하고 추출합니다. 이 API는 여려 형식의 청구서를 분석하고 고객 이름, 청구 주소, 기한, 금액과 같은 주요 정보를 추출합니다.

샘플 레이블 지정 도구를 사용하여 처리된 샘플 청구서:

샘플 레이블 지정 도구를 사용한 샘플 청구서 분석의 스크린샷.

Receipt

  • 영수증 모델은 인쇄 및 필기 판매 영수증에서 주요 정보를 분석하고 추출합니다.

샘플 레이블 지정 도구를 사용하여 처리된 샘플 영수증:

샘플 영수증의 스크린샷

ID 문서

ID 문서 모델은 다음 문서에서 주요 정보를 분석하고 추출합니다.

  • 미국 운전 면허증(모든50개 주와 콜롬비아 특별구)

  • 국제 여권의 인적 사항 페이지(비자 및 기타 여행 문서 제외). 이 API는 ID 문서를 분석하고 추출합니다.

샘플 레이블 지정 도구를 사용하여 처리된 샘플 미국 운전면허증:

샘플 ID 카드의 스크린샷

명함

명함 모델은 명함 이미지에서 주요 정보를 분석하고 추출합니다.

샘플 레이블 지정 도구를 사용하여 처리된 샘플 명함:

샘플 명함의 스크린샷

사용자 지정

  • 사용자 지정 모델은 비즈니스에 특정한 양식 및 문서에서 데이터를 분석하고 추출합니다. API는 고객의 고유한 콘텐츠 내의 양식 필드를 인식하고 키-값 쌍 및 테이블 데이터를 추출하도록 학습된 기계 학습 프로그램입니다. 동일한 양식 유형 예제 5가지만 있으면 시작할 수 있으며, 사용자 지정 모델은 레이블이 지정된 데이터 세트를 사용하여 또는 사용하지 않고 학습시킬 수 있습니다.

샘플 레이블 지정 도구를 사용한 샘플 사용자 지정 모델 처리:

문서 인텔리전스 도구 사용자 지정 양식 분석 창 스크린샷.

구성형 사용자 지정 모델

구성형 모델은 사용자 지정 모델 컬렉션을 가져와서 사용자의 양식 유형에서 빌드된 단일 모델에 할당하여 만듭니다. 단일 모델 ID로 호출되는 구성 모델에 여러 사용자 지정 모델을 할당할 수 있습니다. 구성된 단일 모델에 최대 100개의 학습된 사용자 지정 모델을 할당할 수 있습니다.

샘플 레이블 지정 도구를 사용하여 구성된 모델 대화 상자 창:

문서 인텔리전스 스튜디오의 사용자 지정 모델 작성 대화 상자 창 스크린샷.

모델 데이터 추출

모델 텍스트 추출 언어 감지 선택 표시 테이블 단락 단락 역할 키/값 쌍 필드
레이아웃
청구서
영수증
ID 문서
명함
사용자 지정 양식

입력 요구 사항

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX), HTML
    읽기
    레이아웃 ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류 ✔ (2024-07-31-preview, 2024-02-29-preview)
  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • PDF 및 TIFF의 경우 최대 2,000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서를 분석하기 위한 파일 크기는 유료(S0) 계층의 경우 500MB이고 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50픽셀 x 50픽셀에서 10,000픽셀 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8점 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB이고 인공신경망 모델의 경우 1GB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 1GB이고 최대 10,000페이지입니다. 2024-07-31-preview 및 이후 버전의 경우 학습 데이터의 총 크기는 2GB이고 최대 10,000페이지입니다.

참고 항목

샘플 레이블 지정 도구는 BMP 파일 형식을 지원하지 않습니다. 이는 문서 인텔리전스 Service가 아닌 도구의 제한 사항입니다.

버전 마이그레이션

문서 인텔리전스 v3.1 마이그레이션 가이드를 참조하여 애플리케이션에서 문서 인텔리전스 v3.0을 사용하는 방법을 알아보세요.

다음 단계