문서 처리 모델

Important

  • 문서 인텔리전스 공개 미리 보기 릴리스에서는 현재 개발 중인 기능에 대한 조기 액세스를 제공합니다.
  • 기능, 방식 및 프로세스는 GA(일반 공급) 전에 사용자 피드백에 따라 변경될 수 있습니다.
  • 문서 인텔리전스 클라이언트 라이브러리의 공개 미리 보기 버전은 기본적으로 REST API 버전 2024-02-29-미리 보기로 설정됩니다.
  • 공개 미리 보기 버전 2024-02-29-미리 보기는 현재 다음 Azure 지역에서만 사용할 수 있습니다.
  • 미국 동부
  • 미국 서부2
  • 서유럽

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.1(GA)파란색 확인 표시v3.0(GA)파란색 확인 표시v2.1(GA)

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v3.1(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.0파란색 확인 표시v2.1

이 콘텐츠의 적용 대상:확인 표시v3.0(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기)보라색 확인 표시v3.1 | 이전 버전:파란색 확인 표시v2.1

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v2.1 | 최신 버전:파란색 확인 표시v4.0(미리 보기)

Azure AI 문서 인텔리전스는 앱 및 흐름에 지능형 문서 처리를 추가할 수 있는 다양한 모델을 지원합니다. 미리 빌드된 도메인별 모델을 사용하거나 특정 비즈니스 요구 사항과 사용 사례에 맞게 조정된 사용자 지정 모델을 학습시킬 수 있습니다. 문서 인텔리전스는 REST API 또는 Python, C#, Java 및 JavaScript 클라이언트 라이브러리와 함께 사용할 수 있습니다.

모델 개요

다음 표에서는 각 현재 미리 보기 및 안정적인 API에 사용 가능한 모델을 보여 줍니다.

모델 형식 모델 2024-02-29-미리 보기
글머리 기호(&b) 2023-10-31-미리 보기
2023-07-31(GA) 2022-08-31(GA) v2.1(GA)
문서 분석 모델 읽음 ✔️ ✔️ ✔️ 해당 없음
문서 분석 모델 레이아웃 ✔️ ✔️ ✔️ ✔️
문서 분석 모델 일반 문서 레이아웃으로 이동** ✔️ ✔️ 해당 없음
미리 빌드된 모델 계약 ✔️ ✔️ 해당 없음 해당 없음
미리 빌드된 모델 의료 보험 카드 ✔️ ✔️ ✔️ 해당 없음
미리 빌드된 모델 ID 문서 ✔️ ✔️ ✔️ ✔️
미리 빌드된 모델 청구서 ✔️ ✔️ ✔️ ✔️
미리 빌드된 모델 영수증 ✔️ ✔️ ✔️ ✔️
미리 빌드된 모델 US 1040 세금* ✔️ ✔️ 해당 없음 해당 없음
미리 빌드된 모델 US 1098 세금* ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 US 1099 세금* ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 미국 W2 세금 ✔️ ✔️ ✔️ 해당 없음
미리 빌드된 모델 미국 모기지 1003 URLA ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 미국 모기지 1008 요약 ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 미국 모기지 마감 공시 ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 결혼 인증서 ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 신용 카드 ✔️ 해당 없음 해당 없음 해당 없음
미리 빌드된 모델 명함 사용되지 않음 ✔️ ✔️ ✔️
사용자 지정 분류 모델 사용자 지정 분류자 ✔️ ✔️ 해당 없음 해당 없음
사용자 지정 추출 모델 사용자 지정 인공신경망 ✔️ ✔️ ✔️ 해당 없음
Customextraction 모델 사용자 지정 템플릿 ✔️ ✔️ ✔️ ✔️
사용자 지정 추출 모델 사용자 지정 구성형 ✔️ ✔️ ✔️ ✔️
모든 모델 추가 기능 ✔️ ✔️ 해당 없음 해당 없음

* - 하위 모델을 포함합니다. 지원되는 변형 및 하위 형식에 대한 모델 관련 정보를 참조하세요.

추가 기능 추가 기능/무료 2024-02-29-미리 보기
&bullet [2023-10-31-미리 보기](/rest/api/aiservices/operation-groups?view=rest-aiservices-2024-02-29-preview&preserve-view=true
2023-07-31(GA) 2022-08-31(GA) v2.1(GA)
Font 속성 추출 추가 기능 ✔️ ✔️ 해당 없음 해당 없음
수식 추출 추가 기능 ✔️ ✔️ 해당 없음 해당 없음
고해상도 추출 추가 기능 ✔️ ✔️ 해당 없음 해당 없음
바코드 추출 Free ✔️ ✔️ 해당 없음 해당 없음
언어 감지 Free ✔️ ✔️ 해당 없음 해당 없음
키 값 쌍 Free ✔️ 해당 없음 해당 없음 해당 없음
쿼리 필드 추가 기능* ✔️ 해당 없음 해당 없음 해당 없음

모델 분석 기능

Model ID 콘텐츠 추출 쿼리 필드 단락 단락 역할 선택 표시 테이블 키/값 쌍 언어 바코드 문서 분석 수식* 스타일 글꼴* 고해상도*
prebuilt-read O O O O O
prebuilt-layout O O O O O
prebuilt-document O O O O O
prebuilt-businessCard
prebuilt-contract O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(변형) O O O O O
prebuilt-tax.us.1040(변형) O O O O O
{ customModelName } O O O O O

✓ - 사용함
O - 선택적
* - 프리미엄 기능에는 추가 비용이 발생합니다

추가 기능* - 쿼리 필드 가격은 다른 추가 기능과 다르게 책정됩니다. 자세한 내용은 가격 책정을 참조하세요.

모델 설명
문서 분석 모델
OCR 읽기 단어, 위치 및 검색된 언어를 포함하여 인쇄 및 필기 텍스트를 추출합니다.
레이아웃 분석 테이블, 선택 표시, 제목, 섹션 제목 등과 같은 텍스트 및 문서 레이아웃 요소를 추출합니다.
미리 빌드된 모델
의료 보험 카드 미국 의료 보험 카드에서 보험사, 회원, 처방전, 그룹 번호 및 기타 주요 정보를 추출하여 의료 프로세스를 자동화합니다.
미국 세금 문서 모델 U2 세금 양식을 처리하여 직원, 고용주, 임금 및 기타 정보를 추출합니다.
미국 모기지 문서 모델 미국 모기지 양식을 처리하여 대출자 대출 및 부동산 정보를 추출합니다.
계약 계약 및 당사자 세부 정보를 추출합니다.
청구서 청구서를 자동화합니다.
영수증 영수증에서 영수증 데이터를 추출합니다.
ID 문서(ID) 미국 운전면허증과 국가별 여권에서 ID(ID) 필드를 추출합니다.
명함 명함을 검사하여 주요 필드와 데이터를 애플리케이션으로 추출합니다.
사용자 지정 모델
사용자 지정 모델(개요) 사용자 비즈니스와 관련된 양식 및 문서에서 데이터를 추출합니다. 사용자 지정 모델은 고객의 고유한 데이터 및 사용 사례를 학습합니다.
사용자 지정 추출 모델 사용자 지정 템플릿 모델은 레이아웃 신호를 사용하여 문서에서 값을 추출하며, 정의된 시각적 템플릿을 사용하여 고도로 구조화된 문서에서 필드를 추출하는 데 적합합니다.
사용자 지정 인공신경망 모델은 구조화된 문서, 반구조화된 문서 및 구조화되지 않은 문서에서 필드를 추출하기 위해 다양한 문서 유형에 대해 학습됩니다.
사용자 지정 분류 모델 사용자 지정 분류 모델은 입력 파일의 각 페이지를 분류하여 문서를 식별할 수 있으며 입력 파일 내에서 여러 문서 또는 단일 문서의 여러 인스턴스를 식별할 수도 있습니다.
구성형 모델 여러 사용자 지정 모델을 단일 모델로 결합하여 단일 구성 모델로 다양한 문서 형식 처리를 자동화합니다.

명함 모델을 제외한 모든 모델에 대해 문서 인텔리전스는 이제 더 정교한 분석을 허용하는 추가 기능 기능을 지원합니다. 이러한 선택적 기능은 문서 추출 시나리오에 따라 활성화 및 비활성화할 수 있습니다. 2023-07-31(GA) 이상 API 버전에 사용할 수 있는 7가지 추가 기능입니다.

모델 세부 정보

이 섹션에서는 각 모델에서 예상할 수 있는 출력에 대해 설명합니다. 추가 기능으로 대부분의 모델의 출력을 확장할 수 있습니다.

OCR 읽기

Read API는 줄, 단어, 위치, 감지된 언어, 필기 입력 스타일(감지된 경우)을 분석하고 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 문서 샘플:

문서 인텔리전스 스튜디오를 사용하여 처리된 샘플 문서 스크린샷 읽기

레이아웃 분석

레이아웃 분석 모델은 텍스트, 테이블, 선택 표시 및 제목, 섹션 머리글, 페이지 머리글, 페이지 바닥글 등과 같은 기타 구조 요소를 분석하고 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 문서 샘플:

문서 인텔리전스 스튜디오를 사용하여 처리한 샘플 신문 페이지 스크린샷.

의료 보험 카드

의료 보험 카드 모델은 강력한 OCR(광학 인식) 기능과 딥 러닝 모델을 결합하여 미국 의료 보험 카드에서 주요 정보를 분석하고 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 미국 의료 보험 카드:

문서 인텔리전스 스튜디오에서 미국 의료 보험 카드 분석 샘플 스크린샷.

미국 세금 문서

미국 세금 문서 모델은 선택한 세금 문서 그룹에서 주요 필드와 품목을 분석하고 추출합니다. API는 전화 캡처 이미지, 스캔한 문서 및 디지털 PDF를 포함하여 다양한 형식과 품질의 영어 미국 세금 문서의 분석을 지원합니다. 현재 지원되는 모델은 다음과 같습니다.

모델 설명 ModelID
미국 세금 W-2 과세 보상 세부 정보를 추출합니다. prebuilt-tax.us.W-2
미국 세금 1040 모기지 이자 세부 정보를 추출합니다. prebuilt-tax.us.1040(변형)
미국 세금 1098 모기지 이자 세부 정보를 추출합니다. prebuilt-tax.us.1098(변형)
미국 세금 1099 고용주 이외의 출처에서 받은 소득을 추출합니다. prebuilt-tax.us.1099(변형)

문서 인텔리전스 스튜디오를 사용하여 처리한 W-2 문서 샘플:

샘플 W-2의 스크린샷

미국 모기지 문서

미국 모기지 문서 모델은 선택한 모기지 문서 그룹에서 대출자, 대출 및 부동산 정보를 포함한 주요 분야를 분석하고 추출합니다. API는 전화 캡처 이미지, 스캔한 문서 및 디지털 PDF를 포함하여 다양한 형식과 품질의 영어 미국 모기지 문서의 분석을 지원합니다. 현재 지원되는 모델은 다음과 같습니다.

모델 설명 ModelID
1003 EULA(최종 사용자 사용권 계약) 대출, 대출자, 부동산 세부 정보를 추출합니다. prebuilt-mortgage.us.1003
1008 요약 문서 대출자, 판매자, 부동산, 모기지 및 인수 세부 정보를 추출합니다. prebuilt-mortgage.us.1008
마감 공시 마감, 거래 비용 및 대출 세부 정보를 추출합니다. prebuilt-mortgage.us.closingDisclosure
결혼 증명서 공동 대출 신청자에 대한 결혼 정보 세부 정보를 추출합니다. prebuilt-marriageCertificate
미국 세금 W-2 소득 확인을 위해 과세 보상 세부 정보를 추출합니다. prebuilt-tax.us.W-2

문서 인텔리전스 스튜디오를 사용하여 처리된 샘플 닫기 공개 문서:

샘플 닫는 공개의 스크린샷.

Contract

계약 모델은 당사자, 관할권, 계약 ID 및 타이틀을 포함한 체결한 계약에서 주요 필드 및 품목을 분석하고 추출합니다. 이 모델은 현재 영어 계약 문서를 지원합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 계약 샘플:

문서 인텔리전스 스튜디오를 사용하는 계약 모델 추출 스크린샷.

송장

청구서 모델은 청구서 처리를 자동화하여 고객 이름, 청구 주소, 기한, 지불액, 품목 및 기타 주요 데이터를 추출합니다. 현재 이 모델은 영어, 스페인어, 독일어, 프랑스어, 이탈리아어, 포르투갈어 및 네덜란드어 청구서를 지원합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 청구서 샘플:

샘플 청구서의 스크린샷

Receipt

영수증 모델을 사용하여 판매자 이름, 날짜, 항목, 수량, 인쇄 및 필기 영수증의 합계에 대한 판매 영수증을 검사합니다. 버전 v3.0은 단일 페이지 호텔 영수증 처리도 지원합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 영수증 샘플:

샘플 영수증의 스크린샷

ID 문서(ID)

ID 문서(ID) 모델을 사용하여 미국 운전 면허증(50개 주 전체 및 컬럼비아 특별구) 및 국가별 여권의 전기 페이지(비자 및 기타 여행 문서 제외)를 처리하여 키 필드를 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 미국 운전면허증 샘플:

샘플 ID 카드의 스크린샷

결혼 증명서

결혼 인증서 모델을 사용하여 미국 결혼 인증서를 처리하여 개인, 날짜 및 위치를 포함한 주요 필드를 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리된샘플 미국 결혼 인증서:

샘플 결혼 인증서의 스크린샷.

신용 카드

신용 카드 모델을 사용하여 신용 카드 및 직불 카드를 처리하여 키 필드를 추출합니다.

문서 인텔리전스 스튜디오를 사용하여 처리된 샘플 신용 카드:

샘플 신용 카드의 스크린샷.

사용자 지정 모델

사용자 지정 모델은 크게 두 가지 유형으로 분류할 수 있습니다. 특정 문서 형식에서 정의된 스키마를 추출할 수 있는 "문서 형식" 및 사용자 지정 추출 모델의 분류를 지원하는 사용자 지정 분류 모델입니다.

사용자 지정 모델 및 관련 모델 빌드 모드 형식의 다이어그램

사용자 지정 문서 모델은 사용자의 비즈니스에 특정한 양식 및 문서에서 데이터를 분석하고 추출합니다. 고유 콘텐츠 내의 양식 필드를 인식하고 키-값 쌍과 테이블 데이터를 추출하도록 학습되었습니다. 시작하려면 양식 형식의 한 가지 예제만 있으면 됩니다.

버전 v3.0 사용자 지정 모델은 템플릿 및 인공신경망 모델 모두에서 사용자 지정 템플릿(양식) 및 페이지 간 테이블에서 서명 검색을 지원합니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 사용자 지정 템플릿 샘플:

문서 인텔리전스 도구의 사용자 지정 양식 분석 창 스크린샷.

사용자 지정 추출

사용자 지정 추출 모델은 사용자 지정 템플릿 또는 사용자 지정 인공신경망의 두 가지 유형 중 하나일 수 있습니다. 사용자 지정 추출 모델을 만들려면 추출하려는 값으로 문서의 데이터 세트에 레이블을 지정하고 레이블이 지정된 데이터 세트를 모델에 학습시킵니다. 시작하려면 동일한 양식 또는 문서 유형의 5개 예제만 있으면 됩니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 사용자 지정 추출 샘플:

문서 인텔리전스 스튜디오에서 사용자 지정 추출 모델 분석 스크린샷.

사용자 지정 분류자

사용자 지정 분류 모델을 사용하면 추출 모델을 호출하기 전에 문서 유형을 식별할 수 있습니다. 분류 모델은 2023-07-31 (GA) API부터 사용할 수 있습니다. 사용자 지정 분류 모델을 학습시키려면 두 개 이상의 고유 클래스와 클래스당 최소 5개의 샘플이 필요합니다.

구성된 모델

구성형 모델은 사용자 지정 모델 컬렉션을 가져와서 사용자의 양식 유형에서 빌드된 단일 모델에 할당하여 만듭니다. 단일 모델 ID로 호출되는 구성 모델에 여러 사용자 지정 모델을 할당할 수 있습니다. 구성된 단일 모델에 최대 200개의 학습시킨 사용자 지정 모델을 할당할 수 있습니다.

문서 인텔리전스 스튜디오에서 구성된 모델 대화창:

문서 인텔리전스 스튜디오의 사용자 지정 모델 작성 대화 상자 창 스크린샷.

입력 요구 사항

  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX) 및 HTML
    읽음
    레이아웃 ✔ (2024-02-29-미리 보기, 2023-10-31-미리 보기)
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류 ✔ (2024-02-29-미리 보기)
  • PDF 및 TIFF의 경우 최대 2000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서 분석을 위한 파일 크기는 유료(S0) 계층의 경우 500MB, 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50 x 50픽셀에서 10,000 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8포인트 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB, 신경망 모델의 경우 1G-MB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 최대 10,000페이지인 1GB입니다.

참고 항목

샘플 레이블 지정 도구는 BMP 파일 형식을 지원하지 않습니다. 이는 문서 인텔리전스 Service가 아닌 도구의 제한 사항입니다.

버전 마이그레이션

문서 인텔리전스 v3.1 마이그레이션 가이드를 참조하여 애플리케이션에서 문서 인텔리전스 v3.0을 사용하는 방법을 알아보세요.

모델 설명
문서 분석
레이아웃 문서에서 텍스트 및 레이아웃 정보를 추출합니다.
미리 빌드된
청구서 영어 및 스페인어 청구서에서 주요 정보를 추출합니다.
영수증 영어 영수증에서 주요 정보를 추출합니다.
ID 문서 미국 운전 면허증과 국제 여권에서 주요 정보를 추출합니다.
명함 영어 명함에서 주요 정보를 추출합니다.
사용자 지정
사용자 지정 사용자 비즈니스와 관련된 양식 및 문서에서 데이터를 추출합니다. 사용자 지정 모델은 고객의 고유한 데이터 및 사용 사례를 학습합니다.
구성 사용자 지정 모델 컬렉션을 구성하고 양식 유형으로부터 빌드된 단일 모델에 할당합니다.

레이아웃

Layout API는 문서에서 텍스트, 테이블 및 헤더, 선택 표시 및 구조 정보를 분석하고 추출합니다.

샘플 레이블 지정 도구를 사용하여 처리된 샘플 문서:

샘플 레이블 지정 도구를 사용한 '레이아웃' 분석의 스크린샷

송장

청구서 모델은 판매 청구서에서 주요 정보를 분석하고 추출합니다. 이 API는 여려 형식의 청구서를 분석하고 고객 이름, 청구 주소, 기한, 금액과 같은 주요 정보를 추출합니다.

샘플 레이블 지정 도구를 사용하여 처리된 샘플 청구서:

샘플 레이블 지정 도구를 사용한 샘플 청구서 분석의 스크린샷.

Receipt

  • 영수증 모델은 인쇄 및 필기 판매 영수증에서 주요 정보를 분석하고 추출합니다.

샘플 레이블 지정 도구를 사용하여 처리된 샘플 영수증:

샘플 영수증의 스크린샷

ID 문서

ID 문서 모델은 다음 문서에서 주요 정보를 분석하고 추출합니다.

  • 미국 운전 면허증(모든50개 주와 콜롬비아 특별구)

  • 국제 여권의 인적 사항 페이지(비자 및 기타 여행 문서 제외). 이 API는 ID 문서를 분석하고 추출합니다.

샘플 레이블 지정 도구를 사용하여 처리된 샘플 미국 운전면허증:

샘플 ID 카드의 스크린샷

명함

명함 모델은 명함 이미지에서 주요 정보를 분석하고 추출합니다.

샘플 레이블 지정 도구를 사용하여 처리된 샘플 명함:

샘플 명함의 스크린샷

사용자 지정

  • 사용자 지정 모델은 비즈니스에 특정한 양식 및 문서에서 데이터를 분석하고 추출합니다. API는 고객의 고유한 콘텐츠 내의 양식 필드를 인식하고 키-값 쌍 및 테이블 데이터를 추출하도록 학습된 기계 학습 프로그램입니다. 동일한 양식 유형 예제 5가지만 있으면 시작할 수 있으며, 사용자 지정 모델은 레이블이 지정된 데이터 세트를 사용하여 또는 사용하지 않고 학습시킬 수 있습니다.

샘플 레이블 지정 도구를 사용한 샘플 사용자 지정 모델 처리:

문서 인텔리전스 도구 사용자 지정 양식 분석 창 스크린샷.

구성형 사용자 지정 모델

구성형 모델은 사용자 지정 모델 컬렉션을 가져와서 사용자의 양식 유형에서 빌드된 단일 모델에 할당하여 만듭니다. 단일 모델 ID로 호출되는 구성 모델에 여러 사용자 지정 모델을 할당할 수 있습니다. 구성된 단일 모델에 최대 100개의 학습된 사용자 지정 모델을 할당할 수 있습니다.

샘플 레이블 지정 도구를 사용하여 구성된 모델 대화 상자 창:

문서 인텔리전스 스튜디오의 사용자 지정 모델 작성 대화 상자 창 스크린샷.

모델 데이터 추출

모델 텍스트 추출 언어 감지 선택 표시 테이블 단락 단락 역할 키/값 쌍 필드
레이아웃
청구서
영수증
ID 문서
명함
사용자 지정 양식

입력 요구 사항

  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX) 및 HTML
    읽음
    레이아웃 ✔ (2024-02-29-미리 보기, 2023-10-31-미리 보기)
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류 ✔ (2024-02-29-미리 보기)
  • PDF 및 TIFF의 경우 최대 2000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서 분석을 위한 파일 크기는 유료(S0) 계층의 경우 500MB, 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50 x 50픽셀에서 10,000 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8포인트 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB, 신경망 모델의 경우 1G-MB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 최대 10,000페이지인 1GB입니다.

참고 항목

샘플 레이블 지정 도구는 BMP 파일 형식을 지원하지 않습니다. 이는 문서 인텔리전스 Service가 아닌 도구의 제한 사항입니다.

버전 마이그레이션

문서 인텔리전스 v3.1 마이그레이션 가이드를 참조하여 애플리케이션에서 문서 인텔리전스 v3.0을 사용하는 방법을 알아보세요.

다음 단계