Azure AI 문서 인텔리전스란?

Important

  • 문서 인텔리전스 공개 미리 보기 릴리스에서는 현재 개발 중인 기능에 대한 조기 액세스를 제공합니다.
  • 기능, 방식 및 프로세스는 GA(일반 공급) 전에 사용자 피드백에 따라 변경될 수 있습니다.
  • Document Intelligence 클라이언트 라이브러리의 공개 미리 보기 버전은 기본적으로 REST API 버전 2024-02-29-preview로 설정됩니다.
  • 공개 미리 보기 버전 2024-02-29-preview 는 현재 다음 Azure 지역에서만 사용할 수 있습니다.
  • 미국 동부
  • 미국 서부2
  • 서유럽

이 콘텐츠의 적용 대상은 다음과 같습니다.검사markv4.0(미리 보기) | 이전 버전:파란색 검사markv3.1(GA)파란색 검사markv3.0(GA)파란색 검사markv2.1(GA)

이 콘텐츠의 적용 대상은 다음과 같습니다.검사markv3.1(GA) | 최신 버전:purple-검사markv4.0(미리 보기) | 이전 버전:파란색 검사markv3.0파란색 검사markv2.1

이 콘텐츠의 적용 대상은 다음과 같습니다.검사markv3.0(GA) | 최신 버전:purple-검사markv4.0(미리 보기)purple-검사markv3.1(미리 보기) | 이전 버전:파란색 검사markv2.1

이 콘텐츠의 적용 대상은 다음과 같습니다.검사markv2.1 | 최신 버전:파란색 검사markv4.0(미리 보기)

참고 항목

Form Recognizer는 이제 Azure AI 문서 인텔리전스입니다!

  • 2023년 7월부터 Azure AI 서비스는 이전에 Cognitive Services 및 Azure Applied AI Services로 알려진 모든 것을 포함합니다.
  • 가격 책정에는 변화가 없습니다.
  • Cognitive ServicesAzure Applied AI라는 이름은 Azure 청구, 비용 분석, 가격 목록 및 가격 API에서 계속 사용됩니다.
  • v3.1을 포함하여 그 이전 API(애플리케이션 프로그래밍 인터페이스) 또는 SDK에 대한 주요 변경 내용은 없습니다. v4.0부터 API와 SDK가 문서 인텔리전스로 업데이트됩니다.
  • 일부 플랫폼은 여전히 이름 변경 업데이트를 기다리고 있습니다. 설명서에서 Form Recognizer 또는 문서 인텔리전스에 대한 모든 언급은 동일한 Azure 서비스를 나타냅니다.

Azure AI 문서 인텔리전스는 지능형 문서 처리 솔루션을 빌드할 수 있는 클라우드 기반 Azure AI 서비스입니다. 다양한 데이터 형식에 걸친 방대한 양의 데이터가 양식과 문서에 저장됩니다. 문서 인텔리전스를 사용하면 데이터가 수집 및 처리되는 속도를 효과적으로 관리할 수 있으며 향상된 운영, 정보에 입각한 데이터 기반 의사 결정 및 인식 가능한 혁신의 핵심입니다.

| ✔️ 문서 분석 모델 | ✔️ 미리 빌드된 모델 | ✔️ 사용자 지정 모델 |

문서 분석 모델

문서 분석 모델을 사용하면 양식 및 문서에서 텍스트를 추출하고 조직의 작업, 사용 또는 진행 상황에 맞는 구조화된 비즈니스 지원 콘텐츠를 반환할 수 있습니다.


읽기 | 인쇄 및
필기 텍스트를 추출합니다.


레이아웃 | 문자, 테이블,
및 문서 구조를 추출합니다.


읽기 | 인쇄 및
필기 텍스트를 추출합니다.


레이아웃 | 문자, 테이블,
및 문서 구조를 추출합니다.


일반 문서 | 텍스트, 구조,
키-값 쌍을 추출합니다.

미리 빌드된 모델

미리 빌드된 모델을 사용하면 자체 모델을 학습하고 빌드할 필요 없이 앱 및 흐름에 지능형 문서 처리를 추가할 수 있습니다.


청구서 | 고객 및
공급업체 세부 정보를 추출합니다.


영수증 | 판매 거래
세부 정보를 추출합니다.


식별 | 식별 및
확인 세부 정보를 추출합니다.


1003 EULA | 모기지 세부 정보를 추출합니다.


양식 1008 | 모기지 세부 정보를 추출합니다.


공개 닫기 | 모기지 세부 정보를 추출합니다.


건강 보험 카드 | 건강 보험
세부 정보를 추출합니다.


계약 | 계약 및
당사자 세부 정보를 추출합니다.


신용/직불 카드 | 은행 카드 정보를 추출합니다.


결혼 인증서 | 결혼 인증서에서 정보를 추출합니다.


미국 세금 W-2 양식 | 과세 보상
세부 정보를 추출합니다.


미국 세금 1098 양식 | 모기지 이자 세부 정보를 추출합니다.


미국 세금 1098-E 양식 | 학자금 대출 이자 세부 정보를 추출합니다.


미국 세금 1098-T 양식 | 정규화된 수업료 세부 정보를 추출합니다.


미국 세금 1099 양식 | 1099 양식의 변형에서 정보를 추출합니다.


미국 세금 1040 양식 | 1040 양식의 변형에서 정보를 추출합니다.


청구서 | 고객 및
공급업체 세부 정보를 추출합니다.


영수증 | 판매 거래
세부 정보를 추출합니다.


식별 | 식별 및
확인 세부 정보를 추출합니다.


건강 보험 카드 | 건강 보험 세부 정보를 추출합니다.


명함 | 비즈니스 연락처 세부 정보를 추출합니다.


계약 | 계약 및
당사자 세부 정보를 추출합니다.


미국 세금 W-2 양식 | 과세 보상
세부 정보를 추출합니다.


미국 세금 1098 양식 | 모기지 이자 세부 정보를 추출합니다.


미국 세금 1098-E 양식 | 학자금 대출 이자 세부 정보를 추출합니다.


미국 세금 1098-T 양식 | 정규화된 수업료 세부 정보를 추출합니다.

사용자 지정 모델

  • 사용자 지정 모델은 레이블이 지정된 데이터 세트를 사용하여 사용 사례와 관련된 양식 및 문서에서 고유한 데이터를 추출하도록 학습됩니다.
  • 독립 실행형 사용자 지정 모델을 결합하여 작성된 모델을 만들 수 있습니다.
  • 추출 모델
    ✔️ 사용자 지정 추출 모델은 문서에서 레이블이 지정된 필드를 추출하도록 학습됩니다.


사용자 지정 템플릿 | 정적 레이아웃에서 데이터를 추출합니다.


사용자 지정 인공신경망 | 혼합 형식 문서에서 데이터를 추출합니다.


사용자 지정 구성형 | 모델 컬렉션을 사용하여 데이터를 추출합니다.

  • 분류 모델
    ✔️ 사용자 지정 분류자는 추출 모델을 호출하기 전에 문서 형식을 식별합니다.


사용자 지정 분류자 | 추출 모델을 호출하기 전에 지정된 문서 형식(클래스)
을 식별합니다.

추가 기능

문서 인텔리전스는 문서 추출 시나리오에 따라 사용하고 사용하지 않을 수 있는 선택적 기능을 지원합니다. 다음 추가 기능은 2023-07-31 (GA) 이상 릴리스에 사용할 수 있습니다.

문서 인텔리전스는 문서 추출 시나리오에 따라 사용하고 사용하지 않을 수 있는 선택적 기능을 지원합니다. 다음 추가 기능 기능은 이후 릴리스에2024-02-29-preview2023-10-31-preview 사용할 수 있습니다.

분석 기능

Model ID 콘텐츠 추출 쿼리 필드 단락 단락 역할 선택 표시 테이블 키/값 쌍 언어 바코드 문서 분석 수식* 스타일 글꼴* 고해상도*
prebuilt-read O O O O O
prebuilt-layout O O O O O
prebuilt-document O O O O O
prebuilt-businessCard
prebuilt-contract O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(변형) O O O O O
prebuilt-tax.us.1040(변형) O O O O O
{ customModelName } O O O O O

✓ - 사용함
O - 선택적
* - 프리미엄 기능에는 추가 비용이 발생합니다

모델 및 개발 옵션

참고 항목

다음 문서 이해 모델 및 개발 옵션은 문서 인텔리전스 서비스 v3.0에서 지원됩니다.

문서 인텔리전스를 사용하여 애플리케이션 및 워크플로에서 문서 처리를 자동화하고, 데이터 기반 전략을 개선하고, 문서 검색 기능을 보강할 수 있습니다. 이 표의 링크를 사용하여 각 모델에 대해 자세히 알아보고 개발 옵션을 찾아보세요.

읽기

문서 인텔리전스 스튜디오를 사용하는 읽기 모델 분석의 스크린샷

Model ID 설명 자동화 사용 사례 개발 옵션
prebuilt-read ● 문서에서 텍스트를 추출합니다.
데이터 추출
● 모든 문서를 디지털화합니다.
● 규정 준수 및 감사.
● 번역하기 전에 필기 노트를 처리합니다.
문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Layout

Document Intelligence Studio를 사용한 레이아웃 모델 분석의 스크린샷.

Model ID 설명 자동화 사용 사례 개발 옵션
prebuilt-layout ● 문서에서 텍스트 및 레이아웃 정보를 추출합니다.
데이터 추출
● 구조체별 문서 인덱싱 및 검색.
● 재무 및 의료 보고서 분석.
문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript

일반 문서(2023-10-31-preview에서 사용되지 않음)

문서 인텔리전스 스튜디오를 사용하는 일반 문서 모델 분석의 스크린샷.

Model ID 설명 자동화 사용 사례 개발 옵션
prebuilt-document ● 문서에서 텍스트, 레이아웃 및 키-값 쌍을 추출합니다.
데이터 및 필드 추출
● 키-값 쌍 추출.
● 양식 처리.
● 설문 조사 데이터 수집 및 분석.
문서 인텔리전스 스튜디오
REST API

송장

문서 인텔리전스 스튜디오를 사용하는 청구서 모델 분석의 스크린샷.

Model ID 설명 자동화 사용 사례 개발 옵션
prebuilt-invoice ● 청구서에서 주요 정보를 추출합니다.
데이터 및 필드 추출
● 미지불 처리.
● 자동 세금 기록 및 보고.
문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Receipt

문서 인텔리전스 스튜디오를 사용하는 영수증 모델 분석의 스크린샷.

Model ID 설명 자동화 사용 사례 개발 옵션
prebuilt-receipt ● 영수증에서 주요 정보를 추출합니다.
데이터 및 필드 추출
● 영수증 모델 v3.0은 단일 페이지 호텔 영수증 처리를 지원합니다.
● 비용 관리.
● 소비자 행동 데이터 분석.
● 고객 충성도 프로그램.
● 상품 반품 처리.
● 자동 세금 기록 및 보고.
문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript

ID(신원)

문서 인텔리전스 스튜디오를 사용하는 ID(신원) 문서 모델 분석의 스크린샷.

Model ID 설명 자동화 사용 사례 개발 옵션
prebuilt-idDocument ● 여권 및 ID 카드에서 주요 정보를 추출합니다.
문서 유형
● 미국 운전면허증에서 보증, 제한 및 차량 분류를 추출합니다.
● KYC(Know Your Customer) 금융 서비스 지침 준수.
● 의료 계정 관리.
● ID 검사점 및 게이트웨이.
● 호텔 등록.
문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript

의료 보험 카드

문서 인텔리전스 스튜디오를 사용하는 건강 보험 카드 모델 분석의 스크린샷

Model ID 설명 자동화 사용 사례 개발 옵션
prebuilt-healthInsuranceCard.us ● 미국 건강 보험 카드에서 주요 정보를 추출합니다.
데이터 및 필드 추출
● 적용 범위 및 자격 확인.
● 예측 모델링.
● 가치 기반 분석.
문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript

계약 모델

문서 인텔리전스 스튜디오를 사용하는 계약 모델 추출 스크린샷.

Model ID 설명 개발 옵션
prebuilt-contract 계약 및 당사자 세부 정보를 추출합니다. 문서 인텔리전스 스튜디오
REST API

미국 세금 W-2 모델

문서 인텔리전스 스튜디오를 사용하는 W-2 모델 분석의 스크린샷

Model ID 설명 자동화 사용 사례 개발 옵션
prebuilt-tax.us.W-2 ● IRS 미국 W2 세금 양식(2018-2021년)에서 주요 정보를 추출합니다.
데이터 및 필드 추출
● 자동화된 세금 문서 관리.
● 모기지 대출 신청 처리.
문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript

미국 세금 1098 양식

문서 인텔리전스 스튜디오에서 분석된 미국 1098 세금 양식의 스크린샷.

Model ID 설명 개발 옵션
prebuilt-tax.us.1098 모기지 이자 정보 및 세부 정보를 추출합니다. 문서 인텔리전스 스튜디오
REST API

미국 세금 1098-E 양식

문서 인텔리전스 스튜디오에서 분석된 미국 1098-E 세금 양식의 스크린샷.

Model ID 설명 개발 옵션
prebuilt-tax.us.1098E 학자금 대출 정보 및 세부 정보를 추출합니다. 문서 인텔리전스 스튜디오
REST API

미국 세금 1098-T 양식

문서 인텔리전스 스튜디오에서 분석된 미국 1098-T 세금 양식의 스크린샷.

Model ID 설명 개발 옵션
prebuilt-tax.us.1098T 수업료 정보 및 세부 정보를 추출합니다. 문서 인텔리전스 스튜디오
REST API

미국 세금 1099 (및 변형) 양식

Document Intelligence Studio에서 분석된 미국 1099 세금 양식의 스크린샷

Model ID 설명 개발 옵션
prebuilt-tax.us.1099(변형) 1099 양식 변형에서 정보를 추출합니다. 문서 인텔리전스 스튜디오
REST API

명함

문서 인텔리전스 스튜디오를 사용하는 명함 모델 분석의 스크린샷.

Model ID 설명 자동화 사용 사례 개발 옵션
prebuilt-businessCard ● 명함에서 주요 정보를 추출합니다.
데이터 및 필드 추출
● 영업 책임자 및 마케팅 관리. 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript

사용자 지정 모델 개요

문서 인텔리전스 스튜디오를 사용하는 사용자 지정 모델 학습의 스크린샷.

정보 설명 자동화 사용 사례 개발 옵션
사용자 지정 모델 일련의 대표적인 학습 문서 세트에서 만들어진 모델을 기반으로 양식 및 문서에서 정형 데이터로 정보를 추출합니다. 사용자 비즈니스 및 사용 사례와 관련된 양식 및 문서에서 고유 데이터를 추출합니다. 문서 인텔리전스 스튜디오
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

사용자 지정 템플릿

문서 인텔리전스 스튜디오를 사용하는 사용자 지정 템플릿 모델 분석의 스크린샷.

참고 항목

사용자 지정 템플릿 모델을 학습하려면 buildMode 속성을 template으로 설정합니다. 자세한 내용은 see템플릿 모델 학습을 참조하세요.

정보 설명 자동화 사용 사례 개발 옵션
사용자 지정 템플릿 모델 사용자 지정 템플릿 모델은 정형 및 반정형 문서에서 레이블이 지정된 값과 필드를 추출합니다.
정의된 시각적 템플릿 또는 일반적인 시각적 레이아웃, 양식을 사용하여 고도로 구조화된 문서에서 주요 데이터를 추출합니다. 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK

사용자 지정 인공신경망

문서 인텔리전스 스튜디오를 사용하는 사용자 지정 인공신경망 모델 분석의 스크린샷.

참고 항목

사용자 지정 인공신경망 모델을 학습하려면 buildMode 속성을 neural로 설정합니다. 자세한 내용은 see인공신경망 모델 학습을 참조하세요.

정보 설명 자동화 사용 사례 개발 옵션
사용자 지정 인공신경망 모델 사용자 지정 인공신경망 모델은 정형(설문 조사, 설문지), 반정형(청구서, 구매 주문) 및 비정형 문서(계약, 편지)에서 레이블이 지정된 데이터를 추출하는 데 사용됩니다. 정형 문서와 비정형 문서에서 텍스트 데이터, 확인란 및 테이블 형식 필드를 추출합니다. 문서 인텔리전스 스튜디오
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

사용자 지정 구성형

문서 인텔리전스 스튜디오의 구성형 사용자 지정 모델 목록 스크린샷.

정보 설명 자동화 사용 사례 개발 옵션
구성형 사용자 지정 모델 구성형 모델은 사용자 지정 모델 컬렉션을 가져와서 사용자의 양식 유형에서 빌드된 단일 모델에 할당하여 만듭니다. 여러 모델을 학습시키고 그룹화하여 구매 주문처럼 비슷한 양식 유형을 분석하려는 경우에 유용합니다. 문서 인텔리전스 스튜디오
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

사용자 지정 분류 모델

{alt-text}

정보 설명 자동화 사용 사례 개발 옵션
구성된 분류 모델 사용자 지정 분류 모델은 레이아웃 및 언어 기능을 결합하여 입력 파일 내에서 문서를 검색, 식별 및 분류합니다. ● 신청서, 급여 명세서 및 은행 명세서를 포함하는 패키지 대출 신청.
● 스캔한 청구서 컬렉션.
문서 인텔리전스 스튜디오
REST API

Azure AI 문서 인텔리전스는 개발자가 지능형 문서 처리 솔루션을 빌드하기 위한 클라우드 기반 Azure AI 서비스입니다. 문서 인텔리전스는 기계 학습 기반 OCR(광학 인식) 및 문서 이해 기술을 적용하여 문서에서 텍스트, 테이블, 구조 및 키-값 쌍을 추출합니다. 또한 사용자 지정 모델에 레이블을 지정하고 학습하여 구조적, 반구조적 및 비구조적 문서에서 데이터 추출을 자동화할 수 있습니다. 각 모델에 대해 자세히 알아보려면 개념 문서를 참조하세요.

모델 유형 모델 이름
문서 분석 모델 레이아웃 분석 모델
미리 빌드된 모델 청구서 모델
영수증 모델
ID 문서(ID) 모델
명함 모델
사용자 지정 모델 사용자 지정 모델
작성 모델

이 콘텐츠의 적용 대상은 다음과 같습니다.검사markv2.1 | 최신 버전:파란색 검사markv4.0(미리 보기)

문서 인텔리전스 모델 및 개발 옵션

  • 향상된 환경과 고급 모델 품질을 원하시면 문서 인텔리전스 v3.0 스튜디오를 사용해 보세요.
  • v3.0 Studio는 v2.1 레이블이 지정된 데이터로 학습된 모든 모델을 지원합니다.
  • v2.1에서 v3.0으로 마이그레이션하는 방법에 대한 자세한 내용은 API 마이그레이션 가이드를 참조하세요.

참고 항목

다음 모델 및 개발 옵션은 문서 인텔리전스 서비스 v2.1에서 지원됩니다.

이 표의 링크를 사용하여 각 모델에 대해 자세히 알아보고 API 참조를 찾아보세요.

모델 설명 개발 옵션
레이아웃 분석 양식 및 문서에서 텍스트, 선택 표시, 테이블, 경계 상자 좌표에 대한 추출 및 분석을 지원합니다. 문서 인텔리전스 레이블 지정 도구
REST API
클라이언트-라이브러리 SDK
문서 인텔리전스 Docker 컨테이너
사용자 지정 모델 고유한 비즈니스 데이터 및 사용 사례와 관련된 양식과 문서에서 데이터를 추출하고 분석합니다. 문서 인텔리전스 레이블 지정 도구
REST API
샘플 레이블 지정 도구
문서 인텔리전스 Docker 컨테이너
청구서 모델 판매 청구서에서 주요 정보를 자동으로 처리하고 추출합니다. 문서 인텔리전스 레이블 지정 도구
REST API
클라이언트-라이브러리 SDK
문서 인텔리전스 Docker 컨테이너
영수증 모델 판매 영수증에서 주요 정보를 자동으로 처리하고 추출합니다. 문서 인텔리전스 레이블 지정 도구
REST API
클라이언트-라이브러리 SDK
문서 인텔리전스 Docker 컨테이너
ID 문서(ID) 모델 미국 운전 면허증 및 국제 여권의 핵심 정보에 대한 자동화된 데이터 처리 및 추출. 문서 인텔리전스 레이블 지정 도구
REST API
클라이언트-라이브러리 SDK
문서 인텔리전스 Docker 컨테이너
명함 모델 명함에서 주요 정보를 자동으로 처리하고 추출합니다. 문서 인텔리전스 레이블 지정 도구
REST API
클라이언트-라이브러리 SDK
문서 인텔리전스 Docker 컨테이너

데이터 개인 정보 보호 및 보안

모든 AI와 마찬가지로 문서 인텔리전스 서비스를 사용하는 개발자는 고객 데이터에 대한 Microsoft 정책을 알고 있어야 합니다. 문서 인텔리전스의 데이터, 개인 정보 보호 및 보안 페이지를 참조하세요.

다음 단계