문서 인텔리전스 영수증 모델

Important

  • 문서 인텔리전스 공개 미리 보기 릴리스에서는 현재 개발 중인 기능에 대한 조기 액세스를 제공합니다.
  • 기능, 방식 및 프로세스는 GA(일반 공급) 전에 사용자 피드백에 따라 변경될 수 있습니다.
  • 문서 인텔리전스 클라이언트 라이브러리의 공개 미리 보기 버전은 기본적으로 REST API 버전 2024-02-29-미리 보기로 설정됩니다.
  • 공개 미리 보기 버전 2024-02-29-미리 보기는 현재 다음 Azure 지역에서만 사용할 수 있습니다.
  • 미국 동부
  • 미국 서부2
  • 서유럽

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.1(GA)파란색 확인 표시v3.0(GA)파란색 확인 표시v2.1(GA)

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v3.1(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.0파란색 확인 표시v2.1

이 콘텐츠의 적용 대상:확인 표시v3.0(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기)보라색 확인 표시v3.1 | 이전 버전:파란색 확인 표시v2.1

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v2.1 | 최신 버전:파란색 확인 표시v4.0(미리 보기)

문서 인텔리전스 영수증 모델은 강력한 OCR(광학 문자 인식) 기능과 딥 러닝 모델을 결합하여 판매 영수증에서 주요 정보를 분석하고 추출합니다. 영수증은 인쇄 및 필기 영수증을 포함하여 다양한 형식과 품질일 수 있습니다. API는 가맹점 이름, 가맹점 전화 번호, 거래 날짜, 세금 및 거래 합계와 같은 주요 정보를 추출하고 구조화된 JSON 데이터를 반환합니다.

지원되는 영수증 유형:

  • 신용 카드
  • 가스
  • 주차
  • 호텔
  • 운송
  • 통신
  • Entertainment
  • 항공편
  • 학습
  • 약국/의료

영수증 데이터 추출

영수증 디지털화는 스캔, 사진 촬영, 인쇄 사본을 포함한 다양한 유형의 영수증을 간소화된 다운스트림 처리를 위해 디지털 형식으로 변환하는 것을 포함합니다. 예로는 비용 관리, 소비자 행동 분석, 세금 자동화 등이 있습니다. OCR(광학 문자 인식) 기술이 적용된 문서 인텔리전스를 사용하면 이러한 다양한 영수증 형식에서 데이터를 추출하고 해석할 수 있습니다. 문서 인텔리전스 처리는 변환 프로세스를 간소화하지만 필요한 시간과 노력을 크게 줄여 효율적인 데이터 관리 및 검색을 용이하게 합니다.

문서 인텔리전스 스튜디오로 처리된 샘플 영수증:

문서 인텔리전스 스튜디오에서 처리된 샘플 영수증의 스크린샷.

개발 옵션

문서 인텔리전스 v4.0(2024-02-29-미리 보기 2023-10-31-미리 보기)은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.

기능 리소스 Model ID
영수증 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

문서 인텔리전스 v3.1은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
영수증 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

문서 인텔리전스 v3.0은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
영수증 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

문서 인텔리전스 v2.1은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스
영수증 모델 문서 인텔리전스 레이블 지정 도구
REST API
클라이언트-라이브러리 SDK
문서 인텔리전스 Docker 컨테이너

입력 요구 사항

  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX) 및 HTML
    읽음
    레이아웃 ✔ (2024-02-29-미리 보기, 2023-10-31-미리 보기)
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류 ✔ (2024-02-29-미리 보기)
  • PDF 및 TIFF의 경우 최대 2000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서 분석을 위한 파일 크기는 유료(S0) 계층의 경우 500MB, 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50 x 50픽셀에서 10,000 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8포인트 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB, 신경망 모델의 경우 1G-MB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 최대 10,000페이지인 1GB입니다.

  • 지원되는 파일 형식: JPEG, PNG, PDF 및 TIFF.
  • PDF 및 TIFF에 대해 지원되는 페이지 허용: Document Intelligence는 표준 계층 구독자에 대해 최대 2,000페이지를 처리하거나 무료 계층 구독자의 경우 처음 두 페이지만 처리할 수 있습니다.
  • 지원되는 파일 크기: 50MB 미만; 최소 픽셀: 50 x 50 px; 최대 픽셀은 10,000 x 10,000px입니다.

영수증 모델 데이터 추출

문서 인텔리전스가 거래 시간 및 날짜, 판매자 정보, 영수증의 총액 등의 데이터를 추출하는 방법을 알아보세요. 다음 리소스가 필요합니다.

  • Azure 구독은 무료로 만들 수 있습니다.

  • Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(F0)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.

Azure Portal에서 키 및 엔드포인트 위치의 스크린샷

참고 항목

문서 인텔리전스 스튜디오는 v3.1 및 v3.0 API 및 이후 버전에서 사용할 수 있습니다.

  1. 문서 인텔리전스 스튜디오 홈페이지에서 영수증을 선택합니다.

  2. 샘플 영수증을 분석하거나 자체 파일을 업로드할 수 있습니다.

  3. 분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.

    문서 인텔리전스 스튜디오의 분석 실행과 분석 옵션 버튼 스크린샷.

문서 인텔리전스 샘플 레이블 지정 도구

  1. 문서 인텔리전스 샘플 도구로 이동합니다.

  2. 샘플 도구 홈페이지에서 미리 빌드된 모델을 사용하여 데이터 가져오기 타일을 선택합니다.

    레이아웃 모델 분석 결과 프로세스의 스크린샷

  3. 드롭다운 메뉴에서 분석할 양식 유형을 선택합니다.

  4. 아래 옵션에서 분석하려는 파일의 URL을 선택합니다.

  5. 원본 필드의 드롭다운 메뉴에서 URL을 선택하고, 선택한 URL을 붙여넣고, 가져오기 단추를 선택합니다.

    원본 위치 드롭다운 메뉴의 스크린샷

  6. 문서 인텔리전스 서비스 엔드포인트 필드에 문서 인텔리전스 구독으로 가져오는 엔드포인트를 붙여넣습니다.

  7. 필드에 문서 인텔리전스 리소스에서 가져오는 키를 붙여넣습니다.

    형식 선택 드롭다운 메뉴를 보여 주는 스크린샷

  8. 분석 실행을 선택합니다. 문서 인텔리전스 샘플 레이블 지정 도구는 미리 작성된 분석 API를 호출하고 문서를 분석합니다.

  9. 결과 보기 - 추출된 키 값 쌍, 개별 항목, 추출된 강조 표시된 텍스트 및 검색된 테이블을 참조하세요.

    레이아웃 모델 분석 결과 작업의 스크린샷

참고 항목

샘플 레이블 지정 도구는 BMP 파일 형식을 지원하지 않습니다. 이는 문서 인텔리전스 Service가 아닌 도구의 제한 사항입니다.

지원되는 언어 및 로캘

지원되는 언어의 전체 목록은 언어 지원 - 미리 빌드된 모델 페이지를 참조하세요.

필드 추출

이름 형식 설명 표준화된 출력
ReceiptType 문자열 판매 영수증의 유형 항목화
MerchantName 문자열 영수증을 발급한 판매자의 이름
MerchantPhoneNumber phoneNumber 판매자 전화 번호 나열 +1 xxx xxx xxxx
MerchantAddress 문자열 판매자의 주소 나열
TransactionDate 날짜 영수증이 발급된 날짜 yyyy-mm-dd
TransactionTime Time 영수증이 발급된 시간 hh-mm-ss(24시간)
합계 숫자(USD) 영수증의 총 트랜잭션 합계 2진수 부동
소계 숫자(USD) 영수증의 소계(보통 세금이 적용되기 전) 2진수 부동
세금 숫자(USD) 영수증에 대한 총 세금(보통 판매 세금 또는 이에 상응하는 금액). 2022-06-30 버전에서 "TotalTax"로 이름이 변경되었습니다. 2진수 부동
숫자(USD) 구매자에 의해 포함된 팁 2진수 부동
아이템 개체의 배열 추출된 품목(이름, 수량, 단가 및 총 가격)
이름 문자열 항목 설명. 2022-06-30 버전에서 "Description"으로 이름이 변경되었습니다.
수량 숫자 각 항목의 수량 2진수 부동
가격 숫자 각 항목 단위의 개별 가격 2진수 부동
TotalPrice 숫자 품목에 대한 총 가격 2진수 부동

문서 인텔리전스 v3.0 이상 버전에는 몇 가지 새로운 기능이 도입되었습니다. 열 영수증 외에도 영수증 모델은 단일 페이지 호텔 영수증 처리 및 모든 영수증 형식에 대한 세금 세부 정보 추출을 지원합니다.

Document Intelligence v4.0 이상 버전에서는 열 및 호텔 영수증에 대한 모든 가격 관련 필드에 대한 통화 지원이 도입되었습니다.

Receipt

필드 형식 Description 예시
MerchantName string 영수증을 발급한 판매자의 이름 Contoso
MerchantPhoneNumber phoneNumber 판매자 전화 번호 나열 987-654-3210
MerchantAddress address 판매자의 주소 나열 123 Main St. Redmond, Washington 98052
Total number 영수증의 총 트랜잭션 합계 $14.34
TransactionDate date 영수증이 발급된 날짜 2019년 6월 6일
TransactionTime time 영수증이 발급된 시간 오후 4시 49분
Subtotal number 영수증의 소계(보통 세금이 적용되기 전) $12.34
TotalTax number 영수증에 대한 세금(보통 판매 세금 또는 이에 상응하는 금액) $2.00
Tip number 구매자에 의해 포함된 팁 $1.00
Items array
Items.* object 추출된 품목 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 품목에 대한 총 가격 $999.00
Items.*.Description string 항목 설명 Surface Pro 6
Items.*.Quantity number 각 항목의 수량 1
Items.*.Price number 각 항목 단위의 개별 가격 $999.00
Items.*.ProductCode string 특정 개별 항목과 관련된 제품 코드, 제품 번호 또는 SKU A123
Items.*.QuantityUnit string 각 항목의 수량 단위
TaxDetails array
TaxDetails.* object 추출된 품목 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 세금 세부 금액 $999.00

receipt.retailMeal

필드 형식 Description 예시
MerchantName string 영수증을 발급한 판매자의 이름 Contoso
MerchantPhoneNumber phoneNumber 판매자 전화 번호 나열 987-654-3210
MerchantAddress address 판매자의 주소 나열 123 Main St. Redmond, Washington 98052
Total number 영수증의 총 트랜잭션 합계 $14.34
TransactionDate date 영수증이 발급된 날짜 2019년 6월 6일
TransactionTime time 영수증이 발급된 시간 오후 4시 49분
Subtotal number 영수증의 소계(보통 세금이 적용되기 전) $12.34
TotalTax number 영수증에 대한 세금(보통 판매 세금 또는 이에 상응하는 금액) $2.00
Tip number 구매자에 의해 포함된 팁 $1.00
Items array
Items.* object 추출된 품목 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 품목에 대한 총 가격 $999.00
Items.*.Description string 항목 설명 Surface Pro 6
Items.*.Quantity number 각 항목의 수량 1
Items.*.Price number 각 항목 단위의 개별 가격 $999.00
Items.*.ProductCode string 특정 개별 항목과 관련된 제품 코드, 제품 번호 또는 SKU A123
Items.*.QuantityUnit string 각 항목의 수량 단위
TaxDetails array
TaxDetails.* object 추출된 품목 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 세금 세부 금액 $999.00

receipt.creditCard

필드 형식 Description 예시
MerchantName string 영수증을 발급한 판매자의 이름 Contoso
MerchantPhoneNumber phoneNumber 판매자 전화 번호 나열 987-654-3210
MerchantAddress address 판매자의 주소 나열 123 Main St. Redmond, Washington 98052
Total number 영수증의 총 트랜잭션 합계 $14.34
TransactionDate date 영수증이 발급된 날짜 2019년 6월 6일
TransactionTime time 영수증이 발급된 시간 오후 4시 49분
Subtotal number 영수증의 소계(보통 세금이 적용되기 전) $12.34
TotalTax number 영수증에 대한 세금(보통 판매 세금 또는 이에 상응하는 금액) $2.00
Tip number 구매자에 의해 포함된 팁 $1.00
Items array
Items.* object 추출된 품목 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 품목에 대한 총 가격 $999.00
Items.*.Description string 항목 설명 Surface Pro 6
Items.*.Quantity number 각 항목의 수량 1
Items.*.Price number 각 항목 단위의 개별 가격 $999.00
Items.*.ProductCode string 특정 개별 항목과 관련된 제품 코드, 제품 번호 또는 SKU A123
Items.*.QuantityUnit string 각 항목의 수량 단위
TaxDetails array
TaxDetails.* object 추출된 품목 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 세금 세부 금액 $999.00

receipt.gas

필드 형식 Description 예시
MerchantName string 영수증을 발급한 판매자의 이름 Contoso
MerchantPhoneNumber phoneNumber 판매자 전화 번호 나열 987-654-3210
MerchantAddress address 판매자의 주소 나열 123 Main St. Redmond, Washington 98052
Total number 영수증의 총 트랜잭션 합계 $14.34
TransactionDate date 영수증이 발급된 날짜 2019년 6월 6일
TransactionTime time 영수증이 발급된 시간 오후 4시 49분
Subtotal number 영수증의 소계(보통 세금이 적용되기 전) $12.34
TotalTax number 영수증에 대한 세금(보통 판매 세금 또는 이에 상응하는 금액) $2.00
Tip number 구매자에 의해 포함된 팁 $1.00
Items array
Items.* object 추출된 품목 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 품목에 대한 총 가격 $999.00
Items.*.Description string 항목 설명 Surface Pro 6
Items.*.Quantity number 각 항목의 수량 1
Items.*.Price number 각 항목 단위의 개별 가격 $999.00
Items.*.ProductCode string 특정 개별 항목과 관련된 제품 코드, 제품 번호 또는 SKU A123
Items.*.QuantityUnit string 각 항목의 수량 단위
TaxDetails array
TaxDetails.* object 추출된 품목 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 세금 세부 금액 $999.00

receipt.parking

필드 형식 Description 예시
MerchantName string 영수증을 발급한 판매자의 이름 Contoso
MerchantPhoneNumber phoneNumber 판매자 전화 번호 나열 987-654-3210
MerchantAddress address 판매자의 주소 나열 123 Main St. Redmond, Washington 98052
Total number 영수증의 총 트랜잭션 합계 $14.34
TransactionDate date 영수증이 발급된 날짜 2019년 6월 6일
TransactionTime time 영수증이 발급된 시간 오후 4시 49분
Subtotal number 영수증의 소계(보통 세금이 적용되기 전) $12.34
TotalTax number 영수증에 대한 세금(보통 판매 세금 또는 이에 상응하는 금액) $2.00
Tip number 구매자에 의해 포함된 팁 $1.00
Items array
Items.* object 추출된 품목 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 품목에 대한 총 가격 $999.00
Items.*.Description string 항목 설명 Surface Pro 6
Items.*.Quantity number 각 항목의 수량 1
Items.*.Price number 각 항목 단위의 개별 가격 $999.00
Items.*.ProductCode string 특정 개별 항목과 관련된 제품 코드, 제품 번호 또는 SKU A123
Items.*.QuantityUnit string 각 항목의 수량 단위
TaxDetails array
TaxDetails.* object 추출된 품목 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 세금 세부 금액 $999.00

receipt.hotel

필드 형식 Description 예시
MerchantName string 영수증을 발급한 판매자의 이름 Contoso
MerchantPhoneNumber phoneNumber 판매자 전화 번호 나열 987-654-310
MerchantAddress address 판매자의 주소 나열 123 Main St. Redmond, Washington 98052
Total number 영수증의 총 트랜잭션 합계 $14.34
ArrivalDate date 도착 날짜 27Mar21
DepartureDate date 출발 날짜 28Mar21
Currency string 영수증 금액의 통화 단위(ISO 4217) 또는 여러 값이 있는 경우 'MIXED' USD
MerchantAliases array
MerchantAliases.* string 가맹점의 대체 이름 Contoso (R)
Items array
Items.* object 추출된 품목 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 품목에 대한 총 가격 $999.00
Items.*.Description string 항목 설명 객실 요금
Items.*.Date date 항목 날짜 27Mar21
Items.*.Category string 항목 범주

마이그레이션 가이드 및 REST API v3.1

다음 단계