문서 인텔리전스 청구서 모델

Important

  • 문서 인텔리전스 공개 미리 보기 릴리스에서는 현재 개발 중인 기능에 대한 조기 액세스를 제공합니다.
  • 기능, 방식 및 프로세스는 GA(일반 공급) 전에 사용자 피드백에 따라 변경될 수 있습니다.
  • 문서 인텔리전스 클라이언트 라이브러리의 공개 미리 보기 버전은 기본적으로 REST API 버전 2024-02-29-미리 보기로 설정됩니다.
  • 공개 미리 보기 버전 2024-02-29-미리 보기는 현재 다음 Azure 지역에서만 사용할 수 있습니다.
  • 미국 동부
  • 미국 서부2
  • 서유럽

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.1(GA)파란색 확인 표시v3.0(GA)파란색 확인 표시v2.1(GA)

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v3.1(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.0파란색 확인 표시v2.1

이 콘텐츠의 적용 대상:확인 표시v3.0(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기)보라색 확인 표시v3.1 | 이전 버전:파란색 확인 표시v2.1

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v2.1 | 최신 버전:파란색 확인 표시v4.0(미리 보기)

문서 인텔리전스 청구서 모델은 강력한 OCR(광학 인식) 기능을 사용하여 판매 청구서, 공과금 청구서 및 구매 주문서의 주요 필드와 항목을 분석하고 추출합니다. 청구서는 휴대폰으로 캡처한 이미지, 스캔한 문서, 디지털 PDF 등 형식과 품질이 다양할 수 있습니다. API는 청구서 텍스트를 분석하고, 고객 이름, 청구 주소, 만기일, 만기금액과 같은 주요 정보를 추출하고, 구조화된 JSON 데이터 표현을 반환합니다. 이 모델은 현재 27개 언어로 청구서를 지원합니다.

지원되는 문서 유형:

  • 송장
  • 공과금 청구서
  • 판매 주문
  • 구매 주문

자동화된 청구서 처리

자동화된 청구서 처리는 청구 계정 문서에서 주요 지급 계정 필드를 추출하는 프로세스입니다. 추출된 데이터에는 검토 및 결제를 위해 AP(지급 계정) 워크플로와 통합된 청구서의 항목이 포함됩니다. 지금까지 지급 계정 프로세스는 수동으로 수행되어 시간이 많이 걸렸습니다. 청구서에서 핵심 데이터를 정확하게 추출하는 것은 일반적으로 청구서 자동화 프로세스에서 첫 번째이자 가장 중요한 단계 중 하나입니다.

문서 인텔리전스 스튜디오로 처리된 샘플 청구서:

문서 인텔리전스 스튜디오에서 분석된 샘플 청구서의 스크린샷.

개발 옵션

문서 인텔리전스 v4.0(2024-02-29-미리 보기 2023-10-31-미리 보기)은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.

기능 리소스 Model ID
청구서 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-invoice

문서 인텔리전스 v3.1은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
청구서 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-invoice

문서 인텔리전스 v3.0은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
청구서 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-invoice

문서 인텔리전스 v2.1은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스
청구서 모델 문서 인텔리전스 레이블 지정 도구
REST API
클라이언트-라이브러리 SDK
문서 인텔리전스 Docker 컨테이너

입력 요구 사항

  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX) 및 HTML
    읽음
    레이아웃 ✔ (2024-02-29-미리 보기, 2023-10-31-미리 보기)
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류 ✔ (2024-02-29-미리 보기)
  • PDF 및 TIFF의 경우 최대 2000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서 분석을 위한 파일 크기는 유료(S0) 계층의 경우 500MB, 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50 x 50픽셀에서 10,000 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8포인트 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB, 신경망 모델의 경우 1G-MB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 최대 10,000페이지인 1GB입니다.

  • 지원되는 파일 형식: JPEG, PNG, PDF 및 TIFF.
  • 지원되는 PDF 및 TIFF, 최대 2,000페이지가 처리됩니다. 체험 계층 구독자의 경우 처음 두 페이지만 처리됩니다.
  • 지원되는 파일 크기는 50MB 미만이어야 하며 크기는 50 x 50픽셀 이상, 최대 10,000 x 10,000픽셀이어야 합니다.

청구서 모델 데이터 추출

고객 정보, 공급업체 세부 정보 및 라인 항목을 포함한 데이터가 청구서에서 추출되는 방법을 확인합니다. 다음 리소스가 필요합니다.

  • Azure 구독은 무료로 만들 수 있습니다.

  • Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(F0)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.

Azure Portal에서 키 및 엔드포인트 위치의 스크린샷

  1. 문서 인텔리전스 스튜디오 홈페이지에서 청구서를 선택합니다.

  2. 샘플 청구서를 분석하거나 자체 파일을 업로드할 수 있습니다.

  3. 분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.

    문서 인텔리전스 스튜디오의 분석 실행과 분석 옵션 버튼 스크린샷.

문서 인텔리전스 샘플 레이블 지정 도구

  1. 문서 인텔리전스 샘플 도구로 이동합니다.

  2. 샘플 도구 홈페이지에서 미리 빌드된 모델을 사용하여 데이터 가져오기 타일을 선택합니다.

    레이아웃 모델 분석 결과 프로세스의 스크린샷.

  3. 드롭다운 메뉴에서 분석할 양식 유형을 선택합니다.

  4. 아래 옵션에서 분석하려는 파일의 URL을 선택합니다.

  5. 원본 필드의 드롭다운 메뉴에서 URL을 선택하고, 선택한 URL을 붙여넣고, 가져오기 단추를 선택합니다.

    원본 위치 드롭다운 메뉴의 스크린샷

  6. 문서 인텔리전스 서비스 엔드포인트 필드에 문서 인텔리전스 구독으로 가져오는 엔드포인트를 붙여넣습니다.

  7. 필드에 문서 인텔리전스 리소스에서 가져오는 키를 붙여넣습니다.

    형식 선택 드롭다운 메뉴를 보여 주는 스크린샷.

  8. 분석 실행을 선택합니다. 문서 인텔리전스 샘플 레이블 지정 도구는 미리 작성된 분석 API를 호출하고 문서를 분석합니다.

  9. 결과 보기 - 추출된 키 값 쌍, 개별 항목, 추출된 강조 표시된 텍스트 및 검색된 테이블을 참조하세요.

    레이아웃 모델 분석 결과 작업 스크린샷.

참고 항목

샘플 레이블 지정 도구는 BMP 파일 형식을 지원하지 않습니다. 이는 문서 인텔리전스 Service가 아닌 도구의 제한 사항입니다.

지원되는 언어 및 로캘

지원되는 언어의 전체 목록은 언어 지원 - 미리 빌드된 모델 페이지를 참조하세요.

필드 추출

이름 형식 설명 표준화된 출력
CustomerName 문자열 청구서가 청구된 고객
고객 ID 문자열 고객 참조 ID
PurchaseOrder 문자열 구매 주문 참조 번호
InvoiceId 문자열 이 특정 청구서의 ID(많은 경우 ‘청구서 번호’)
InvoiceDate 날짜 청구서가 발행된 날짜 yyyy-mm-dd
DueDate 날짜 이 청구서의 지불 기일 yyyy-mm-dd
VendorName 문자열 공급업체 이름
VendorTaxId 문자열 공급업체와 연결된 납세자 번호
VendorAddress 문자열 공급업체 우편 주소
VendorAddressRecipient 문자열 VendorAddress와 관련된 이름
CustomerAddress 문자열 고객의 우편 주소
CustomerTaxId 문자열 고객과 연결된 납세자 번호
CustomerAddressRecipient 문자열 CustomerAddress와 관련된 이름
BillingAddress 문자열 고객의 명시적 청구 주소
BillingAddressRecipient 문자열 BillingAddress와 관련된 이름
ShippingAddress 문자열 고객의 명시적 배송 주소
ShippingAddressRecipient 문자열 ShippingAddress와 관련된 이름
PaymentTerm 문자열 청구서에 대한 지불 조건
소계합계 숫자 이 청구서에서 식별된 소계 필드 정수
TotalTax 숫자 이 청구서에서 식별된 세금 총액 필드 정수
InvoiceTotal 숫자(USD) 이 청구서와 관련된 새 요금 총액 정수
AmountDue 숫자(USD) 공급업체에 지불할 총액 정수
ServiceAddress 문자열 고객의 명시적 서비스 주소 또는 건물 주소
ServiceAddressRecipient 문자열 ServiceAddress와 관련된 이름
RemittanceAddress 문자열 고객의 명시적 송금 주소 또는 지불 주소
RemittanceAddressRecipient 문자열 RemittanceAddress와 관련된 이름
ServiceStartDate 날짜 서비스 기간의 시작 날짜(예: 유틸리티 청구 서비스 기간) yyyy-mm-dd
ServiceEndDate 날짜 서비스 기간의 종료 날짜(예: 유틸리티 청구 서비스 기간) yyyy-mm-dd
PreviousUnpaidBalance 숫자 이전에 미지불된 명시적 잔액 정수
통화 코드 문자열 추출된 금액과 연결된 통화 코드
KVKNumber(NL 전용) 문자열 네덜란드에 등록된 기업의 고유 식별자 12345678
PaymentDetails 배열 IBAN, SWIFT, BPay(AU) 같은 결제 옵션 세부 정보를 보유하는 배열
TotalDiscount 숫자 청구서에 적용된 총 할인 정수
TaxItems Array CGST, IGST, SGST 같은 추가 세금 정보를 보유하는 배열입니다. 이 품목은 현재 독일(de), 스페인(es), 포르투갈(pt) 및 영어 캐나다(en-CA) 로캘에서만 사용할 수 있습니다.

품목

다음은 JSON 출력 응답의 청구서에서 추출된 품목입니다. 다음 출력에서는 이 샘플 청구서를 사용합니다.

속성 형식 설명 텍스트(개별 항목 1) 값(표준화된 출력)
아이템 문자열 개별 항목의 전체 문자열 텍스트 줄 2021/3/4 A123 컨설팅 서비스 2시간 $30.00 10% $60.00
금액 번호 개별 항목의 금액 $60.00 100
설명 문자열 청구서 개별 항목의 텍스트 설명 컨설팅 서비스 컨설팅 서비스
수량 숫자 이 청구서 개별 항목의 수량 2 2
OrderQuantity 숫자 이 항목의 주문 수량입니다. 배송 및 청구된 수량과 다를 수 있음 3 3
단가 숫자 이 항목의 1개 단위의 정가 및 총가(청구서의 청구서 총액 설정에 따라 다름) $30.00 30
ProductCode 문자열 특정 개별 항목과 관련된 제품 코드, 제품 번호 또는 SKU A123
단위 문자열 개별 항목의 단위(예: kg, lb 등) Hours
날짜 날짜 각 개별 항목에 해당하는 날짜이며, 개별 항목이 배송된 날짜인 경우가 많음 2021/3/4 2021-03-04
세금 숫자 각 개별 항목과 관련된 세금이며, 가능한 값으로는 세액 및 세금 Y/N이 있음 10.00
TaxRate 숫자 각 개별 항목과 관련된 세율입니다. 10%

추출된 청구서 키-값 쌍 및 품목은 JSON 출력의 documentResults 섹션에 있습니다.

키-값 쌍

미리 빌드된 청구서 2022-06-30 및 이후 릴리스에서는 키-값 쌍의 선택적인 반환을 지원합니다. 기본적으로 키-값 쌍 반환은 사용하지 않도록 설정되어 있습니다. 키-값 쌍은 레이블 또는 키와 관련 응답 또는 값을 식별하는 청구서 내의 특정 범위입니다. 청구서에서 이러한 쌍은 레이블 및 사용자가 해당 필드 또는 전화번호에 입력한 값일 수 있습니다. AI 모델은 다양한 문서 유형, 형식 및 구조를 기반으로 식별 가능한 키와 값을 추출하도록 학습되었습니다.

모델이 연결된 값이 없는 키가 존재하는 것을 감지하거나 선택적 필드를 처리할 때는 키가 격리되어 있을 수도 있습니다. 예를 들어 중간 이름 필드는 경우에 따라 양식에서 비워 둘 수 있습니다. 키-값 쌍은 항상 문서에 포함된 텍스트 범위입니다. 동일한 값이 다른 방식으로 설명되는 문서(예: 고객/사용자)가 있는 경우 연관된 키는 컨텍스트에 따라 고객 또는 사용자가 됩니다.

추출된 필드

청구서 서비스는 텍스트, 테이블, 그리고 26개의 청구서 필드를 추출합니다. 다음은 JSON 출력 응답의 청구서에서 추출되는 필드입니다(다음 출력은 이 샘플 청구서를 사용함).

이름 형식 설명 Text 값(표준화된 출력)
CustomerName string 청구서를 받는 고객 Microsoft Corp
고객 ID string 고객에 대한 참조 ID CID-12345
PurchaseOrder string 구매 주문 참조 번호 PO-3333
InvoiceId string 이 특정 청구서의 ID(많은 경우 ‘청구서 번호’) INV-100
InvoiceDate 날짜 청구서가 발행된 날짜 11/15/2019 2019-11-15
DueDate 날짜 이 청구서의 지불 기일 2019/12/15 2019-12-15
VendorName string 청구서를 만든 공급업체 CONTOSO
VendorAddress string 공급업체의 우편 주소 123 456th St New York, NY, 10001
VendorAddressRecipient string VendorAddress와 관련된 이름 Contoso Headquarters
CustomerAddress string 고객의 우편 주소 123 Other Street, Redmond, Washington, 98052
CustomerAddressRecipient string CustomerAddress와 관련된 이름 Microsoft Corp
BillingAddress string 고객의 명시적 청구 주소 123 Bill Street, Redmond, Washington, 98052
BillingAddressRecipient string BillingAddress와 관련된 이름 Microsoft 서비스
ShippingAddress string 고객의 명시적 배송 주소 123 Ship Street, Redmond, Washington, 98052
ShippingAddressRecipient string ShippingAddress와 관련된 이름 Microsoft Delivery
소계합계 번호 이 청구서에서 식별된 소계 필드 $100.00 100
TotalTax 번호 이 청구서에서 식별된 세금 총액 필드 $10.00 10
InvoiceTotal 번호 이 청구서와 관련된 새 요금 총액 $110.00 110
AmountDue 번호 공급업체에 지불할 총액 $610.00 610
ServiceAddress string 고객의 명시적 서비스 주소 또는 건물 주소 123 Service Street, Redmond, Washington, 98052
ServiceAddressRecipient string ServiceAddress와 관련된 이름 Microsoft 서비스
RemittanceAddress string 고객의 명시적 송금 주소 또는 지불 주소 123 Remit St New York, NY, 10001
RemittanceAddressRecipient string RemittanceAddress와 관련된 이름 Contoso Billing
ServiceStartDate 날짜 서비스 기간의 시작 날짜(예: 유틸리티 청구 서비스 기간) 10/14/2019 2019-10-14
ServiceEndDate 날짜 서비스 기간의 종료 날짜(예: 유틸리티 청구 서비스 기간) 2019/11/14 2019-11-14
PreviousUnpaidBalance 번호 이전에 미지불된 명시적 잔액 $500.00 500

다음은 JSON 출력 응답의 청구서에서 추출된 품목이며 이 샘플 청구서를 사용합니다.

속성 형식 설명 텍스트(개별 항목 1) 값(표준화된 출력)
아이템 string 개별 항목의 전체 문자열 텍스트 줄 2021/3/4 A123 컨설팅 서비스 2시간 $30.00 10% $60.00
금액 번호 개별 항목의 금액 $60.00 100
설명 string 청구서 개별 항목의 텍스트 설명 컨설팅 서비스 컨설팅 서비스
수량 번호 이 청구서 개별 항목의 수량 2 2
단가 번호 이 항목의 1개 단위의 정가 및 총가(청구서의 청구서 총액 설정에 따라 다름) $30.00 30
ProductCode string 특정 개별 항목과 관련된 제품 코드, 제품 번호 또는 SKU A123
단위 string 개별 항목의 단위(예: kg, lb 등) 시간
날짜 date 각 개별 항목에 해당하는 날짜이며, 개별 항목이 배송된 날짜인 경우가 많음 2021/3/4 2021-03-04
세금 번호 각 개별 항목과 관련된 세금이며, 가능한 값으로는 세액, 세율, 세금 Y/N이 있음 10%

다음은 JSON 출력 응답의 청구서에서 추출된 복잡한 필드입니다.

TaxDetails

세금 세부 정보는 청구서 총액에 적용되는 다양한 세금을 분류하는 것을 목표로 합니다.

속성 형식 설명 텍스트(개별 항목 1) 값(표준화된 출력)
아이템 string 세금 항목의 전체 문자열 텍스트 줄 V.A.T. 15% $60.00
금액 번호 세금 항목의 세액 60.00 60
비용 string 세금 항목의 세율 15%

PaymentDetails

필드에서 검색된 모든 지급 조건을 나열합니다.

속성 형식 설명 텍스트(개별 항목 1) 값(표준화된 출력)
IBAN string 내부 은행 계좌 번호 GB33BUKB20201555555555
SWIFT string SWIFT 코드 BUKBGB22
BPayBillerCode string 오스트레일리아 B-Pay 청구자 코드 12345
BPayReference string 오스트레일리아 B-Pay 참조 코드 98765432100

JSON 출력

JSON 출력은 세 부분으로 나뉩니다.

  • "readResults" 노드에는 인식된 모든 텍스트와 선택 표시가 포함됩니다. 텍스트는 페이지별로 구성되고, 그다음 줄별로, 그다음에는 개별 단어별로 구성됩니다.
  • "pageResults" 노드에는 readResults의 줄과 단어에 대한 참조, 경계 상자, 신뢰도와 함께 추출된 테이블과 셀이 포함됩니다.
  • "documentResults" 노드에는 모델이 검색한 청구서 특정 값과 개별 항목이 포함됩니다. 청구서 ID, 배송 대상, 청구서 받는 사람, 고객, 합계, 개별 항목 등 청구서에서 모든 필드를 찾을 수 있습니다.

마이그레이션 가이드

다음 단계