문서 인텔리전스 명함 모델

Important

문서 인텔리전스 v4.0(미리 보기)부터 명함 모델(prebuilt-businessCard)은 더 이상 사용되지 않습니다. 명함 형식에서 데이터를 추출하려면 다음을 사용하세요.

기능 version Model ID
명함 모델 • v3.1:2023-07-31(GA)
• v3.0:2022-08-31(GA)
• v2.1(GA)
prebuilt-businessCard

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v3.1(GA) | 이전 버전:파란색 확인 표시v3.0파란색 확인 표시v2.1

이 콘텐츠의 적용 대상:확인 표시v3.0(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기)보라색 확인 표시v3.1 | 이전 버전:파란색 확인 표시v2.1

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v2.1 | 최신 버전:파란색 확인 표시v4.0(미리 보기)

문서 인텔리전스 명함 모델은 강력한 OCR(광학 인식) 기능을 딥 러닝 모델과 결합하여 명함 이미지에서 데이터를 분석하고 추출합니다. API는 인쇄된 명함을 분석하고, 이름, 성, 회사 이름, 메일 주소, 전화번호와 같은 주요 정보를 추출하고, 구조화된 JSON 데이터 표현을 반환합니다.

명함 데이터 추출

명함을 통해 비즈니스 또는 전문가를 나타내는 훌륭한 방법입니다. 명함에 나오는 회사 로고, 글꼴 및 배경 이미지는 회사 브랜딩을 홍보하고 다른 브랜드와 차별화하는 데 도움이 됩니다. 명함 스캔 자동화에 OCR 및 기계 학습 기반 기술을 적용하는 것은 일반적인 이미지 처리 시나리오입니다. 영업 및 마케팅 팀에서 사용하는 엔터프라이즈 시스템에는 일반적으로 사용자의 편의를 위해 명함 데이터 추출 기능이 통합됩니다.

문서 인텔리전스 스튜디오를 사용하여 처리한 명함 샘플

문서 인텔리전스 스튜디오에서 분석한 샘플 명함 스크린샷.

개발 옵션

문서 인텔리전스 v3.1:2023-07-31(GA)는 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
명함 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

문서 인텔리전스 v3.0:2022-08-31(GA)는 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
명함 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

문서 인텔리전스 v2.1(GA)는 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스
명함 모델 문서 인텔리전스 레이블 지정 도구
REST API
클라이언트 라이브러리 SDK
문서 인텔리전스 Docker 컨테이너

명함 데이터 추출 시도

명함에서 이름, 직함, 주소, 메일 및 회사 이름을 포함한 데이터를 추출하는 방법을 알아봅니다. 다음 리소스가 필요합니다.

  • Azure 구독 – 체험 구독 만들기

  • Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(F0)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.

Azure Portal에서 키 및 엔드포인트 위치의 스크린샷

문서 인텔리전스 스튜디오

참고 항목

문서 인텔리전스 스튜디오는 v3.1 및 v3.0 API와 함께 사용할 수 있습니다.

  1. 문서 인텔리전스 스튜디오 홈페이지에서 명함을 선택합니다.

  2. 샘플 명함을 분석하거나 자체 파일을 업로드할 수 있습니다.

  3. 분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.

    문서 인텔리전스 스튜디오의 분석 실행과 분석 옵션 버튼 스크린샷.

문서 인텔리전스 샘플 레이블 지정 도구

  1. 문서 인텔리전스 샘플 도구로 이동합니다.

  2. 샘플 도구 홈페이지에서 미리 빌드된 모델을 사용하여 데이터 가져오기 타일을 선택합니다.

    레이아웃 모델 분석 결과 작업의 스크린샷

  3. 드롭다운 메뉴에서 분석할 양식 유형을 선택합니다.

  4. 아래 옵션에서 분석하려는 파일의 URL을 선택합니다.

  5. 원본 필드의 드롭다운 메뉴에서 URL을 선택하고, 선택한 URL을 붙여넣고, 가져오기 단추를 선택합니다.

    원본 위치 드롭다운 메뉴의 스크린샷

  6. 문서 인텔리전스 서비스 엔드포인트 필드에 문서 인텔리전스 구독으로 가져오는 엔드포인트를 붙여넣습니다.

  7. 필드에 문서 인텔리전스 리소스에서 가져오는 키를 붙여넣습니다.

    형식 선택 드롭다운 메뉴를 보여 주는 스크린샷

  8. 분석 실행을 선택합니다. 문서 인텔리전스 샘플 레이블 지정 도구는 미리 작성된 분석 API를 호출하고 문서를 분석합니다.

  9. 결과 보기 - 추출된 키-값 쌍, 개별 항목, 추출되어 있는 강조 표시된 텍스트, 검색된 테이블을 참조하세요.

    명함 모델 분석 결과 작업의 스크린샷

참고 항목

샘플 레이블 지정 도구는 BMP 파일 형식을 지원하지 않습니다. 이는 문서 인텔리전스 Service가 아닌 도구의 제한 사항입니다.

입력 요구 사항

  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX) 및 HTML
    읽음
    레이아웃 ✔ (2024-02-29-preview, 2023-10-31-preview)
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류 ✔ (2024-02-29-preview)
  • PDF 및 TIFF의 경우 최대 2000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서 분석을 위한 파일 크기는 유료(S0) 계층의 경우 500MB, 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50 x 50픽셀에서 10,000 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8포인트 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB, 신경망 모델의 경우 1G-MB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 최대 10,000페이지인 1GB입니다.

  • 지원되는 파일 형식: JPEG, PNG, PDF 및 TIFF
  • PDF 및 TIFF의 경우 최대 2000페이지가 처리됩니다. 체험 계층 구독자의 경우 처음 두 페이지만 처리됩니다.
  • 파일 크기는 50MB 미만이어야 하며, 크기는 50 x 50픽셀 이상, 최대 10,000 x 10,000픽셀이어야 합니다.

지원되는 언어 및 로캘

지원되는 언어의 전체 목록은 언어 지원을 참조하세요.

필드 추출

이름 형식 설명 표준화된 출력
ContactNames 개체의 배열 연락처 이름
FirstName 문자열 연락처의 이름
LastName 문자열 연락처의 성
CompanyNames 문자열 배열 회사 이름
부서 문자열 배열 부서 또는 연락처 조직
JobTitles 문자열 배열 연락처의 나열된 직위
메일 문자열 배열 연락처 메일 주소
웹 사이트 문자열 배열 회사 웹 사이트
주소 문자열 배열 명함에서 추출된 주소
MobilePhones 전화번호 배열 명함에서 추출된 휴대폰 번호 +1 xxx xxx xxxx
팩스 전화번호 배열 명함에서 추출된 팩스 번호 +1 xxx xxx xxxx
WorkPhones 전화번호 배열 명함에서 추출된 회사 전화번호 +1 xxx xxx xxxx
OtherPhones 전화번호 배열 명함에서 추출된 기타 전화번호 +1 xxx xxx xxxx

추출된 필드

이름 형식 설명 Text
ContactNames 개체의 배열 명함에서 추출 된 연락처 이름 [{ “FirstName”: “John”, “LastName”: “Doe” }]
FirstName string 연락처의 이름 "John"
LastName string 연락처의 성 "Doe"
CompanyNames 문자열 배열 명함에서 추출된 회사 이름 ["Contoso"]
부서 문자열 배열 연락처의 부서 또는 조직 ["R&D"]
JobTitles 문자열 배열 연락처의 나열된 직함 ["Software Engineer"]
메일 문자열 배열 명함에서 추출된 연락처 이메일 ["johndoe@contoso.com"]
웹 사이트 문자열 배열 명함에서 추출된 웹사이트 ["https://www.contoso.com"]
주소 문자열 배열 명함에서 추출된 주소 ["123 Main Street, Redmond, WA 98052"]
MobilePhones 전화 번호 배열 명함에서 추출된 휴대폰 번호 ["+19876543210"]
팩스 전화 번호 배열 명함에서 추출된 팩스 번호 ["+19876543211"]
WorkPhones 전화 번호 배열 명함에서 추출된 회사 전화 번호 ["+19876543231"]
OtherPhones 전화 번호 배열 명함에서 추출된 기타 전화 번호 ["+19876543233"]

지원되는 로캘

사전 제작된 명함 v2.1은 다음 로케일을 지원합니다.

  • en-us
  • en-au
  • en-ca
  • en-gb
  • en-in

마이그레이션 가이드 및 REST API v3.1

다음 단계