문서 인텔리전스 ID 문서 모델

Important

  • 문서 인텔리전스 공개 미리 보기 릴리스에서는 현재 개발 중인 기능에 대한 조기 액세스를 제공합니다.
  • 기능, 방식 및 프로세스는 GA(일반 공급) 전에 사용자 피드백에 따라 변경될 수 있습니다.
  • 문서 인텔리전스 클라이언트 라이브러리의 공개 미리 보기 버전은 기본적으로 REST API 버전 2024-02-29-미리 보기로 설정됩니다.
  • 공개 미리 보기 버전 2024-02-29-미리 보기는 현재 다음 Azure 지역에서만 사용할 수 있습니다.
  • 미국 동부
  • 미국 서부2
  • 서유럽

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.1(GA)파란색 확인 표시v3.0(GA)파란색 확인 표시v2.1(GA)

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v3.1(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.0파란색 확인 표시v2.1

이 콘텐츠의 적용 대상:확인 표시v3.0(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기)보라색 확인 표시v3.1 | 이전 버전:파란색 확인 표시v2.1

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v2.1 | 최신 버전:파란색 확인 표시v4.0(미리 보기)

문서 인텔리전스 ID(Identity Document) 모델은 OCR(광학 문자 인식)과 딥 러닝 모델을 결합하여 ID로부터 핵심 정보를 분석하고 추출합니다. API는 ID 문서(다음 포함)를 분석하고, 구조화된 JSON 데이터 표현을 반환합니다.

  • 전 세계 여권 수첩, 여권 카드
  • 미국, 유럽, 인도, 캐나다 및 오스트레일리아의 운전 면허증
  • 미국 신분증, 거주 허가증(녹색 카드), 사회 보장 카드, 군인 ID
  • 유럽 신분증, 거주 허가증
  • 인도 PAN 카드, 아드하르 카드
  • 캐나다 신분증, 거주 허가증(메이플 카드)
  • 오스트레일리아 사진 카드, 키 패스 ID(디지털 버전 포함)

문서 인텔리전스는 미리 빌드한 ID 모델을 사용하여 정부에서 발급한 ID(ID 문서)에서 정보를 분석하고 추출할 수 있습니다. 강력한 OCR(광학 문자 인식) 기능을 ID 인식 기능과 결합하여 전 세계 Passport 및 미국 운전면허(모든 50개 주 및 D.C.)에서 주요 정보를 추출합니다. 운전 면허증(모든 50개 주 및 DC). ID API는 이름, 성, 생년월일, 문서 번호 등과 같은 ID 문서에서 주요 정보를 추출합니다. 이 API는 문서 인텔리전스 v2.1에서 클라우드 서비스로 사용할 수 있습니다.

ID 문서 처리

ID 문서 처리에는 수동으로 또는 OCR 기반 기술을 사용하여 ID 문서에서 데이터를 추출하는 작업이 포함됩니다. ID 문서 처리는 ID 증명이 필요한 비즈니스 작업에서 중요한 단계입니다. 예를 들어, 은행 및 기타 금융 기관의 고객 확인, 대출 신청, 병원 진료, 클레임 처리, 관광 산업 등이 있습니다. 개인은 비즈니스에서 서비스 및 혜택을 제공하기 전에 효율적으로 확인할 수 있도록 운전 면허증, 여권 및 기타 유사한 문서를 통해 몇 가지 신원 증명을 제공합니다.

문서 인텔리전스에서 처리된 미국 운전 면허증 샘플

샘플 운전면허증의 이미지.

데이터 추출

미리 빌드된 ID 서비스는 전 세계 여권 및 미국 운전면허에서 주요 값을 추출하고 조직화된 구조적 JSON 응답으로 반환합니다.

운전 면허증 예제

샘플 운전 면허증

Passport 예제

샘플 Passport

개발 옵션

문서 인텔리전스 v4.0(2024-02-29-미리 보기 2023-10-31-미리 보기)은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.

기능 리소스 Model ID
ID 문서 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

문서 인텔리전스 v3.1은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
ID 문서 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

문서 인텔리전스 v3.0은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
ID 문서 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

문서 인텔리전스 v2.1은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스
ID 문서 모델 문서 인텔리전스 레이블 지정 도구
REST API
클라이언트-라이브러리 SDK
문서 인텔리전스 Docker 컨테이너

입력 요구 사항

  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX) 및 HTML
    읽음
    레이아웃 ✔ (2024-02-29-미리 보기, 2023-10-31-미리 보기)
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류 ✔ (2024-02-29-미리 보기)
  • PDF 및 TIFF의 경우 최대 2000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서 분석을 위한 파일 크기는 유료(S0) 계층의 경우 500MB, 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50 x 50픽셀에서 10,000 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8포인트 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB, 신경망 모델의 경우 1G-MB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 최대 10,000페이지인 1GB입니다.

  • 지원되는 파일 형식: JPEG, PNG, PDF 및 TIFF.

  • PDF 및 TIFF 파일에 지원되는 페이지 수: 최대 2,000페이지 또는 무료 계층 구독자를 위해 처음 두 페이지만 지원됩니다.

  • 지원되는 파일 크기: 총 50MB 미만; 최소 픽셀: 50 x 50 px; 최대 픽셀은 10,000 x 10,000px입니다.

ID 문서 모델 데이터 추출

ID 문서에서 이름, 생년월일, 만료 날짜를 포함한 데이터를 추출합니다. 다음 리소스가 필요합니다.

  • Azure 구독은 무료로 만들 수 있습니다.

  • Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(F0)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.

Azure Portal에서 키 및 엔드포인트 위치의 스크린샷

참고 항목

문서 인텔리전스 스튜디오는 v3.1 및 v3.0 API 및 이후 버전에서 사용할 수 있습니다.

  1. 문서 인텔리전스 스튜디오 홈페이지에서 신분 문서를 선택합니다.

  2. 샘플 청구서를 분석하거나 자체 파일을 업로드할 수 있습니다.

  3. 분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.

    문서 인텔리전스 스튜디오의 분석 실행과 분석 옵션 버튼 스크린샷.

문서 인텔리전스 샘플 레이블 지정 도구

  1. 문서 인텔리전스 샘플 도구로 이동합니다.

  2. 샘플 도구 홈페이지에서 미리 빌드된 모델을 사용하여 데이터 가져오기 타일을 선택합니다.

    레이아웃 모델 분석 결과 작업의 스크린샷

  3. 드롭다운 메뉴에서 분석할 양식 유형을 선택합니다.

  4. 아래 옵션에서 분석하려는 파일의 URL을 선택합니다.

  5. 원본 필드의 드롭다운 메뉴에서 URL을 선택하고, 선택한 URL을 붙여넣고, 가져오기 단추를 선택합니다.

    원본 위치 드롭다운 메뉴의 스크린샷

  6. 문서 인텔리전스 서비스 엔드포인트 필드에 문서 인텔리전스 구독으로 가져오는 엔드포인트를 붙여넣습니다.

  7. 필드에 문서 인텔리전스 리소스에서 가져오는 키를 붙여넣습니다.

    문서 형식 드롭다운 메뉴를 선택하는 스크린샷.

  8. 분석 실행을 선택합니다. 문서 인텔리전스 샘플 레이블 지정 도구는 미리 빌드된 분석 API를 호출하고 문서를 분석합니다.

  9. 결과 보기 - 추출된 키 값 쌍, 개별 항목, 추출된 강조 표시된 텍스트 및 검색된 테이블을 참조하세요.

    ID 모델 분석 결과 작업의 스크린샷

  10. 자세한 결과를 보려면 JSON 출력 파일을 다운로드 합니다.

    • ‘readResults’ 노드에는 페이지의 각 경계 상자 배치가 있는 모든 텍스트 줄이 포함되어 있습니다.
    • “selectionMarks” 노드는 모든 선택 표시(확인란, 라디오 표시) 및 상태가 선택됨 또는 선택되지 않음인지 여부를 표시합니다.
    • ‘pageResults’ 섹션에는 추출된 표가 포함됩니다. 문서 인텔리전스는 각 표에서 텍스트, 행 및 열 인덱스, 행 및 열 스패닝, 경계 상자 등을 추출합니다.
    • ‘documentResults’ 필드에는 문서에서 가장 관련성이 큰 부분에 대한 키/값 쌍 정보 및 개별 항목 정보가 포함됩니다.

참고 항목

샘플 레이블 지정 도구는 BMP 파일 형식을 지원하지 않습니다. 이는 문서 인텔리전스 Service가 아닌 도구의 제한 사항입니다.

지원되는 문서 유형

지역 문서 형식
전 세계 여권 수첩, 여권 카드
미국 운전 면허증, 신분증, 거주 허가증(녹색 카드), 사회 보장 카드, 군인 ID
유럽 운전 면허증, 신분증, 거주 허가증
인도 운전 면허증, PAN 카드, 아드하르 카드
캐나다 운전 면허증, 신분증, 거주 허가증(메이플 카드)
오스트레일리아 운전 면허증, 사진 카드, 키 패스 ID(디지털 버전 포함)

필드 추출

다음은 문서 유형별로 추출된 필드입니다. 문서 인텔리전스 ID 모델 prebuilt-idDocument은(는) documents.*.fields에서 다음 필드를 추출합니다. json 출력에는 문서, 단어, 선 및 스타일에 추출된 모든 텍스트가 포함됩니다.

idDocument.driverLicense

필드 형식 Description 예시
CountryRegion countryRegion 국가 또는 지역 코드 미국
Region string 시 또는 도 워싱턴
DocumentNumber string 운전 면허증 번호 WDLABCD456DG
DocumentDiscriminator string 운전 면허증 문서 판별자 12645646464554646456464544
FirstName string 지정된 이름 및 중간 이니셜(해당하는 경우) LIAM R.
LastName string Surname TALBOT
Address address 주소 123 STREET ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date 생년월일 01/06/1958
DateOfExpiration date 만료 날짜 08/12/2020
DateOfIssue date 이슈 날짜 08/12/2012
EyeColor string 눈 색 파랑
HairColor string 모발 색 Brown
Height string Height 5'11"
Weight string 가중치 185LB
Sex string 성별 M
Endorsements string 보증 L
Restrictions string 제한 사항 B
VehicleClassifications string 차량 분류 D

idDocument.passport

필드 형식 Description 예시
DocumentNumber string 여권 번호 340020013
FirstName string 지정된 이름 및 중간 이니셜(해당하는 경우) JENNIFER
MiddleName string 지정된 이름과 성 사이 이름 REYES
LastName string Surname BROOKS
Aliases array
Aliases.* string 다른 명칭 MAT LIN
DateOfBirth date 생년월일 1980-01-01
DateOfExpiration date 만료 날짜 2019-05-05
DateOfIssue date 이슈 날짜 2014-05-06
Sex string 성별 F
CountryRegion countryRegion 발급 국가 또는 조직 미국
DocumentType string Document type P
Nationality countryRegion 국적 미국
PlaceOfBirth string 출생 장소 MASSACHUSETTS, U.S.A.
PlaceOfIssue string 발급 장소 리스본
IssuingAuthority string 발급 기관 미국 국무부
PersonalNumber string 개인 ID. 아니요. A234567893
MachineReadableZone object MRZ(머신 판독 가능 영역) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string 지정된 이름 및 중간 이니셜(해당하는 경우) JENNIFER
MachineReadableZone.LastName string Surname BROOKS
MachineReadableZone.DocumentNumber string 여권 번호 340020013
MachineReadableZone.CountryRegion countryRegion 발급 국가 또는 조직 미국
MachineReadableZone.Nationality countryRegion 국적 미국
MachineReadableZone.DateOfBirth date 생년월일 1980-01-01
MachineReadableZone.DateOfExpiration date 만료 날짜 2019-05-05
MachineReadableZone.Sex string 성별 F

idDocument.nationalIdentityCard

필드 형식 Description 예시
CountryRegion countryRegion 국가 또는 지역 코드 미국
Region string 시 또는 도 워싱턴
DocumentNumber string 국가 ID 카드 번호 WDLABCD456DG
DocumentDiscriminator string 국가 ID 카드 문서 판별자 12645646464554646456464544
FirstName string 지정된 이름 및 중간 이니셜(해당하는 경우) LIAM R.
LastName string Surname TALBOT
Address address 주소 123 STREET ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date 생년월일 01/06/1958
DateOfExpiration date 만료 날짜 08/12/2020
DateOfIssue date 이슈 날짜 08/12/2012
EyeColor string 눈 색 파란색
HairColor string 모발 색 갈색
Height string Height 5'11"
Weight string 가중치 185LB
Sex string 성별 M

idDocument.residencePermit

필드 형식 Description 예시
CountryRegion countryRegion 국가 또는 지역 코드 미국
DocumentNumber string 거주 허가증 번호 WDLABCD456DG
FirstName string 지정된 이름 및 중간 이니셜(해당하는 경우) LIAM R.
LastName string Surname TALBOT
DateOfBirth date 생년월일 01/06/1958
DateOfExpiration date 만료 날짜 08/12/2020
DateOfIssue date 이슈 날짜 08/12/2012
Sex string 성별 M
PlaceOfBirth string 출생 장소 독일
Category string 허용 범주 DV2
Address string 주소 123 STREET ADDRESS YOUR CITY WA 99999-1234

idDocument.usSocialSecurityCard

필드 형식 Description 예시
DocumentNumber string 사회 보장 카드 번호 WDLABCD456DG
FirstName string 지정된 이름 및 중간 이니셜(해당하는 경우) LIAM R.
LastName string Surname TALBOT
DateOfIssue date 이슈 날짜 08/12/2012

idDocument

필드 형식 Description 예시
Address address 주소 123 STREET ADDRESS YOUR CITY WA 99999-1234
DocumentNumber string 운전 면허증 번호 WDLABCD456DG
FirstName string 지정된 이름 및 중간 이니셜(해당하는 경우) LIAM R.
LastName string Surname TALBOT
DateOfBirth date 생년월일 01/06/1958
DateOfExpiration date 만료 날짜 08/12/2020

지원되는 문서 유형

ID 문서 모델은 현재 미국 운전 면허증과 국제 여권의 인적 사항 페이지(비자 및 기타 여행 문서 제외) 추출을 지원합니다.

추출된 필드

이름 형식 설명
Country country ISO 3166 표준을 준수하는 국가 번호 "USA"
DateOfBirth 날짜 YYYY-MM-DD 형식의 DOB "1980-01-01"
DateOfExpiration 날짜 YYYY-MM-DD 형식의 만료 날짜 "2019-05-05"
DocumentNumber string 관련 passport 번호, 운전 면허 번호 등 "340020013"
FirstName string 지정된 이름 및 중간 이니셜(해당하는 경우)을 추출했습니다 "JENNIFER"
LastName string 추출된 성 "BROOKS"
국적 country ISO 3166 표준을 준수하는 국가 번호 "USA"
성별 성별 추출 가능한 값은 "M", "F" 및 "X"를 포함 "F"
MachineReadableZone 개체 두 줄의 44 문자를 포함하여 Passport MRZ을 추출했습니다 "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string 문서 유형(예: 여권, 운전 면허증) "passport"
주소 string 추출된 주소(운전 면허증에만 해당) "123 주소에서 도시 WA 99999-1234"
지역 string 추출된 지역, 시, 도 등 (운전면허증만 해당) "워싱턴"

마이그레이션 가이드

다음 단계