Azure AI 문서 인텔리전스(양식 인식기)
PDF, 이미지 또는 Microsoft Office 문서 및 양식에서 텍스트(인쇄 및 필기 OCR) 및 추가 정보(테이블, 확인란, 필드/키 값 쌍)를 미리 학습된 모델(레이아웃, 청구서, 영수증, ID, 명함) 또는 AI 기반 문서 이해를 사용하여 대표 교육 양식 집합에서 만든 사용자 지정 모델을 기반으로 구조화된 데이터로 추출합니다.
이 커넥터는 다음 제품 및 지역에서 사용할 수 있습니다.
| 서비스 | 클래스 | Regions |
|---|---|---|
| Copilot Studio | 스탠다드 | 다음을 제외한 모든 Power Automate 지역 : - 미국 국방부(DoD) |
| 논리 앱 | 스탠다드 | 다음을 제외한 모든 Logic Apps 지역 : - 미국 국방부(DoD) |
| Power Apps | - | 사용할 수 없음 |
| Power Automate (파워 오토메이트) | 스탠다드 | 다음을 제외한 모든 Power Automate 지역 : - 미국 국방부(DoD) |
| 연락처 | |
|---|---|
| 이름 | Microsoft |
| URL | https://aka.ms/formrecognizer |
| 전자 메일 | formrecog_contact@microsoft.com |
| 커넥터 메타데이터 | |
|---|---|
| 게시자 | Microsoft |
| 웹 사이트 | https://aka.ms/formrecognizer |
| 개인 정보 보호 정책 | https://aka.ms/form-recognizer/privacy |
| 카테고리 | AI; 비즈니스 인텔리전스 |
Azure AI Document Intelligence(이전의 Form Recognizer) 커넥터는 Azure AI Document Intelligence에 통합을 제공합니다. 폼, 송장, 영수증, 명함, ID 문서 및 기타 여러 문서 형식에서 정보를 분석하고 추출할 수 있습니다.
필수 조건
이 통합을 사용하려면 Azure Portal에서 Azure AI Document Intelligence 리소스 가 필요합니다. 리소스 링크를 만듭니다. 애플리케이션을 인증하기 위한 엔드포인트와 키를 얻게 됩니다. 연결을 만들려면 계정 키, 사이트 URL을 제공하고 연결 만들기를 선택합니다. 연결에 대한 작업 비용은 여기에서 자세히 알아보세요.
자격 증명을 가져오는 방법
- Azure Portal에서 문서 인텔리전스 리소스를 엽니다( 필수 구성 요소 참조).
- 리소스 관리에서 키 및 엔드포인트 선택
- 엔드포인트 및 키를 복사하고 이를 사용하여 새 연결을 만듭니다.
커넥터 시작
Document Intelligence 커넥터를 시도하는 가장 간단한 방법은 미리 빌드된 모델(미리 빌드된 청구서, 미리 빌드된 레이아웃 등)을 사용하는 것입니다. PDF 또는 문서의 이미지를 제공합니다. 문서 유형에 따라 커넥터 작업을 사용하여 분석하고 검색된 필드를 검사합니다. 여기에서 모델 및 지원되는 기능의 전체 목록입니다.
연결을 만드는 중
커넥터는 다음 인증 유형을 지원합니다.
| API 키 | 문서 Intellignce 리소스 이름 및 API 키를 제공합니다. | 모든 지역 | 공유 가능 |
| Logic Apps 관리 ID | LogicApps 관리 ID를 사용하여 연결 만들기 | LOGICAPPS만 | 공유 가능 |
| Microsoft Entra ID 통합 | Microsoft Entra ID를 사용하여 액세스 | 모든 지역 | 공유할 수 없음 |
| 기본값 [사용되지 않음] | 이 옵션은 명시적 인증 유형이 없는 이전 연결에만 해당되며 이전 버전과의 호환성을 위해서만 제공됩니다. | 모든 지역 | 공유할 수 없음 |
API 키
인증 ID: keyBasedAuth
적용 가능: 모든 지역
문서 Intellignce 리소스 이름 및 API 키를 제공합니다.
공유 가능한 연결입니다. 전원 앱이 다른 사용자와 공유되면 연결도 공유됩니다. 자세한 내용은 캔버스 앱에 대한 커넥터 개요를 참조하세요. - Power Apps | Microsoft Docs
| 이름 | 유형 | Description | 필수 |
|---|---|---|---|
| 계정 키 | 시큐어스트링 (보안 문자열) | 문서 인텔리전스 계정 키 | 진실 |
| 엔드포인트 URL | 문자열 | 문서 인텔리전스 엔드포인트 URL(예: https://your-documentintelligence-resource.cognitiveservices.azure.com/) |
진실 |
Logic Apps 관리 ID
인증 ID: managedIdentityAuth
적용 가능: LOGICAPPS만 해당
LogicApps 관리 ID를 사용하여 연결 만들기
공유 가능한 연결입니다. 전원 앱이 다른 사용자와 공유되면 연결도 공유됩니다. 자세한 내용은 캔버스 앱에 대한 커넥터 개요를 참조하세요. - Power Apps | Microsoft Docs
| 이름 | 유형 | Description | 필수 |
|---|---|---|---|
| LogicApps 관리 ID | managedIdentity | Logic Apps 관리 ID로 로그인 | 진실 |
| 엔드포인트 URL | 문자열 | 문서 인텔리전스 엔드포인트 URL(예: https://your-documentintelligence-resource.cognitiveservices.azure.com/) |
진실 |
Microsoft Entra ID 통합
인증 ID: oauth
적용 가능: 모든 지역
Microsoft Entra ID를 사용하여 액세스
공유 가능한 연결이 아닙니다. 전원 앱이 다른 사용자와 공유되면 다른 사용자에게 새 연결을 명시적으로 만들라는 메시지가 표시됩니다.
| 이름 | 유형 | Description | 필수 |
|---|---|---|---|
| 엔드포인트 URL | 문자열 | 문서 인텔리전스 엔드포인트 URL(예: https://your-documentintelligence-resource.cognitiveservices.azure.com/) |
진실 |
기본값 [사용되지 않음]
적용 가능: 모든 지역
이 옵션은 명시적 인증 유형이 없는 이전 연결에만 해당되며 이전 버전과의 호환성을 위해서만 제공됩니다.
공유 가능한 연결이 아닙니다. 전원 앱이 다른 사용자와 공유되면 다른 사용자에게 새 연결을 명시적으로 만들라는 메시지가 표시됩니다.
| 이름 | 유형 | Description | 필수 |
|---|---|---|---|
| 계정 키 | 시큐어스트링 (보안 문자열) | 문서 인텔리전스 계정 키 | 진실 |
| 엔드포인트 URL | 문자열 | 문서 인텔리전스 엔드포인트 URL(예: https://your-documentintelligence-resource.cognitiveservices.azure.com/) |
진실 |
제한 한도
| Name | 호출 | 갱신 기간 |
|---|---|---|
| 연결당 API 호출 | 1200 | 60초 |
동작
| ID 문서 분석(사용되지 않음) [사용되지 않음] |
지정된 ID 문서에서 필드 텍스트 및 의미 체계 값을 추출합니다(사용되지 않음). |
| 레이아웃 분석(사용되지 않음) [사용되지 않음] |
지정된 문서에서 텍스트 및 레이아웃 정보를 추출합니다(사용되지 않음). |
| 명함 분석(사용되지 않음) [사용되지 않음] |
지정된 명함 문서에서 필드 텍스트 및 의미 체계 값을 추출합니다(사용되지 않음). |
| 문서 분류자를 사용하여 문서 분류(v3.1 API) |
문서 분류자를 사용하여 문서 분류자(v3.1 API)를 사용하여 문서를 분류합니다. |
| 문서 분류자를 사용하여 문서 분류(v4.x API) |
문서 분류자(v4.x API)를 사용하여 문서 분류 |
| 미리 빌드된 또는 사용자 지정 모델에 대한 문서 분석(v3.x API) |
지정된 문서(v3.x API)에서 키-값 쌍, 테이블 및 의미 체계 값을 추출합니다. |
| 미리 빌드된 또는 사용자 지정 모델에 대한 문서 분석(v4.x API) |
지정된 문서(v4.x API)에서 키-값 쌍, 테이블 및 의미 체계 값을 추출합니다. |
| 사용자 지정 양식 분석(사용되지 않음) [사용되지 않음] |
지정된 문서에서 키-값 쌍, 테이블 및 의미 체계 값을 추출합니다(사용되지 않음). |
| 영수증 분석(사용되지 않음) [사용되지 않음] |
지정된 영수증 문서에서 필드 텍스트 및 의미 체계 값을 추출합니다(사용되지 않음). |
| 청구서 분석(사용되지 않음) [사용되지 않음] |
지정된 청구서 문서에서 필드 텍스트 및 의미 체계 값을 추출합니다(사용되지 않음). |
ID 문서 분석(사용되지 않음) [사용되지 않음]
지정된 ID 문서에서 필드 텍스트 및 의미 체계 값을 추출합니다(사용되지 않음).
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
텍스트 세부 정보 포함
|
includeTextDetails | boolean |
결과에 텍스트 줄 및 요소 참조를 포함합니다. 기본값: True입니다(FR 커넥터에만 해당). |
|
|
페이지
|
pages | string |
페이지 번호와 범위를 쉼표(예: '2, 5-7')로 구분하여 개별 페이지 및 페이지 범위(예: 페이지 2, 5-7)에서 송장 정보를 추출하기 위한 다중 페이지 PDF 및 TIFF 문서에 대한 페이지 선택입니다. 설정하지 않으면 모든 페이지가 처리됩니다. |
|
|
문서/이미지 파일 콘텐츠
|
inputFileContent | binary |
분석할 PDF 문서 또는 이미지(JPG 또는 PNG) 파일입니다. |
|
|
문서/이미지 URL
|
inputFileUrl | string |
입력 파일의 URL 경로입니다. 문서/이미지 파일 콘텐츠 대신 사용할 수 있습니다. |
반환
대기 중 분석 작업의 상태 및 결과입니다.
레이아웃 분석(사용되지 않음) [사용되지 않음]
지정된 문서에서 텍스트 및 레이아웃 정보를 추출합니다(사용되지 않음).
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
페이지
|
pages | string |
페이지 번호와 범위를 쉼표(예: '2, 5-7')로 구분하여 개별 페이지 및 페이지 범위(예: 페이지 2, 5-7)에서 송장 정보를 추출하기 위한 다중 페이지 PDF 및 TIFF 문서에 대한 페이지 선택입니다. 설정하지 않으면 모든 페이지가 처리됩니다. |
|
|
Language
|
language | string |
문서에 있는 텍스트의 BCP-47 언어 코드입니다. |
|
|
읽기 순서
|
readingOrder | string |
추출 텍스트 요소를 정렬할 때 적용해야 하는 읽기 순서 알고리즘을 지정하는 선택적 매개 변수입니다. '기본' 또는 '자연'일 수 있습니다. 지정하지 않으면 기본값으로 설정됩니다. |
|
|
문서/이미지 파일 콘텐츠
|
inputFileContent | binary |
분석할 PDF 문서 또는 이미지(JPG 또는 PNG) 파일입니다. |
|
|
문서/이미지 URL
|
inputFileUrl | string |
입력 파일의 URL 경로입니다. 문서/이미지 파일 콘텐츠 대신 사용할 수 있습니다. |
반환
대기 중 분석 작업의 상태 및 결과입니다.
명함 분석(사용되지 않음) [사용되지 않음]
지정된 명함 문서에서 필드 텍스트 및 의미 체계 값을 추출합니다(사용되지 않음).
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
텍스트 세부 정보 포함
|
includeTextDetails | boolean |
결과에 텍스트 줄 및 요소 참조를 포함합니다. 기본값: True입니다(FR 커넥터에만 해당). |
|
|
페이지
|
pages | string |
페이지 번호와 범위를 쉼표(예: '2, 5-7')로 구분하여 개별 페이지 및 페이지 범위(예: 페이지 2, 5-7)에서 송장 정보를 추출하기 위한 다중 페이지 PDF 및 TIFF 문서에 대한 페이지 선택입니다. 설정하지 않으면 모든 페이지가 처리됩니다. |
|
|
로케일
|
locale | string |
청구서의 로캘입니다. 지원되는 로캘에는 en-US. |
|
|
문서/이미지 파일 콘텐츠
|
inputFileContent | binary |
분석할 PDF 문서 또는 이미지(JPG 또는 PNG) 파일입니다. |
|
|
문서/이미지 URL
|
inputFileUrl | string |
입력 파일의 URL 경로입니다. 문서/이미지 파일 콘텐츠 대신 사용할 수 있습니다. |
반환
대기 중 분석 작업의 상태 및 결과입니다.
문서 분류자를 사용하여 문서 분류(v3.1 API)
문서 분류자를 사용하여 문서 분류자(v3.1 API)를 사용하여 문서를 분류합니다.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
분류자 식별자
|
classifierId | True | string |
형식 - [a-zA-Z0-9][a-zA-Z0-9._~-]{1,63}. 고유 분류자 이름입니다. |
|
페이지
|
pages | string |
페이지 번호와 범위를 쉼표(예: '2, 5-7')로 구분하여 개별 페이지 및 페이지 범위(예: 2페이지, 5-7페이지)에서 정보를 추출하기 위한 다중 페이지 PDF 및 TIFF 문서의 페이지 선택입니다. 설정하지 않으면 모든 페이지가 처리됩니다. |
|
|
로케일
|
locale | string |
텍스트 인식 및 문서 분석에 대한 로캘 힌트입니다. 값은 언어 코드(예: "en", "fr") 또는 BCP 47 언어 태그(예: "en-US")만 포함할 수 있습니다. |
|
|
문자열 인덱스 형식
|
stringIndexType | string |
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다. 지원되는 옵션: textElements, unicodeCodePoint, utf16CodeUnit. |
|
|
문서/이미지 파일 콘텐츠
|
inputFileContent | binary |
분석할 PDF 문서 또는 이미지(JPG, PNG, BMP, TIFF) 파일입니다. |
|
|
문서/이미지 URL
|
inputFileUrl | string |
입력 파일의 URL 경로입니다. 문서/이미지 파일 콘텐츠 대신 사용할 수 있습니다. |
반환
분석 작업의 상태 및 결과입니다.
문서 분류자를 사용하여 문서 분류(v4.x API)
문서 분류자(v4.x API)를 사용하여 문서 분류
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
문서 인텔리전스 API 버전
|
api-version | True | string |
문서 인텔리전스 API 버전입니다. |
|
분류자 식별자
|
classifierId | True | string |
형식 - [a-zA-Z0-9][a-zA-Z0-9._~-]{1,63}. 고유 분류자 이름입니다. |
|
문서/이미지 파일 콘텐츠
|
inputFileContent | binary |
분석할 PDF 문서 또는 이미지(JPG, PNG, BMP, TIFF) 파일입니다. |
|
|
문서/이미지 URL
|
inputFileUrl | string |
입력 파일의 URL 경로입니다. 문서/이미지 파일 콘텐츠 대신 사용할 수 있습니다. |
|
|
분할 모드
|
split | string |
파일 분할 동작입니다. |
|
|
페이지
|
pages | string |
페이지 번호와 범위를 쉼표(예: '2, 5-7')로 구분하여 개별 페이지 및 페이지 범위(예: 2페이지, 5-7페이지)에서 정보를 추출하기 위한 다중 페이지 PDF 및 TIFF 문서의 페이지 선택입니다. 설정하지 않으면 모든 페이지가 처리됩니다. |
|
|
로케일
|
locale | string |
텍스트 인식 및 문서 분석에 대한 로캘 힌트입니다. 값은 언어 코드(예: "en", "fr") 또는 BCP 47 언어 태그(예: "en-US")만 포함할 수 있습니다. |
|
|
문자열 인덱스 형식
|
stringIndexType | string |
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다. 지원되는 옵션: textElements, unicodeCodePoint, utf16CodeUnit. |
반환
분석 작업의 상태 및 결과입니다.
미리 빌드된 또는 사용자 지정 모델에 대한 문서 분석(v3.x API)
지정된 문서(v3.x API)에서 키-값 쌍, 테이블 및 의미 체계 값을 추출합니다.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
문서 인텔리전스 API 버전
|
api-version | True | string |
문서 인텔리전스 API 버전입니다. |
|
모델 식별자
|
modelId | True | string |
미리 빌드된 modelIds: 미리 빌드된 읽기, 미리 빌드된 레이아웃, 미리 빌드된 문서, 미리 빌드된 businessCard, 미리 빌드된-idDocument, 미리 빌드된 청구서, 미리 빌드된 영수증, 미리 빌드된-tax.us.w2, 미리 빌드된-백신 접종 카드, prebuilt-healthInsuranceCard.us. 사용자 지정 modelId 형식 - [a-zA-Z0-9][a-zA-Z0-9._~-]{1,63}. 고유 모델 이름입니다. |
|
페이지
|
pages | string |
페이지 번호와 범위를 쉼표(예: '2, 5-7')로 구분하여 개별 페이지 및 페이지 범위(예: 페이지 2, 5-7)에서 송장 정보를 추출하기 위한 다중 페이지 PDF 및 TIFF 문서에 대한 페이지 선택입니다. 설정하지 않으면 모든 페이지가 처리됩니다. |
|
|
로케일
|
locale | string |
텍스트 인식 및 문서 분석에 대한 로캘 힌트입니다. 값은 언어 코드(예: "en", "fr") 또는 BCP 47 언어 태그(예: "en-US")만 포함할 수 있습니다. |
|
|
문자열 인덱스 형식
|
stringIndexType | string |
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다. 지원되는 옵션: textElements, unicodeCodePoint, utf16CodeUnit. |
|
|
선택적 및 프리미엄 기능
|
features | array |
선택적 분석 기능 목록(예: ocrHighResolution, 언어, 바코드, 수식, keyValuePairs 및 styleFont). |
|
|
문서/이미지 파일 콘텐츠
|
inputFileContent | binary |
분석할 PDF 문서 또는 이미지(JPG, PNG, BMP, TIFF) 파일입니다. |
|
|
문서/이미지 URL
|
inputFileUrl | string |
입력 파일의 URL 경로입니다. 문서/이미지 파일 콘텐츠 대신 사용할 수 있습니다. |
반환
분석 작업의 상태 및 결과입니다.
미리 빌드된 또는 사용자 지정 모델에 대한 문서 분석(v4.x API)
지정된 문서(v4.x API)에서 키-값 쌍, 테이블 및 의미 체계 값을 추출합니다.
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
문서 인텔리전스 API 버전
|
api-version | True | string |
문서 인텔리전스 API 버전입니다. |
|
모델 식별자
|
modelId | True | string |
미리 빌드된 modelIds: 미리 빌드된 읽기, 미리 빌드된 레이아웃, 미리 빌드된 businessCard, prebuilt-idDocument, 미리 빌드된 청구서, 미리 빌드된 영수증, 미리 빌드된-tax.us.w2, 미리 빌드된 백신 접종 카드, prebuilt-healthInsuranceCard.us, 미리 빌드된 세금.us.1098, prebuilt-tax.us.1098E, prebuilt-tax.us.1098T, 미리 빌드된 계약 등 사용자 지정 modelId 형식 - [a-zA-Z0-9][a-zA-Z0-9._~-]{1,63}. 고유 모델 이름입니다. |
|
문서/이미지 파일 콘텐츠
|
inputFileContent | binary |
분석할 PDF 문서 또는 이미지(JPG, PNG, BMP, TIFF) 파일입니다. |
|
|
문서/이미지 URL
|
inputFileUrl | string |
입력 파일의 URL 경로입니다. 문서/이미지 파일 콘텐츠 대신 사용할 수 있습니다. |
|
|
페이지
|
pages | string |
페이지 번호와 범위를 쉼표(예: '2, 5-7')로 구분하여 개별 페이지 및 페이지 범위(예: 페이지 2, 5-7)에서 송장 정보를 추출하기 위한 다중 페이지 PDF 및 TIFF 문서에 대한 페이지 선택입니다. 설정하지 않으면 모든 페이지가 처리됩니다. |
|
|
로케일
|
locale | string |
텍스트 인식 및 문서 분석에 대한 로캘 힌트입니다. 값은 언어 코드(예: "en", "fr") 또는 BCP 47 언어 태그(예: "en-US")만 포함할 수 있습니다. |
|
|
문자열 인덱스 형식
|
stringIndexType | string |
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다. 지원되는 옵션: textElements, unicodeCodePoint, utf16CodeUnit. |
|
|
선택적 및 프리미엄 기능
|
features | array |
선택적 분석 기능 목록(예: ocrHighResolution, 언어, 바코드, 수식, keyValuePairs, styleFont 및 queryFields). |
|
|
쿼리 필드
|
queryFields | array |
추출할 추가 필드 목록입니다. 예: "NumberOfGuests,StoreNumber" |
|
|
출력 콘텐츠 형식
|
outputContentFormat | string |
분석 결과 최상위 콘텐츠의 형식입니다. |
반환
분석 작업의 상태 및 결과입니다.
사용자 지정 양식 분석(사용되지 않음) [사용되지 않음]
지정된 문서에서 키-값 쌍, 테이블 및 의미 체계 값을 추출합니다(사용되지 않음).
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
모델 식별자
|
modelId | True | string |
형식 - uuid. 모델 식별자입니다. |
|
텍스트 세부 정보 포함
|
includeTextDetails | boolean |
결과에 텍스트 줄 및 요소 참조를 포함합니다. 기본값: True입니다(FR 커넥터에만 해당). |
|
|
페이지
|
pages | string |
페이지 번호와 범위를 쉼표(예: '2, 5-7')로 구분하여 개별 페이지 및 페이지 범위(예: 페이지 2, 5-7)에서 송장 정보를 추출하기 위한 다중 페이지 PDF 및 TIFF 문서에 대한 페이지 선택입니다. 설정하지 않으면 모든 페이지가 처리됩니다. |
|
|
문서/이미지 파일 콘텐츠
|
inputFileContent | binary |
분석할 PDF 문서 또는 이미지(JPG 또는 PNG) 파일입니다. |
|
|
문서/이미지 URL
|
inputFileUrl | string |
입력 파일의 URL 경로입니다. 문서/이미지 파일 콘텐츠 대신 사용할 수 있습니다. |
반환
대기 중 분석 작업의 상태 및 결과입니다.
영수증 분석(사용되지 않음) [사용되지 않음]
지정된 영수증 문서에서 필드 텍스트 및 의미 체계 값을 추출합니다(사용되지 않음).
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
텍스트 세부 정보 포함
|
includeTextDetails | boolean |
결과에 텍스트 줄 및 요소 참조를 포함합니다. 기본값: True입니다(FR 커넥터에만 해당). |
|
|
페이지
|
pages | string |
페이지 번호와 범위를 쉼표(예: '2, 5-7')로 구분하여 개별 페이지 및 페이지 범위(예: 페이지 2, 5-7)에서 송장 정보를 추출하기 위한 다중 페이지 PDF 및 TIFF 문서에 대한 페이지 선택입니다. 설정하지 않으면 모든 페이지가 처리됩니다. |
|
|
로케일
|
locale | string |
청구서의 로캘입니다. 지원되는 로캘에는 en-US. |
|
|
문서/이미지 파일 콘텐츠
|
inputFileContent | binary |
분석할 PDF 문서 또는 이미지(JPG 또는 PNG) 파일입니다. |
|
|
문서/이미지 URL
|
inputFileUrl | string |
입력 파일의 URL 경로입니다. 문서/이미지 파일 콘텐츠 대신 사용할 수 있습니다. |
반환
대기 중 분석 작업의 상태 및 결과입니다.
청구서 분석(사용되지 않음) [사용되지 않음]
지정된 청구서 문서에서 필드 텍스트 및 의미 체계 값을 추출합니다(사용되지 않음).
매개 변수
| Name | 키 | 필수 | 형식 | Description |
|---|---|---|---|---|
|
텍스트 세부 정보 포함
|
includeTextDetails | boolean |
결과에 텍스트 줄 및 요소 참조를 포함합니다. 기본값: True입니다(FR 커넥터에만 해당). |
|
|
페이지
|
pages | string |
페이지 번호와 범위를 쉼표(예: '2, 5-7')로 구분하여 개별 페이지 및 페이지 범위(예: 페이지 2, 5-7)에서 송장 정보를 추출하기 위한 다중 페이지 PDF 및 TIFF 문서에 대한 페이지 선택입니다. 설정하지 않으면 모든 페이지가 처리됩니다. |
|
|
로케일
|
locale | string |
청구서의 로캘입니다. 지원되는 로캘에는 en-US. |
|
|
문서/이미지 파일 콘텐츠
|
inputFileContent | binary |
분석할 PDF 문서 또는 이미지(JPG 또는 PNG) 파일입니다. |
|
|
문서/이미지 URL
|
inputFileUrl | string |
입력 파일의 URL 경로입니다. 문서/이미지 파일 콘텐츠 대신 사용할 수 있습니다. |
반환
대기 중 분석 작업의 상태 및 결과입니다.
정의
OperationStatus
LayoutAnalyzeOperationResult
대기 중 분석 작업의 상태 및 결과입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
status
|
status | OperationStatus |
큐에 대기된 작업의 상태입니다. |
|
생성된날짜시간
|
createdDateTime | string |
분석 작업이 제출된 날짜 및 시간(UTC)입니다. |
|
lastUpdatedDateTime
|
lastUpdatedDateTime | string |
상태가 마지막으로 업데이트된 날짜 및 시간(UTC)입니다. |
|
analyzeResult
|
analyzeResult | LayoutAnalyzeResult |
작업 결과를 분석합니다. |
InvoiceAnalyzeOperationResult
대기 중 분석 작업의 상태 및 결과입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
status
|
status | OperationStatus |
큐에 대기된 작업의 상태입니다. |
|
생성된날짜시간
|
createdDateTime | string |
분석 작업이 제출된 날짜 및 시간(UTC)입니다. |
|
lastUpdatedDateTime
|
lastUpdatedDateTime | string |
상태가 마지막으로 업데이트된 날짜 및 시간(UTC)입니다. |
|
analyzeResult
|
analyzeResult | InvoiceAnalyzeResult |
작업 결과를 분석합니다. |
BusinessCardAnalyzeOperationResult
대기 중 분석 작업의 상태 및 결과입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
status
|
status | OperationStatus |
큐에 대기된 작업의 상태입니다. |
|
생성된날짜시간
|
createdDateTime | string |
분석 작업이 제출된 날짜 및 시간(UTC)입니다. |
|
lastUpdatedDateTime
|
lastUpdatedDateTime | string |
상태가 마지막으로 업데이트된 날짜 및 시간(UTC)입니다. |
|
analyzeResult
|
analyzeResult | BusinessCardAnalyzeResult |
작업 결과를 분석합니다. |
ReceiptAnalyzeOperationResult
대기 중 분석 작업의 상태 및 결과입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
status
|
status | OperationStatus |
큐에 대기된 작업의 상태입니다. |
|
생성된날짜시간
|
createdDateTime | string |
분석 작업이 제출된 날짜 및 시간(UTC)입니다. |
|
lastUpdatedDateTime
|
lastUpdatedDateTime | string |
상태가 마지막으로 업데이트된 날짜 및 시간(UTC)입니다. |
|
analyzeResult
|
analyzeResult | ReceiptAnalyzeResult |
작업 결과를 분석합니다. |
IdAnalyzeOperationResult
대기 중 분석 작업의 상태 및 결과입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
status
|
status | OperationStatus |
큐에 대기된 작업의 상태입니다. |
|
생성된날짜시간
|
createdDateTime | string |
분석 작업이 제출된 날짜 및 시간(UTC)입니다. |
|
lastUpdatedDateTime
|
lastUpdatedDateTime | string |
상태가 마지막으로 업데이트된 날짜 및 시간(UTC)입니다. |
|
analyzeResult
|
analyzeResult | IdAnalyzeResult |
작업 결과를 분석합니다. |
CustomFormsAnalyzeOperationResult
대기 중 분석 작업의 상태 및 결과입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
status
|
status | OperationStatus |
큐에 대기된 작업의 상태입니다. |
|
생성된날짜시간
|
createdDateTime | string |
분석 작업이 제출된 날짜 및 시간(UTC)입니다. |
|
lastUpdatedDateTime
|
lastUpdatedDateTime | string |
상태가 마지막으로 업데이트된 날짜 및 시간(UTC)입니다. |
|
analyzeResult
|
analyzeResult | CustomFormsAnalyzeResult |
작업 결과를 분석합니다. |
FormOperationError
작업 중에 보고된 오류입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
message
|
message | string |
오류 메시지입니다. |
LayoutAnalyzeResult
작업 결과를 분석합니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
version
|
version | string |
이 결과에 사용되는 스키마의 버전입니다. |
|
readResults
|
readResults | array of ReadResult |
입력에서 추출된 텍스트입니다. |
|
pageResults
|
pageResults | array of PageResult |
입력에서 추출된 페이지 수준 정보입니다. |
|
오류
|
errors | array of FormOperationError |
분석 작업 중에 보고된 오류 목록입니다. |
InvoiceAnalyzeResult
작업 결과를 분석합니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
version
|
version | string |
이 결과에 사용되는 스키마의 버전입니다. |
|
readResults
|
readResults | array of ReadResult |
입력에서 추출된 텍스트입니다. |
|
pageResults
|
pageResults | array of PageResult |
입력에서 추출된 페이지 수준 정보입니다. |
|
documentResults
|
documentResults | array of InvoiceDocumentResult |
입력에서 추출된 문서 수준 정보입니다. |
|
오류
|
errors | array of FormOperationError |
분석 작업 중에 보고된 오류 목록입니다. |
BusinessCardAnalyzeResult
작업 결과를 분석합니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
version
|
version | string |
이 결과에 사용되는 스키마의 버전입니다. |
|
readResults
|
readResults | array of ReadResult |
입력에서 추출된 텍스트입니다. |
|
pageResults
|
pageResults | array of PageResult |
입력에서 추출된 페이지 수준 정보입니다. |
|
documentResults
|
documentResults | array of BusinessCardDocumentResult |
입력에서 추출된 문서 수준 정보입니다. |
|
오류
|
errors | array of FormOperationError |
분석 작업 중에 보고된 오류 목록입니다. |
ReceiptAnalyzeResult
작업 결과를 분석합니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
version
|
version | string |
이 결과에 사용되는 스키마의 버전입니다. |
|
readResults
|
readResults | array of ReadResult |
입력에서 추출된 텍스트입니다. |
|
pageResults
|
pageResults | array of PageResult |
입력에서 추출된 페이지 수준 정보입니다. |
|
documentResults
|
documentResults | array of ReceiptDocumentResult |
입력에서 추출된 문서 수준 정보입니다. |
|
오류
|
errors | array of FormOperationError |
분석 작업 중에 보고된 오류 목록입니다. |
IdAnalyzeResult
작업 결과를 분석합니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
version
|
version | string |
이 결과에 사용되는 스키마의 버전입니다. |
|
readResults
|
readResults | array of ReadResult |
입력에서 추출된 텍스트입니다. |
|
pageResults
|
pageResults | array of PageResult |
입력에서 추출된 페이지 수준 정보입니다. |
|
documentResults
|
documentResults | array of IdDocumentResult |
입력에서 추출된 문서 수준 정보입니다. |
|
오류
|
errors | array of FormOperationError |
분석 작업 중에 보고된 오류 목록입니다. |
CustomFormsAnalyzeResult
작업 결과를 분석합니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
version
|
version | string |
이 결과에 사용되는 스키마의 버전입니다. |
|
readResults
|
readResults | array of ReadResult |
입력에서 추출된 텍스트입니다. |
|
pageResults
|
pageResults | array of PageResult |
입력에서 추출된 페이지 수준 정보입니다. |
|
documentResults
|
documentResults | array of CustomFormsDocumentResult |
입력에서 추출된 문서 수준 정보입니다. |
|
오류
|
errors | array of FormOperationError |
분석 작업 중에 보고된 오류 목록입니다. |
ReadResult
입력 문서의 페이지에서 추출된 텍스트입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
page
|
page | integer |
입력 문서의 1부터 시작하는 페이지 번호입니다. |
|
각
|
angle | float |
(-180, 180] 사이의 각도로 측정된 시계 방향으로 텍스트의 일반 방향입니다. |
|
width
|
width | float |
이미지/PDF의 너비(각각 픽셀/인치)입니다. |
|
height
|
height | float |
이미지/PDF의 높이(각각 픽셀/인치)입니다. |
|
단위
|
unit | string |
너비, 높이 및 boundingBox 속성에 사용되는 단위입니다. 이미지의 경우 단위는 "픽셀"입니다. PDF의 경우 단위는 "인치"입니다. |
|
라인
|
lines | array of TextLine |
includeTextDetails가 true로 설정된 경우 인식된 텍스트 줄의 목록입니다. 반환되는 최대 줄 수는 페이지당 300개입니다. 특정 경우에는 근접이 더 높은 우선 순위로 처리되지만 선은 위에서 아래로, 왼쪽에서 오른쪽으로 정렬됩니다. 정렬 순서는 검색된 텍스트에 따라 달라지으므로 이미지 및 OCR 버전 업데이트 간에 변경될 수 있습니다. 따라서 비즈니스 논리는 순서 대신 실제 선 위치에 따라 작성되어야 합니다. |
TextLine
추출된 텍스트 줄을 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
문자 메시지
|
text | string |
줄의 텍스트 내용입니다. |
|
boundingBox
|
boundingBox | BoundingBox |
원본 이미지의 왼쪽 상단을 기준으로 지정된 좌표가 있는 사분면 경계 상자입니다. 8개의 숫자는 텍스트 방향을 기준으로 왼쪽 위 모서리에서 시계 방향으로 네 점을 나타냅니다. 이미지의 경우 (x, y) 좌표는 픽셀 단위로 측정됩니다. PDF의 경우 (x, y) 좌표는 인치 단위로 측정됩니다. |
|
words
|
words | array of TextWord |
텍스트 줄의 단어 목록입니다. |
TextWord
단어를 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
문자 메시지
|
text | string |
단어의 텍스트 내용입니다. |
|
boundingBox
|
boundingBox | BoundingBox |
원본 이미지의 왼쪽 상단을 기준으로 지정된 좌표가 있는 사분면 경계 상자입니다. 8개의 숫자는 텍스트 방향을 기준으로 왼쪽 위 모서리에서 시계 방향으로 네 점을 나타냅니다. 이미지의 경우 (x, y) 좌표는 픽셀 단위로 측정됩니다. PDF의 경우 (x, y) 좌표는 인치 단위로 측정됩니다. |
|
자신
|
confidence | Confidence |
신뢰도 값입니다. |
BoundingBox
원본 이미지의 왼쪽 상단을 기준으로 지정된 좌표가 있는 사분면 경계 상자입니다. 8개의 숫자는 텍스트 방향을 기준으로 왼쪽 위 모서리에서 시계 방향으로 네 점을 나타냅니다. 이미지의 경우 (x, y) 좌표는 픽셀 단위로 측정됩니다. PDF의 경우 (x, y) 좌표는 인치 단위로 측정됩니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
아이템
|
float |
PageResult
단일 페이지에서 추출된 정보입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
page
|
page | integer |
페이지 번호입니다. |
|
clusterId
|
clusterId | integer |
클러스터 식별자입니다. |
|
키값쌍
|
keyValuePairs | array of KeyValuePair |
페이지에서 추출된 키-값 쌍의 목록입니다. |
|
tables
|
tables | array of DataTable |
페이지에서 추출된 데이터 테이블 목록입니다. |
KeyValuePair
추출된 키-값 쌍에 대한 정보입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
label
|
label | string |
키/값 쌍 항목에 대한 사용자 정의 레이블입니다. |
|
key
|
key | KeyValueElement |
키-값 쌍의 추출된 키 또는 값에 대한 정보입니다. |
|
value
|
value | KeyValueElement |
키-값 쌍의 추출된 키 또는 값에 대한 정보입니다. |
|
자신
|
confidence | Confidence |
신뢰도 값입니다. |
KeyValueElement
키-값 쌍의 추출된 키 또는 값에 대한 정보입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
문자 메시지
|
text | string |
키 또는 값의 텍스트 내용입니다. |
|
boundingBox
|
boundingBox | BoundingBox |
원본 이미지의 왼쪽 상단을 기준으로 지정된 좌표가 있는 사분면 경계 상자입니다. 8개의 숫자는 텍스트 방향을 기준으로 왼쪽 위 모서리에서 시계 방향으로 네 점을 나타냅니다. 이미지의 경우 (x, y) 좌표는 픽셀 단위로 측정됩니다. PDF의 경우 (x, y) 좌표는 인치 단위로 측정됩니다. |
|
요소
|
elements | array of ElementReference |
includeTextDetails가 true로 설정된 경우 이 키 또는 값을 구성하는 텍스트 요소에 대한 참조 목록입니다. |
ElementReference
DataTable
페이지에 포함된 추출된 테이블에 대한 정보입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
행
|
rows | integer |
행 수입니다. |
|
columns
|
columns | integer |
열 수입니다. |
|
셀
|
cells | array of DataTableCell |
표에 포함된 셀 목록입니다. |
DataTableCell
표에서 추출된 셀에 대한 정보입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
rowIndex
|
rowIndex | integer |
셀의 행 인덱스입니다. |
|
columnIndex
|
columnIndex | integer |
셀의 열 인덱스입니다. |
|
행 스팬
|
rowSpan | integer |
이 셀에 걸쳐 있는 행 수입니다. |
|
columnSpan
|
columnSpan | integer |
이 셀에 걸쳐 있는 열 수입니다. |
|
문자 메시지
|
text | string |
셀의 텍스트 내용입니다. |
|
boundingBox
|
boundingBox | BoundingBox |
원본 이미지의 왼쪽 상단을 기준으로 지정된 좌표가 있는 사분면 경계 상자입니다. 8개의 숫자는 텍스트 방향을 기준으로 왼쪽 위 모서리에서 시계 방향으로 네 점을 나타냅니다. 이미지의 경우 (x, y) 좌표는 픽셀 단위로 측정됩니다. PDF의 경우 (x, y) 좌표는 인치 단위로 측정됩니다. |
|
요소
|
elements | array of ElementReference |
includeTextDetails가 true로 설정된 경우 이 표 셀을 구성하는 텍스트 요소에 대한 참조 목록입니다. |
|
isHeader
|
isHeader | boolean |
현재 셀이 머리글 셀이면 반환합니다. |
|
isFooter
|
isFooter | boolean |
현재 셀에 바닥글 셀이 있으면 반환합니다. |
InvoiceDocumentResult
입력 문서에 해당하는 추출된 필드 집합입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
docType
|
docType | string |
문서 형식입니다. |
|
pageRange
|
pageRange | array of integer |
문서가 있는 첫 번째 및 마지막 페이지 번호입니다. |
|
fields
|
fields | InvoiceFields |
2.1에 대한 청구서 필드입니다. |
BusinessCardDocumentResult
입력 문서에 해당하는 추출된 필드 집합입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
docType
|
docType | string |
문서 형식입니다. |
|
pageRange
|
pageRange | array of integer |
문서가 있는 첫 번째 및 마지막 페이지 번호입니다. |
|
fields
|
fields | BusinessCardFields |
2.1에 대한 BusinessCard 필드입니다. |
CustomFormsDocumentResult
입력 문서에 해당하는 추출된 필드 집합입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
docType
|
docType | string |
문서 형식입니다. |
|
pageRange
|
pageRange | array of integer |
문서가 있는 첫 번째 및 마지막 페이지 번호입니다. |
|
Fields
|
_fields | array of CustomFormsFields |
fieldName 및 fieldValue 속성이 있는 필드의 배열입니다. |
ReceiptDocumentResult
입력 문서에 해당하는 추출된 필드 집합입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
docType
|
docType | string |
문서 형식입니다. |
|
pageRange
|
pageRange | array of integer |
문서가 있는 첫 번째 및 마지막 페이지 번호입니다. |
|
fields
|
fields | ReceiptFields |
2.1에 대한 영수증 필드. |
IdDocumentResult
입력 문서에 해당하는 추출된 필드 집합입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
docType
|
docType | string |
문서 형식입니다. |
|
pageRange
|
pageRange | array of integer |
문서가 있는 첫 번째 및 마지막 페이지 번호입니다. |
|
fields
|
fields | IdFields |
2.1의 ID 문서 필드입니다. |
CustomFormsFields
사용자 지정 양식 필드입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
필드 이름
|
fieldName | string | |
|
필드 값
|
fieldValue | FieldValue |
예측된 필드 값 개체입니다. |
InvoiceFields
2.1에 대한 청구서 필드입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
기한(텍스트)
|
AmountDue.text | string |
청구서에 기록된 금액을 반환합니다. |
|
기한(숫자)
|
AmountDue.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 1234.98. |
|
만기 금액의 신뢰도
|
AmountDue.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
대금 청구 주소
|
BillingAddress.text | string | |
|
청구 주소의 신뢰도
|
BillingAddress.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
청구 주소 받는 사람
|
BillingAddressRecipient.text | string | |
|
청구 주소 받는 사람의 신뢰도
|
BillingAddressRecipient.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
고객 주소
|
CustomerAddress.text | string | |
|
고객 주소의 신뢰도
|
CustomerAddress.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
고객 주소 받는 사람
|
CustomerAddressRecipient.text | string | |
|
고객 주소 받는 사람의 신뢰도
|
CustomerAddressRecipient.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
고객 ID
|
CustomerId.text | string | |
|
고객 ID의 신뢰도
|
CustomerId.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
고객 이름
|
CustomerName.text | string | |
|
고객 이름 신뢰도
|
CustomerName.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
기한(텍스트)
|
DueDate.text | string |
청구서에 기록된 기한을 반환합니다. |
|
기한(날짜)
|
DueDate.valueDate | date |
날짜 형식입니다. 예: 2019-05-31. |
|
기한 신뢰도
|
DueDate.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
청구서 날짜(텍스트)
|
InvoiceDate.text | string |
청구서에 기록된 대로 청구서 날짜를 반환합니다. |
|
청구서 날짜(날짜)
|
InvoiceDate.valueDate | date |
날짜 형식입니다. 예: 2019-05-31. |
|
청구서 날짜 신뢰도
|
InvoiceDate.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
송장 ID
|
InvoiceId.text | string | |
|
청구서 ID의 신뢰도
|
InvoiceId.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
청구서 합계(텍스트)
|
InvoiceTotal.text | string |
청구서에 기록된 청구서 합계를 반환합니다. |
|
청구서 총계(번호)
|
InvoiceTotal.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 1234.98. |
|
청구서 총계의 신뢰도
|
InvoiceTotal.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
이전 미지불 잔액(텍스트)
|
PreviousUnpaidBalance.text | string |
청구서에 기록된 이전 미지불 잔액을 반환합니다. |
|
이전 미지급 잔액(번호)
|
PreviousUnpaidBalance.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 1234.98. |
|
이전 미지급 잔액의 신뢰도
|
PreviousUnpaidBalance.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
구매 주문
|
PurchaseOrder.text | string | |
|
구매 주문의 신뢰도
|
PurchaseOrder.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
송금 주소
|
RemittanceAddress.text | string | |
|
송금 주소의 신뢰도
|
RemittanceAddress.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
송금 주소 받는 사람
|
RemittanceAddressRecipient.text | string | |
|
송금 주소 받는 사람의 신뢰도
|
RemittanceAddressRecipient.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
서비스 주소
|
ServiceAddress.text | string | |
|
서비스 주소의 신뢰도
|
ServiceAddress.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
서비스 주소 받는 사람
|
ServiceAddressRecipient.text | string | |
|
서비스 주소 받는 사람의 신뢰도
|
ServiceAddressRecipient.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
서비스 종료 날짜(텍스트)
|
ServiceEndDate.text | string |
청구서에 기록된 서비스 종료 날짜를 반환합니다. |
|
서비스 종료 날짜(날짜)
|
ServiceEndDate.valueDate | date |
날짜 형식입니다. 예: 2019-05-31. |
|
서비스 종료 날짜의 신뢰도
|
ServiceEndDate.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
서비스 시작 날짜(텍스트)
|
ServiceStartDate.text | string |
청구서에 기록된 대로 서비스 시작 날짜를 반환합니다. |
|
서비스 시작 날짜(날짜)
|
ServiceStartDate.valueDate | date |
날짜 형식입니다. 예: 2019-05-31. |
|
서비스 시작 날짜의 신뢰도
|
ServiceStartDate.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
배송 주소
|
ShippingAddress.text | string | |
|
배송 주소의 신뢰도
|
ShippingAddress.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
배송 주소 받는 사람
|
ShippingAddressRecipient.text | string | |
|
배송 주소 받는 사람의 신뢰도
|
ShippingAddressRecipient.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
부분합(텍스트)
|
SubTotal.text | string |
청구서에 기록된 부분합을 반환합니다. |
|
부분합(숫자)
|
SubTotal.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 1234.98. |
|
부분합의 신뢰도
|
SubTotal.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
총 세금(텍스트)
|
TotalTax.text | string |
청구서에 기록된 총 세금을 반환합니다. |
|
총세(숫자)
|
TotalTax.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 1234.98. |
|
총 세금에 대한 신뢰도
|
TotalTax.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
공급업체 주소
|
VendorAddress.text | string | |
|
공급업체 주소의 신뢰도
|
VendorAddress.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
공급업체 주소 받는 사람
|
VendorAddressRecipient.text | string | |
|
공급업체 주소 받는 사람의 신뢰도
|
VendorAddressRecipient.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
공급업체 이름
|
VendorName.text | string | |
|
공급업체 이름의 신뢰도
|
VendorName.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
아이템
|
Items.valueArray | array of object |
품목 배열 |
|
양(텍스트)
|
Items.valueArray.valueObject.Amount.text | string |
청구서에 기록된 금액을 반환합니다. |
|
금액(숫자)
|
Items.valueArray.valueObject.Amount.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 12. |
|
금액의 신뢰도
|
Items.valueArray.valueObject.Amount.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
Description
|
Items.valueArray.valueObject.Description.text | string | |
|
설명 신뢰도
|
Items.valueArray.valueObject.Description.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
수량(텍스트)
|
Items.valueArray.valueObject.Quantity.text | string |
청구서에 기록된 수량을 반환합니다. |
|
수량(숫자)
|
Items.valueArray.valueObject.Quantity.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 12. |
|
수량 신뢰도
|
Items.valueArray.valueObject.Quantity.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
단가(텍스트)
|
Items.valueArray.valueObject.UnitPrice.text | string |
청구서에 기록된 단가를 반환합니다. |
|
단가(숫자)
|
Items.valueArray.valueObject.UnitPrice.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 12. |
|
단가 신뢰도
|
Items.valueArray.valueObject.UnitPrice.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
제품 코드
|
Items.valueArray.valueObject.ProductCode.text | string | |
|
제품 코드의 신뢰도
|
Items.valueArray.valueObject.ProductCode.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
단위
|
Items.valueArray.valueObject.Unit.text | string | |
|
단위 신뢰도
|
Items.valueArray.valueObject.Unit.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
날짜(텍스트)
|
Items.valueArray.valueObject.Date.text | string |
청구서에 기록된 날짜를 반환합니다. |
|
날짜(날짜)
|
Items.valueArray.valueObject.Date.valueDate | date |
날짜 형식입니다. 예: 2019-05-31. |
|
날짜 신뢰도
|
Items.valueArray.valueObject.Date.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
세금(텍스트)
|
Items.valueArray.valueObject.Tax.text | string |
청구서에 기록된 대로 세금을 반환합니다. |
|
세금(숫자)
|
Items.valueArray.valueObject.Tax.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 12. |
|
세금의 신뢰도
|
Items.valueArray.valueObject.Tax.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
BusinessCardFields
2.1에 대한 BusinessCard 필드입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
연락처 이름
|
ContactNames.valueArray | array of object |
연락처 이름 배열 |
|
이름 (이름의 첫 부분)
|
ContactNames.valueArray.valueObject.FirstName.text | string | |
|
이름 신뢰도
|
ContactNames.valueArray.valueObject.FirstName.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
성(姓)
|
ContactNames.valueArray.valueObject.LastName.text | string | |
|
성의 신뢰도
|
ContactNames.valueArray.valueObject.LastName.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
회사 이름
|
CompanyNames.valueArray | array of object |
회사 이름 배열 |
|
회사 이름
|
CompanyNames.valueArray.text | string | |
|
회사 이름 신뢰도
|
CompanyNames.valueArray.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
Departments
|
Departments.valueArray | array of object |
부서 배열 |
|
부서
|
Departments.valueArray.text | string | |
|
부서의 신뢰도
|
Departments.valueArray.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
직할 제목
|
JobTitles.valueArray | array of object |
직할 제목 배열 |
|
직함
|
JobTitles.valueArray.text | string | |
|
직할 타이틀의 신뢰도
|
JobTitles.valueArray.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
전자 메일
|
Emails.valueArray | array of object |
전자 메일 배열 |
|
전자 메일
|
Emails.valueArray.text | string | |
|
전자 메일 신뢰도
|
Emails.valueArray.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
웹 사이트
|
Websites.valueArray | array of object |
웹 사이트 배열 |
|
웹 사이트
|
Websites.valueArray.text | string | |
|
웹 사이트의 신뢰도
|
Websites.valueArray.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
Addresses
|
Addresses.valueArray | array of object |
주소 배열 |
|
Address
|
Addresses.valueArray.text | string | |
|
주소 신뢰도
|
Addresses.valueArray.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
휴대폰
|
MobilePhones.valueArray | array of object |
휴대폰 배열 |
|
휴대폰
|
MobilePhones.valueArray.text | string | |
|
휴대폰 신뢰도
|
MobilePhones.valueArray.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
팩스
|
Faxes.valueArray | array of object |
팩스 배열 |
|
팩스
|
Faxes.valueArray.text | string | |
|
팩스 신뢰도
|
Faxes.valueArray.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
회사 전화
|
WorkPhones.valueArray | array of object |
회사 전화 배열 |
|
회사 전화
|
WorkPhones.valueArray.text | string | |
|
회사 전화의 신뢰도
|
WorkPhones.valueArray.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
기타 휴대폰
|
OtherPhones.valueArray | array of object |
다른 휴대폰의 배열 |
|
기타 휴대폰
|
OtherPhones.valueArray.text | string | |
|
다른 휴대폰의 신뢰도
|
OtherPhones.valueArray.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
ReceiptFields
2.1에 대한 영수증 필드.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
영수증 유형
|
ReceiptType.text | string | |
|
영수증 유형의 신뢰도
|
ReceiptType.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
가맹점 이름
|
MerchantName.text | string | |
|
가맹점 이름 신뢰도
|
MerchantName.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
가맹점 전화 번호
|
MerchantPhoneNumber.text | string | |
|
가맹점 전화 번호의 신뢰도
|
MerchantPhoneNumber.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
가맹점 주소
|
MerchantAddress.text | string | |
|
가맹점 주소의 신뢰도
|
MerchantAddress.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
트랜잭션 날짜(텍스트)
|
TransactionDate.text | string |
청구서에 기록된 대로 트랜잭션 날짜를 반환합니다. |
|
트랜잭션 날짜(날짜)
|
TransactionDate.valueDate | date |
날짜 형식입니다. 예: 2019-05-31. |
|
트랜잭션 날짜의 신뢰도
|
TransactionDate.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
트랜잭션 시간(텍스트)
|
TransactionTime.text | string |
청구서에 기록된 트랜잭션 시간을 반환합니다. |
|
트랜잭션 시간(시간)
|
TransactionTime.valueDate | time |
날짜 형식입니다. 예: 2019-05-31. |
|
트랜잭션 시간의 신뢰도
|
TransactionTime.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
합계(텍스트)
|
Total.text | string |
청구서에 기록된 합계를 반환합니다. |
|
합계(숫자)
|
Total.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 1234.98. |
|
총 신뢰도
|
Total.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
부분합(텍스트)
|
Subtotal.text | string |
청구서에 기록된 부분합을 반환합니다. |
|
부분합(숫자)
|
Subtotal.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 1234.98. |
|
부분합의 신뢰도
|
Subtotal.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
세금(텍스트)
|
Tax.text | string |
청구서에 기록된 대로 세금을 반환합니다. |
|
세금(숫자)
|
Tax.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 1234.98. |
|
세금의 신뢰도
|
Tax.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
팁(텍스트)
|
Tip.text | string |
청구서에 기록된 팁을 반환합니다. |
|
팁(숫자)
|
Tip.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 1234.98. |
|
팁의 신뢰도
|
Tip.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
아이템
|
Items.valueArray | array of object |
품목 배열 |
|
이름
|
Items.valueArray.valueObject.Name.text | string | |
|
이름의 신뢰도
|
Items.valueArray.valueObject.Name.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
수량(텍스트)
|
Items.valueArray.valueObject.Quantity.text | string |
청구서에 기록된 수량을 반환합니다. |
|
수량(숫자)
|
Items.valueArray.valueObject.Quantity.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 12. |
|
수량 신뢰도
|
Items.valueArray.valueObject.Quantity.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
가격(텍스트)
|
Items.valueArray.valueObject.Price.text | string |
청구서에 기록된 가격을 반환합니다. |
|
가격(숫자)
|
Items.valueArray.valueObject.Price.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 12. |
|
가격 신뢰도
|
Items.valueArray.valueObject.Price.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
총 가격(텍스트)
|
Items.valueArray.valueObject.TotalPrice.text | string |
청구서에 기록된 총 가격을 반환합니다. |
|
총 가격(숫자)
|
Items.valueArray.valueObject.TotalPrice.valueNumber | number |
숫자로 서식이 지정됩니다. 예: 12. |
|
총 가격의 신뢰도
|
Items.valueArray.valueObject.TotalPrice.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
IdFields
2.1의 ID 문서 필드입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
국가 지역
|
CountryRegion.valueCountryRegion | string | |
|
국가 지역의 신뢰도
|
CountryRegion.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
만료 날짜
|
DateOfExpiration.text | string |
청구서에 기록된 만료 날짜를 반환합니다. |
|
만료 날짜(날짜)
|
DateOfExpiration.valueDate | date |
날짜 형식입니다. 예: 2019-05-31. |
|
만료 날짜의 신뢰도
|
DateOfExpiration.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
생년월일(텍스트)
|
DateOfBirth.text | string |
청구서에 기록된 생년월일을 반환합니다. |
|
생년월일(날짜)
|
DateOfBirth.valueDate | date |
날짜 형식입니다. 예: 2019-05-31. |
|
생년월일의 신뢰도
|
DateOfBirth.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
문서 번호
|
DocumentNumber.text | string | |
|
문서 번호의 신뢰도
|
DocumentNumber.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
이름 (이름의 첫 부분)
|
FirstName.text | string | |
|
이름 신뢰도
|
FirstName.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
성(姓)
|
LastName.text | string | |
|
성의 신뢰도
|
LastName.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
Nationality
|
Nationality.valueCountryRegion | string | |
|
국적의 신뢰도
|
Nationality.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
Sex
|
Sex.text | string | |
|
섹스의 자신감
|
Sex.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
컴퓨터 읽기 가능 영역
|
MachineReadableZone.text | string | |
|
머신 읽기 가능 영역의 신뢰도
|
MachineReadableZone.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
문서 유형
|
DocumentType.text | string | |
|
문서 형식의 신뢰도
|
DocumentType.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
Address
|
Address.text | string | |
|
주소 신뢰도
|
Address.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
|
지역
|
Region.text | string | |
|
지역의 신뢰도
|
Region.confidence | float |
모델이 예측에 얼마나 자신감을 갖고 있는지. |
FieldValue
예측된 필드 값 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
type
|
type | FieldValueType |
필드 값의 의미 체계 데이터 형식입니다. |
|
valueString
|
valueString | string |
문자열 값입니다. |
|
valueDate
|
valueDate | date-time |
날짜 값입니다. |
|
valueTime
|
valueTime | date-time |
시간 값입니다. |
|
valuePhoneNumber
|
valuePhoneNumber | string |
전화 번호 값입니다. |
|
valueNumber
|
valueNumber | number |
부동 소수점 값입니다. |
|
valueInteger
|
valueInteger | integer |
정수 값입니다. |
|
문자 메시지
|
text | string | |
|
boundingBox
|
boundingBox | BoundingBox |
원본 이미지의 왼쪽 상단을 기준으로 지정된 좌표가 있는 사분면 경계 상자입니다. 8개의 숫자는 텍스트 방향을 기준으로 왼쪽 위 모서리에서 시계 방향으로 네 점을 나타냅니다. 이미지의 경우 (x, y) 좌표는 픽셀 단위로 측정됩니다. PDF의 경우 (x, y) 좌표는 인치 단위로 측정됩니다. |
|
자신
|
confidence | Confidence |
신뢰도 값입니다. |
|
요소
|
elements | array of ElementReference |
includeTextDetails가 true로 설정된 경우 이 필드를 구성하는 텍스트 요소에 대한 참조 목록입니다. |
|
page
|
page | integer |
입력 문서의 1부터 시작하는 페이지 번호입니다. |
FieldValueType
신뢰
ApiVersion_V30
AnalyzeResultOperation_V30
분석 작업의 상태 및 결과입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
status
|
status | string |
작업 상태입니다. |
|
생성된날짜시간
|
createdDateTime | date-time |
분석 작업이 제출된 날짜 및 시간(UTC)입니다. |
|
lastUpdatedDateTime
|
lastUpdatedDateTime | date-time |
상태가 마지막으로 업데이트된 날짜 및 시간(UTC)입니다. |
|
오류
|
error | Error_V30 |
오류 정보입니다. |
|
analyzeResult
|
analyzeResult | AnalyzeResult_V30 |
문서 분석 결과입니다. |
AnalyzeResult_V30
문서 분석 결과입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
API버전
|
apiVersion | ApiVersion_V30 |
API 버전. |
|
modelId
|
modelId | ModelId_V30 |
고유 모델 이름입니다. |
|
stringIndexType
|
stringIndexType | StringIndexType_V30 |
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다. |
|
내용
|
content | string |
모든 텍스트 및 시각적 요소의 문자열 표현을 읽기 순서로 연결합니다. |
|
콘텐츠 형식
|
contentFormat | ContentFormat_V40 |
분석된 결과의 콘텐츠 형식입니다. |
|
pages
|
pages | array of DocumentPage_V30 |
분석된 페이지. |
|
단락
|
paragraphs | array of DocumentParagraph_V30 |
추출된 단락입니다. |
|
tables
|
tables | array of DocumentTable_V30 |
추출된 테이블입니다. |
|
수치
|
figures | array of DocumentFigure_V40 |
추출된 수치입니다. |
|
섹션
|
sections | array of DocumentSection_V40 |
추출된 섹션입니다. |
|
키값쌍
|
keyValuePairs | array of DocumentKeyValuePair_V30 |
추출된 키-값 쌍입니다. |
|
entities
|
entities | array of DocumentEntity_V30 |
추출된 엔터티입니다. |
|
스타일
|
styles | array of DocumentStyle_V30 |
추출된 글꼴 스타일입니다. |
|
언어들
|
languages | array of DocumentLanguage_V30 |
검색된 언어입니다. |
|
문서
|
documents | array of Document_V30 |
추출된 문서입니다. |
|
경고
|
warnings | array of Warning_V40 |
발생한 경고 목록입니다. |
DocumentPage_V30
입력에서 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
친절한
|
kind | string |
문서 페이지의 종류입니다. |
|
pageNumber
|
pageNumber | integer |
입력 문서의 1부터 시작하는 페이지 번호입니다. |
|
각
|
angle | number |
(-180, 180] 사이의 각도로 측정된 시계 방향으로 콘텐츠의 일반 방향입니다. |
|
width
|
width | number |
이미지/PDF의 너비(각각 픽셀/인치)입니다. |
|
height
|
height | number |
이미지/PDF의 높이(각각 픽셀/인치)입니다. |
|
단위
|
unit | string |
너비, 높이 및 다각형 속성에 사용되는 단위입니다. 이미지의 경우 단위는 "픽셀"입니다. PDF의 경우 단위는 "인치"입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서로 연결된 콘텐츠의 페이지 위치입니다. |
|
words
|
words | array of DocumentWord_V30 |
페이지에서 추출된 단어입니다. |
|
selectionMarks
|
selectionMarks | array of DocumentSelectionMark_V30 |
페이지에서 선택 표시를 추출했습니다. |
|
images
|
images | array of DocumentImage_V30 |
페이지에서 추출된 이미지입니다. |
|
라인
|
lines | array of DocumentLine_V30 |
페이지에서 추출된 줄로, 텍스트 요소와 시각적 요소가 모두 포함될 수 있습니다. |
|
barcodes
|
barcodes | array of DocumentBarcode_V31 |
페이지에서 추출된 바코드입니다. |
|
formulas
|
formulas | array of DocumentFormula_V31 |
페이지에서 추출된 수식입니다. |
DocumentWord_V30
연속된 문자 시퀀스로 구성된 단어 개체입니다. 중국어, 일본어 및 한국어와 같이 공백으로 구분되지 않은 언어의 경우 각 문자가 자체 단어로 표시됩니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
내용
|
content | string |
단어의 텍스트 내용입니다. |
|
polygon
|
polygon | BoundingPolygon_V30 |
페이지의 왼쪽 위를 기준으로 좌표가 지정된 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
|
span
|
span | DocumentSpan_V30 |
오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다. |
|
자신
|
confidence | Confidence_V30 |
예측 신뢰도. |
DocumentSelectionMark_V30
선택 영역을 나타내는 확인란, 라디오 단추 및 기타 요소를 나타내는 선택 표시 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
주
|
state | DocumentSelectionMarkState_V30 |
선택 표시의 상태입니다. |
|
polygon
|
polygon | BoundingPolygon_V30 |
페이지의 왼쪽 위를 기준으로 좌표가 지정된 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
|
span
|
span | DocumentSpan_V30 |
오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다. |
|
자신
|
confidence | Confidence_V30 |
예측 신뢰도. |
DocumentImage_V30
페이지에서 검색된 이미지 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
polygon
|
polygon | BoundingPolygon_V30 |
페이지의 왼쪽 위를 기준으로 좌표가 지정된 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
|
span
|
span | DocumentSpan_V30 |
오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다. |
|
pageRef
|
pageRef | integer |
이미지의 콘텐츠를 포함하는 전역 페이지 배열의 0부터 시작하는 인덱스입니다. |
|
자신
|
confidence | Confidence_V30 |
예측 신뢰도. |
DocumentSelectionMarkState_V30
DocumentStyle_V30
관찰된 텍스트 스타일을 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
backgroundColor
|
backgroundColor | string |
#rrggbb 16진수 형식의 배경색입니다. |
|
color
|
color | string |
#rrggbb 16진수 형식의 전경색입니다. |
|
fontStyle
|
fontStyle | string |
글꼴 스타일입니다. |
|
fontWeight
|
fontWeight | string |
글꼴 두께입니다. |
|
isHandwritten
|
isHandwritten | boolean |
콘텐츠 필기입니다. |
|
similarFontFamily
|
similarFontFamily | string |
CSS 규칙(예: 'Arial, sans-serif')에 따라 대체 글꼴이 있는 지원되는 글꼴 패밀리 집합 중에서 시각적으로 가장 유사한 글꼴입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
스타일이 적용되는 연결된 콘텐츠의 텍스트 요소 위치입니다. |
|
자신
|
confidence | Confidence_V30 |
예측 신뢰도. |
DocumentLanguage_V30
지정된 텍스트 범위에 대해 검색된 언어를 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
지역 설정
|
locale | string |
검색된 언어입니다. 값은 ISO 639-1 언어 코드(예: "en", "fr") 또는 BCP 47 언어 태그(예: "zh-Hans")일 수 있습니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
언어가 적용되는 연결된 콘텐츠의 텍스트 요소 위치입니다. |
|
자신
|
confidence | Confidence_V30 |
예측 신뢰도. |
DocumentLine_V30
단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
내용
|
content | string |
포함된 요소의 연결된 콘텐츠를 읽기 순서로 연결합니다. |
|
polygon
|
polygon | BoundingPolygon_V30 |
페이지의 왼쪽 위를 기준으로 좌표가 지정된 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서로 연결된 콘텐츠의 줄 위치입니다. |
DocumentParagraph_V30
일반적으로 공통 맞춤 및 간격이 있는 연속선으로 구성된 단락 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
역할
|
role | string |
단락의 의미 체계 역할입니다. |
|
내용
|
content | string |
단락의 콘텐츠를 읽기 순서로 연결합니다. |
|
boundingRegions
|
boundingRegions | array of BoundingRegion_V30 |
단락을 포함하는 경계 영역입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서로 연결된 콘텐츠의 단락 위치입니다. |
DocumentTable_V30
사각형 레이아웃으로 정렬된 표 셀로 구성된 테이블 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
rowCount
|
rowCount | integer |
테이블의 행 수입니다. |
|
columnCount
|
columnCount | integer |
테이블의 열 수입니다. |
|
셀
|
cells | array of DocumentTableCell_V30 |
표에 포함된 셀입니다. |
|
캡션
|
caption | DocumentCaption_V30 |
테이블 캡션의 위치와 내용을 나타내는 개체입니다. |
|
각주
|
footnotes | array of DocumentFootnote_V30 |
표와 연결된 각주입니다. |
|
boundingRegions
|
boundingRegions | array of BoundingRegion_V30 |
테이블을 포함하는 경계 영역입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서로 연결된 콘텐츠의 테이블 위치입니다. |
DocumentTableCell_V30
표 셀의 위치와 내용을 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
친절한
|
kind | string |
표 셀 종류입니다. |
|
rowIndex
|
rowIndex | integer |
셀의 행 인덱스입니다. |
|
columnIndex
|
columnIndex | integer |
셀의 열 인덱스입니다. |
|
행 스팬
|
rowSpan | integer |
이 셀에 걸쳐 있는 행 수입니다. |
|
columnSpan
|
columnSpan | integer |
이 셀에 걸쳐 있는 열 수입니다. |
|
내용
|
content | string |
테이블 셀의 연결된 내용을 읽기 순서로 연결합니다. |
|
boundingRegions
|
boundingRegions | array of BoundingRegion_V30 |
표 셀을 포함하는 경계 영역입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서로 연결된 내용의 표 셀 위치입니다. |
DocumentCaption_V30
테이블 캡션의 위치와 내용을 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
내용
|
content | string |
테이블 캡션 콘텐츠입니다. |
|
boundingRegions
|
boundingRegions | array of BoundingRegion_V30 |
테이블 캡션을 포함하는 경계 영역입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서로 연결된 콘텐츠의 테이블 캡션 위치입니다. |
DocumentFootnote_V30
표 각주 위치와 내용을 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
내용
|
content | string |
표 각주 내용입니다. |
|
boundingRegions
|
boundingRegions | array of BoundingRegion_V30 |
표 각주를 포함하는 경계 영역입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서로 연결된 콘텐츠의 표 각주 위치입니다. |
DocumentKeyValuePair_V30
고유 필드 레이블(키) 및 필드 값(비어 있을 수 있음)이 있는 양식 필드를 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
key
|
key | DocumentKeyValueElement_V30 |
키-값 쌍의 필드 키 또는 값을 나타내는 개체입니다. |
|
value
|
value | DocumentKeyValueElement_V30 |
키-값 쌍의 필드 키 또는 값을 나타내는 개체입니다. |
|
자신
|
confidence | Confidence_V30 |
예측 신뢰도. |
DocumentKeyValueElement_V30
키-값 쌍의 필드 키 또는 값을 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
내용
|
content | string |
키-값 요소의 연결된 콘텐츠를 읽기 순서로 연결합니다. |
|
boundingRegions
|
boundingRegions | array of BoundingRegion_V30 |
키-값 요소를 포함하는 경계 영역입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서에 연결된 콘텐츠의 키-값 요소 위치입니다. |
DocumentEntity_V30
다양한 엔터티 범주를 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
카테고리
|
category | string |
개체 유형입니다. |
|
하위 범주
|
subCategory | string |
엔터티 하위 형식입니다. |
|
내용
|
content | string |
엔터티 콘텐츠입니다. |
|
boundingRegions
|
boundingRegions | array of BoundingRegion_V30 |
엔터티를 포함하는 경계 지역입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서로 연결된 콘텐츠의 엔터티 위치입니다. |
|
자신
|
confidence | Confidence_V30 |
예측 신뢰도. |
DocumentBarcode_V31
바코드 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
자신
|
confidence | Confidence_V30 |
예측 신뢰도. |
|
친절한
|
kind | string |
바코드 종류입니다. |
|
polygon
|
polygon | BoundingPolygon_V30 |
페이지의 왼쪽 위를 기준으로 좌표가 지정된 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
|
span
|
span | DocumentSpan_V30 |
오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다. |
|
value
|
value | string |
바코드 값 |
DocumentFormula_V31
수식 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
자신
|
confidence | Confidence_V30 |
예측 신뢰도. |
|
친절한
|
kind | string |
수식 종류입니다. |
|
polygon
|
polygon | BoundingPolygon_V30 |
페이지의 왼쪽 위를 기준으로 좌표가 지정된 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
|
span
|
span | DocumentSpan_V30 |
오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다. |
|
value
|
value | string |
수식을 설명하는 LaTex 식입니다. |
DocumentFigure_V40
문서의 그림을 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
boundingRegions
|
boundingRegions | array of BoundingRegion_V30 |
그림을 포함하는 경계 영역입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서로 연결된 콘텐츠의 그림 위치입니다. |
|
요소
|
elements | array of DocumentElement_V40 |
캡션 또는 각주를 제외한 그림의 자식 요소입니다. |
|
캡션
|
caption | DocumentCaption_V30 |
테이블 캡션의 위치와 내용을 나타내는 개체입니다. |
|
각주
|
footnotes | array of DocumentFootnote_V30 |
그림과 연결된 각주 목록입니다. |
|
아이디
|
id | string |
그림 ID입니다. |
DocumentSection_V40
문서의 섹션을 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서로 연결된 콘텐츠의 섹션 위치입니다. |
|
요소
|
elements | array of DocumentElement_V40 |
섹션의 자식 요소입니다. |
DocumentElement_V40
Warning_V40
오류 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
코드
|
code | string |
서버에서 정의한 경고 코드 집합 중 하나입니다. |
|
message
|
message | string |
사람이 읽을 수 있는 경고 표현입니다. |
|
target
|
target | string |
오류의 대상입니다. |
ContentFormat_V40
Document_V30
문서의 위치 및 의미 체계 콘텐츠를 설명하는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
docType
|
docType | DocType_V30 |
문서 형식 이름입니다. |
|
boundingRegions
|
boundingRegions | array of BoundingRegion_V30 |
문서를 다루는 경계 영역입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
문서 위치(읽기 순서가 연결된 콘텐츠)입니다. |
|
fields
|
fields | object |
명명된 필드 값의 사전입니다. |
|
Fields
|
_fields | array of DocumentFieldNameValue_V30 |
fieldName 및 fieldValue 속성이 있는 필드의 배열입니다. |
|
자신
|
confidence | Confidence_V30 |
예측 신뢰도. |
BoundingPolygon_V30
페이지의 왼쪽 위를 기준으로 좌표가 지정된 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
아이템
|
number |
BoundingRegion_V30
입력의 특정 페이지에서 다각형 경계
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
pageNumber
|
pageNumber | integer |
경계 영역을 포함하는 페이지의 1부터 시작하는 페이지 번호입니다. |
|
polygon
|
polygon | BoundingPolygon_V30 |
페이지의 왼쪽 위를 기준으로 좌표가 지정된 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
DocumentFieldType_V30
DocumentFieldNameValue_V30
필드 이름과 해당 값을 가진 문서 필드 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
필드 이름
|
fieldName | string | |
|
fieldValue
|
fieldValue | DocumentField_V30 |
필드 값의 내용과 위치를 나타내는 개체입니다. |
DocumentField_V30
필드 값의 내용과 위치를 나타내는 개체입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
type
|
type | DocumentFieldType_V30 |
필드 값의 의미 체계 데이터 형식입니다. |
|
valueString
|
valueString | string |
문자열 값입니다. |
|
valueDate
|
valueDate | date |
YYYY-MM-DD 형식(ISO 8601)의 날짜 값입니다. |
|
valueTime
|
valueTime | time |
hh:mm:ss 형식의 시간 값(ISO 8601)입니다. |
|
valuePhoneNumber
|
valuePhoneNumber | string |
E.164 형식(예: +19876543210)의 전화 번호 값입니다. |
|
valueNumber
|
valueNumber | number |
부동 소수점 값입니다. |
|
valueInteger
|
valueInteger | integer |
정수 값입니다. |
|
valueSelectionMark
|
valueSelectionMark | DocumentSelectionMarkState_V30 |
선택 표시의 상태입니다. |
|
valueSignature
|
valueSignature | string |
서명의 존재. |
|
valueCountryRegion
|
valueCountryRegion | string |
3자 국가 코드 값(ISO 3166-1 alpha-3). |
|
valueCurrency
|
valueCurrency | CurrencyValue_V30 |
통화 필드 값입니다. |
|
valueAddress
|
valueAddress | AddressValue_V30 |
주소 필드 값입니다. |
|
valueBoolean
|
valueBoolean | boolean |
부울 값입니다. |
|
내용
|
content | string |
필드 콘텐츠입니다. |
|
boundingRegions
|
boundingRegions | array of BoundingRegion_V30 |
필드를 포함하는 경계 영역입니다. |
|
spans
|
spans | array of DocumentSpan_V30 |
읽기 순서로 연결된 콘텐츠의 필드 위치입니다. |
|
자신
|
confidence | Confidence_V30 |
예측 신뢰도. |
Confidence_V30
DocType_V30
DocumentSpan_V30
오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
offset
|
offset | integer |
범위가 나타내는 콘텐츠의 인덱스(0부터 시작하는 인덱스)입니다. |
|
length
|
length | integer |
범위가 나타내는 콘텐츠의 문자 수입니다. |
StringIndexType_V30
ModelId_V30
Error_V30
오류 정보입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
코드
|
code | string |
오류 코드입니다. |
|
message
|
message | string |
오류 메시지입니다. |
|
target
|
target | string |
오류의 대상입니다. |
|
details
|
details | array of InnerError_V30 |
자세한 오류 목록입니다. |
|
innererror
|
innererror | InnerError_V30 |
자세한 오류입니다. |
InnerError_V30
자세한 오류입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
코드
|
code | string |
오류 코드입니다. |
|
message
|
message | string |
오류 메시지입니다. |
CurrencyValue_V30
통화 필드 값입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
분량
|
amount | double |
통화 금액입니다. |
|
통화 코드
|
currencyCode | string |
확인된 통화 코드(ISO 4217)(있는 경우)입니다. |
|
currencySymbol
|
currencySymbol | string |
통화 기호 레이블(있는 경우)입니다. |
AddressValue_V30
주소 필드 값입니다.
| Name | 경로 | 형식 | Description |
|---|---|---|---|
|
houseNumber
|
houseNumber | string |
집 또는 건물 번호입니다. |
|
poBox
|
poBox | string |
우체국 박스 번호입니다. |
|
도로
|
road | string |
거리 이름입니다. |
|
city
|
city | string |
도시, 마을, 마을 등의 이름입니다. |
|
주
|
state | string |
1단계 관리 부서입니다. |
|
postalCode
|
postalCode | string |
메일 정렬에 사용되는 우편 번호입니다. |
|
countryRegion
|
countryRegion | string |
국가 또는 지역. |
|
도로 주소
|
streetAddress | string |
도시, 주, countryRegion 및 postalCode를 제외한 거리 수준 주소입니다. |
|
cityDistrict
|
cityDistrict | string |
뉴욕시의 브루클린이나 런던의 웨스트민스터 시와 같은 도시 내의 구역 또는 자치구. |
|
집
|
house | string |
세계 무역 센터와 같은 빌드 이름입니다. |
|
수준
|
level | string |
바닥 번호(예: 3F). |
|
stateDistrict
|
stateDistrict | string |
특정 로캘에서 사용되는 2단계 관리 부서입니다. |
|
교외
|
suburb | string |
차이나타운과 같은 비공식 동네 이름입니다. |
|
단위
|
unit | string |
아파트 또는 사무실 번호입니다. |