Document Classifiers - Get Classify Result
문서 분류자의 결과를 가져옵니다.
GET {endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-07-31-preview
URI 매개 변수
Name | In(다음 안에) | 필수 | 형식 | Description |
---|---|---|---|---|
classifier
|
path | True |
string |
고유한 문서 분류자 이름입니다. regex 패턴: |
endpoint
|
path | True |
string uri |
문서 인텔리전스 서비스 엔드포인트입니다. |
result
|
path | True |
string uuid |
작업 결과 ID를 분석합니다. |
api-version
|
query | True |
string |
이 작업에 사용할 API 버전입니다. |
응답
Name | 형식 | Description |
---|---|---|
200 OK |
요청이 성공했습니다. |
|
Other Status Codes |
예기치 않은 오류 응답입니다. |
보안
Ocp-Apim-Subscription-Key
형식:
apiKey
In(다음 안에):
header
OAuth2Auth
형식:
oauth2
Flow:
accessCode
권한 부여 URL:
https://login.microsoftonline.com/common/oauth2/authorize
토큰 URL:
https://login.microsoftonline.com/common/oauth2/token
범위
Name | Description |
---|---|
https://cognitiveservices.azure.com/.default |
예제
Get Classify Document Result
샘플 요청
GET https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/myClassifier/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-07-31-preview
샘플 응답
{
"status": "succeeded",
"createdDateTime": "2021-09-24T13:00:46Z",
"lastUpdatedDateTime": "2021-09-24T13:00:49Z",
"analyzeResult": {
"apiVersion": "2024-07-31-preview",
"modelId": "myClassifier",
"stringIndexType": "textElements",
"contentFormat": "text",
"content": "",
"pages": [
{
"pageNumber": 1,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 2,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 3,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
}
],
"documents": [
{
"docType": "formA",
"boundingRegions": [
{
"pageNumber": 1,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
},
{
"pageNumber": 2,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
},
{
"docType": "formB",
"boundingRegions": [
{
"pageNumber": 3,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
}
]
}
}
정의
Name | Description |
---|---|
Address |
주소 필드 값입니다. |
Analyze |
문서 분석 결과입니다. |
Analyze |
분석 작업의 상태 및 결과입니다. |
Bounding |
입력의 특정 페이지에서 다각형 경계 |
Content |
분석된 결과의 콘텐츠 형식입니다. |
Currency |
통화 필드 값입니다. |
Document |
문서의 위치 및 의미 체계 콘텐츠를 설명하는 개체입니다. |
Document |
바코드 개체입니다. |
Document |
바코드 종류입니다. |
Document |
테이블 또는 그림을 설명하는 캡션 개체입니다. |
Document |
필드 값의 내용과 위치를 나타내는 개체입니다. |
Document |
필드 값의 의미 체계 데이터 형식입니다. |
Document |
문서의 그림을 나타내는 개체입니다. |
Document |
표 또는 그림을 설명하는 각주 개체입니다. |
Document |
수식 개체입니다. |
Document |
수식 종류입니다. |
Document |
키-값 쌍의 필드 키 또는 값을 나타내는 개체입니다. |
Document |
고유 필드 레이블(키) 및 필드 값(비어 있을 수 있음)이 있는 양식 필드를 나타내는 개체입니다. |
Document |
지정된 텍스트 범위에 대해 검색된 언어를 나타내는 개체입니다. |
Document |
단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다. |
Document |
입력에서 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다. |
Document |
일반적으로 공통 맞춤 및 간격이 있는 연속선으로 구성된 단락 개체입니다. |
Document |
문서의 섹션을 나타내는 개체입니다. |
Document |
선택 영역을 나타내는 확인란, 라디오 단추 및 기타 요소를 나타내는 선택 표시 개체입니다. |
Document |
선택 표시의 상태입니다. |
Document |
서명의 존재. |
Document |
오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다. |
Document |
관찰된 텍스트 스타일을 나타내는 개체입니다. |
Document |
사각형 레이아웃으로 정렬된 표 셀로 구성된 테이블 개체입니다. |
Document |
표 셀의 위치와 내용을 나타내는 개체입니다. |
Document |
표 셀 종류입니다. |
Document |
연속된 문자 시퀀스로 구성된 단어 개체입니다. 중국어, 일본어 및 한국어와 같이 공백으로 구분되지 않은 언어의 경우 각 문자가 자체 단어로 표시됩니다. |
Error |
오류 개체입니다. |
Error |
오류 응답 개체입니다. |
Font |
글꼴 스타일입니다. |
Font |
글꼴 두께입니다. |
Inner |
오류에 대한 보다 구체적인 정보를 포함하는 개체입니다. |
Length |
너비, 높이 및 다각형 속성에 사용되는 단위입니다. 이미지의 경우 단위는 "픽셀"입니다. PDF의 경우 단위는 "인치"입니다. |
Operation |
작업 상태입니다. |
Paragraph |
단락의 의미 체계 역할입니다. |
String |
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다. |
Warning |
오류 개체입니다. |
AddressValue
주소 필드 값입니다.
Name | 형식 | Description |
---|---|---|
city |
string |
도시, 마을, 마을 등의 이름입니다. |
cityDistrict |
string |
뉴욕시의 브루클린이나 런던의 웨스트민스터 시와 같은 도시 내의 구역 또는 자치구. |
countryRegion |
string |
국가/지역. |
house |
string |
세계 무역 센터와 같은 빌드 이름입니다. |
houseNumber |
string |
집 또는 건물 번호입니다. |
level |
string |
바닥 번호(예: 3F). |
poBox |
string |
우체국 박스 번호입니다. |
postalCode |
string |
메일 정렬에 사용되는 우편 번호입니다. |
road |
string |
거리 이름입니다. |
state |
string |
1단계 관리 부서입니다. |
stateDistrict |
string |
특정 로캘에서 사용되는 2단계 관리 부서입니다. |
streetAddress |
string |
도시, 주, countryRegion 및 postalCode를 제외한 거리 수준 주소입니다. |
suburb |
string |
차이나타운과 같은 비공식 동네 이름입니다. |
unit |
string |
아파트 또는 사무실 번호 |
AnalyzeResult
문서 분석 결과입니다.
Name | 형식 | Description |
---|---|---|
apiVersion |
string |
이 결과를 생성하는 데 사용되는 API 버전입니다. |
content |
string |
모든 텍스트 및 시각적 요소의 문자열 표현을 읽기 순서로 연결합니다. |
contentFormat |
분석 결과 최상위 콘텐츠의 형식입니다. |
|
documents |
Document[] |
추출된 문서입니다. |
figures |
추출된 수치입니다. |
|
keyValuePairs |
추출된 키-값 쌍입니다. |
|
languages |
검색된 언어입니다. |
|
modelId |
string |
이 결과를 생성하는 데 사용되는 문서 모델 ID입니다. |
pages |
분석된 페이지. |
|
paragraphs |
추출된 단락입니다. |
|
sections |
추출된 섹션입니다. |
|
stringIndexType |
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다. |
|
styles |
추출된 글꼴 스타일입니다. |
|
tables |
추출된 테이블입니다. |
|
warnings |
Warning[] |
발생한 경고 목록입니다. |
AnalyzeResultOperation
분석 작업의 상태 및 결과입니다.
Name | 형식 | Description |
---|---|---|
analyzeResult |
문서 분석 결과입니다. |
|
createdDateTime |
string |
분석 작업이 제출된 날짜 및 시간(UTC)입니다. |
error |
문서 분석 중에 오류가 발생했습니다. |
|
lastUpdatedDateTime |
string |
상태가 마지막으로 업데이트된 날짜 및 시간(UTC)입니다. |
status |
작업 상태입니다. notStarted, running, succeeded 또는 failed |
BoundingRegion
입력의 특정 페이지에서 다각형 경계
Name | 형식 | Description |
---|---|---|
pageNumber |
integer |
경계 영역을 포함하는 페이지의 1부터 시작하는 페이지 번호입니다. |
polygon |
number[] |
페이지의 경계 다각형 또는 지정하지 않은 경우 전체 페이지입니다. 페이지의 왼쪽 위를 기준으로 지정된 좌표입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
ContentFormat
분석된 결과의 콘텐츠 형식입니다.
Name | 형식 | Description |
---|---|---|
markdown |
string |
구역 머리글, 표 등을 사용하여 문서 콘텐츠의 Markdown 표현 |
text |
string |
서식이 없는 문서 내용의 일반 텍스트 표현입니다. |
CurrencyValue
통화 필드 값입니다.
Name | 형식 | Description |
---|---|---|
amount |
number |
통화 금액입니다. |
currencyCode |
string |
확인된 통화 코드(ISO 4217)(있는 경우)입니다. |
currencySymbol |
string |
통화 기호 레이블(있는 경우)입니다. |
Document
문서의 위치 및 의미 체계 콘텐츠를 설명하는 개체입니다.
Name | 형식 | Description |
---|---|---|
boundingRegions |
문서를 다루는 경계 영역입니다. |
|
confidence |
number |
문서를 올바르게 추출할 때의 신뢰도입니다. |
docType |
string |
문서 형식입니다. |
fields |
<string,
Document |
명명된 필드 값의 사전입니다. |
spans |
문서 위치(읽기 순서가 연결된 콘텐츠)입니다. |
DocumentBarcode
바코드 개체입니다.
Name | 형식 | Description |
---|---|---|
confidence |
number |
바코드를 올바르게 추출할 때의 신뢰도입니다. |
kind |
바코드 종류입니다. |
|
polygon |
number[] |
페이지의 왼쪽 위를 기준으로 지정된 좌표를 사용하여 바코드의 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
span |
읽기 순서로 연결된 콘텐츠의 바코드 위치입니다. |
|
value |
string |
바코드 값입니다. |
DocumentBarcodeKind
바코드 종류입니다.
Name | 형식 | Description |
---|---|---|
Aztec |
string |
ISO/IEC 24778:2008에 정의된 Aztec 코드입니다. |
Codabar |
string |
ANSI/AIM BC3-1995에 정의된 코다바 바코드입니다. |
Code128 |
string |
ISO/IEC 15417:2007에 정의된 코드 128 바코드입니다. |
Code39 |
string |
ISO/IEC 16388:2007에 정의된 코드 39 바코드입니다. |
Code93 |
string |
ANSI/AIM BC5-1995에 정의된 코드 93 바코드입니다. |
DataBar |
string |
GS1 DataBar 바코드. |
DataBarExpanded |
string |
GS1 DataBar 확장 바코드. |
DataMatrix |
string |
ISO/IEC 16022:2006에 정의된 데이터 매트릭스 코드입니다. |
EAN13 |
string |
GS1 13자리 국제 문서 번호(유럽 문서 번호). |
EAN8 |
string |
GS1 8자리 국제 문서 번호(유럽 문서 번호). |
ITF |
string |
ANSI/AIM BC2-1995에 정의된 대로 5개의 바코드 중 2개 인터리브되었습니다. |
MaxiCode |
string |
MAXiCode( ISO/IEC 16023:2000에 정의된 대로). |
MicroQRCode |
string |
ISO/IEC 23941:2022에 정의된 마이크로 QR 코드입니다. |
PDF417 |
string |
ISO 15438에 정의된 PDF417 |
QRCode |
string |
ISO/IEC 18004:2015에 정의된 QR 코드입니다. |
UPCA |
string |
GS1 12자리 유니버설 제품 코드. |
UPCE |
string |
GS1 6자리 유니버설 제품 코드. |
DocumentCaption
테이블 또는 그림을 설명하는 캡션 개체입니다.
Name | 형식 | Description |
---|---|---|
boundingRegions |
캡션을 포함하는 경계 영역입니다. |
|
content |
string |
캡션의 내용입니다. |
elements |
string[] |
캡션의 자식 요소입니다. |
spans |
읽기 순서로 연결된 콘텐츠의 캡션 위치입니다. |
DocumentField
필드 값의 내용과 위치를 나타내는 개체입니다.
Name | 형식 | Description |
---|---|---|
boundingRegions |
필드를 포함하는 경계 영역입니다. |
|
confidence |
number |
필드를 올바르게 추출할 때의 신뢰도입니다. |
content |
string |
필드 콘텐츠입니다. |
spans |
읽기 순서로 연결된 콘텐츠의 필드 위치입니다. |
|
type |
필드 값의 데이터 형식입니다. |
|
valueAddress |
주소 값입니다. |
|
valueArray |
필드 값의 배열입니다. |
|
valueBoolean |
boolean |
부울 값입니다. |
valueCountryRegion |
string |
3자 국가 코드 값(ISO 3166-1 alpha-3). |
valueCurrency |
통화 값입니다. |
|
valueDate |
string |
YYYY-MM-DD 형식(ISO 8601)의 날짜 값입니다. |
valueInteger |
integer |
정수 값입니다. |
valueNumber |
number |
부동 소수점 값입니다. |
valueObject |
<string,
Document |
명명된 필드 값의 사전입니다. |
valuePhoneNumber |
string |
E.164 형식(예: +19876543210)의 전화 번호 값입니다. |
valueSelectionGroup |
string[] |
선택 그룹 값입니다. |
valueSelectionMark |
선택 표시 값입니다. |
|
valueSignature |
서명의 존재. |
|
valueString |
string |
문자열 값입니다. |
valueTime |
string |
hh:mm:ss 형식의 시간 값(ISO 8601)입니다. |
DocumentFieldType
필드 값의 의미 체계 데이터 형식입니다.
Name | 형식 | Description |
---|---|---|
address |
string |
구문 분석된 주소입니다. |
array |
string |
동일한 형식의 하위 필드 목록입니다. |
boolean |
string |
true 또는 false로 정규화된 부울 값입니다. |
countryRegion |
string |
ISO 3166-1 alpha-3 형식(예: 미국)으로 정규화된 국가/지역입니다. |
currency |
string |
선택적 통화 기호 및 단위가 있는 통화 금액입니다. |
date |
string |
ISO 8601(YYYY-MM-DD) 형식으로 정규화된 날짜입니다. |
integer |
string |
부호 있는 64비트 정수로 정규화된 정수입니다. |
number |
string |
배정밀도 부동 소수점으로 정규화된 부동 소수점 숫자입니다. |
object |
string |
잠재적으로 다른 형식의 하위 필드의 명명된 목록입니다. |
phoneNumber |
string |
E.164(+{CountryCode}{SubscriberNumber}) 형식으로 정규화된 전화 번호입니다. |
selectionGroup |
string |
선택한 문자열 값의 배열입니다. |
selectionMark |
string |
필드가 선택되었나요? |
signature |
string |
서명이 있나요? |
string |
string |
일반 텍스트입니다. |
time |
string |
ISO 8601(hh:mm:ss) 형식으로 정규화된 시간입니다. |
DocumentFigure
문서의 그림을 나타내는 개체입니다.
Name | 형식 | Description |
---|---|---|
boundingRegions |
그림을 포함하는 경계 영역입니다. |
|
caption |
그림과 연결된 캡션입니다. |
|
elements |
string[] |
캡션 또는 각주를 제외한 그림의 자식 요소입니다. |
footnotes |
그림과 연결된 각주 목록입니다. |
|
id |
string |
그림 ID입니다. |
spans |
읽기 순서로 연결된 콘텐츠의 그림 위치입니다. |
DocumentFootnote
표 또는 그림을 설명하는 각주 개체입니다.
Name | 형식 | Description |
---|---|---|
boundingRegions |
각주를 포함하는 경계 영역입니다. |
|
content |
string |
각주 내용입니다. |
elements |
string[] |
각주 자식 요소입니다. |
spans |
읽기 순서로 연결된 콘텐츠의 각주 위치입니다. |
DocumentFormula
수식 개체입니다.
Name | 형식 | Description |
---|---|---|
confidence |
number |
수식을 올바르게 추출할 때의 신뢰도입니다. |
kind |
수식 종류입니다. |
|
polygon |
number[] |
페이지의 왼쪽 위를 기준으로 지정된 좌표를 사용하여 수식의 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
span |
읽기 순서로 연결된 콘텐츠의 수식 위치입니다. |
|
value |
string |
수식을 설명하는 LaTex 식입니다. |
DocumentFormulaKind
수식 종류입니다.
Name | 형식 | Description |
---|---|---|
display |
string |
전체 줄을 차지하는 표시 모드의 수식입니다. |
inline |
string |
단락 내용에 포함된 수식입니다. |
DocumentKeyValueElement
키-값 쌍의 필드 키 또는 값을 나타내는 개체입니다.
Name | 형식 | Description |
---|---|---|
boundingRegions |
키-값 요소를 포함하는 경계 영역입니다. |
|
content |
string |
키-값 요소의 연결된 콘텐츠를 읽기 순서로 연결합니다. |
spans |
읽기 순서에 연결된 콘텐츠의 키-값 요소 위치입니다. |
DocumentKeyValuePair
고유 필드 레이블(키) 및 필드 값(비어 있을 수 있음)이 있는 양식 필드를 나타내는 개체입니다.
Name | 형식 | Description |
---|---|---|
confidence |
number |
키-값 쌍을 올바르게 추출할 때의 신뢰도입니다. |
key |
키-값 쌍의 필드 레이블입니다. |
|
value |
키-값 쌍의 필드 값입니다. |
DocumentLanguage
지정된 텍스트 범위에 대해 검색된 언어를 나타내는 개체입니다.
Name | 형식 | Description |
---|---|---|
confidence |
number |
언어를 올바르게 식별할 수 있는 신뢰도입니다. |
locale |
string |
검색된 언어입니다. 값은 ISO 639-1 언어 코드(예: "en", "fr") 또는 BCP 47 언어 태그(예: "zh-Hans")일 수 있습니다. |
spans |
언어가 적용되는 연결된 콘텐츠의 텍스트 요소 위치입니다. |
DocumentLine
단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다.
Name | 형식 | Description |
---|---|---|
content |
string |
포함된 요소의 연결된 콘텐츠를 읽기 순서로 연결합니다. |
polygon |
number[] |
페이지의 왼쪽 위를 기준으로 좌표가 지정된 선의 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
spans |
읽기 순서로 연결된 콘텐츠의 줄 위치입니다. |
DocumentPage
입력에서 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다.
Name | 형식 | Description |
---|---|---|
angle |
number |
(-180, 180] 사이의 각도로 측정된 시계 방향으로 콘텐츠의 일반 방향입니다. |
barcodes |
페이지에서 추출된 바코드입니다. |
|
formulas |
페이지에서 추출된 수식입니다. |
|
height |
number |
이미지/PDF의 높이(각각 픽셀/인치)입니다. |
lines |
페이지에서 추출된 줄로, 텍스트 요소와 시각적 요소가 모두 포함될 수 있습니다. |
|
pageNumber |
integer |
입력 문서의 1부터 시작하는 페이지 번호입니다. |
selectionMarks |
페이지에서 선택 표시를 추출했습니다. |
|
spans |
읽기 순서로 연결된 콘텐츠의 페이지 위치입니다. |
|
unit |
너비, 높이 및 다각형 속성에 사용되는 단위입니다. 이미지의 경우 단위는 "픽셀"입니다. PDF의 경우 단위는 "인치"입니다. |
|
width |
number |
이미지/PDF의 너비(각각 픽셀/인치)입니다. |
words |
페이지에서 추출된 단어입니다. |
DocumentParagraph
일반적으로 공통 맞춤 및 간격이 있는 연속선으로 구성된 단락 개체입니다.
Name | 형식 | Description |
---|---|---|
boundingRegions |
단락을 포함하는 경계 영역입니다. |
|
content |
string |
단락의 콘텐츠를 읽기 순서로 연결합니다. |
role |
단락의 의미 체계 역할입니다. |
|
spans |
읽기 순서로 연결된 콘텐츠의 단락 위치입니다. |
DocumentSection
문서의 섹션을 나타내는 개체입니다.
Name | 형식 | Description |
---|---|---|
elements |
string[] |
섹션의 자식 요소입니다. |
spans |
읽기 순서로 연결된 콘텐츠의 섹션 위치입니다. |
DocumentSelectionMark
선택 영역을 나타내는 확인란, 라디오 단추 및 기타 요소를 나타내는 선택 표시 개체입니다.
Name | 형식 | Description |
---|---|---|
confidence |
number |
선택 표시를 올바르게 추출할 때의 신뢰도입니다. |
polygon |
number[] |
선택 영역 표시의 경계 다각형으로, 페이지의 왼쪽 위를 기준으로 좌표가 지정됩니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
span |
읽기 순서가 연결된 콘텐츠의 선택 표시 위치입니다. |
|
state |
선택 표시의 상태입니다. |
DocumentSelectionMarkState
선택 표시의 상태입니다.
Name | 형식 | Description |
---|---|---|
selected |
string |
선택 표시가 선택되어 선택 영역 표시 안에 있는 check ✓ 또는 cross X로 표시되는 경우가 많습니다. |
unselected |
string |
선택 표시가 선택되어 있지 않습니다. |
DocumentSignatureType
서명의 존재.
Name | 형식 | Description |
---|---|---|
signed |
string |
서명이 검색됩니다. |
unsigned |
string |
서명이 검색되지 않습니다. |
DocumentSpan
오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다.
Name | 형식 | Description |
---|---|---|
length |
integer |
범위가 나타내는 콘텐츠의 문자 수입니다. |
offset |
integer |
범위가 나타내는 콘텐츠의 인덱스(0부터 시작하는 인덱스)입니다. |
DocumentStyle
관찰된 텍스트 스타일을 나타내는 개체입니다.
Name | 형식 | Description |
---|---|---|
backgroundColor |
string |
#rrggbb 16진수 형식의 배경색입니다. |
color |
string |
#rrggbb 16진수 형식의 전경색입니다. |
confidence |
number |
스타일을 올바르게 식별할 수 있습니다. |
fontStyle |
글꼴 스타일입니다. |
|
fontWeight |
글꼴 두께입니다. |
|
isHandwritten |
boolean |
콘텐츠를 필기합니까? |
similarFontFamily |
string |
CSS 규칙(예: 'Arial, sans-serif')에 따라 대체 글꼴이 있는 지원되는 글꼴 패밀리 집합 중에서 시각적으로 가장 유사한 글꼴입니다. |
spans |
스타일이 적용되는 연결된 콘텐츠의 텍스트 요소 위치입니다. |
DocumentTable
사각형 레이아웃으로 정렬된 표 셀로 구성된 테이블 개체입니다.
Name | 형식 | Description |
---|---|---|
boundingRegions |
테이블을 포함하는 경계 영역입니다. |
|
caption |
테이블과 연결된 캡션입니다. |
|
cells |
표에 포함된 셀입니다. |
|
columnCount |
integer |
테이블의 열 수입니다. |
footnotes |
표와 연결된 각주 목록입니다. |
|
rowCount |
integer |
테이블의 행 수입니다. |
spans |
읽기 순서로 연결된 콘텐츠의 테이블 위치입니다. |
DocumentTableCell
표 셀의 위치와 내용을 나타내는 개체입니다.
Name | 형식 | Default value | Description |
---|---|---|---|
boundingRegions |
표 셀을 포함하는 경계 영역입니다. |
||
columnIndex |
integer |
셀의 열 인덱스입니다. |
|
columnSpan |
integer |
1 |
이 셀에 걸쳐 있는 열 수입니다. |
content |
string |
테이블 셀의 연결된 내용을 읽기 순서로 연결합니다. |
|
elements |
string[] |
표 셀의 자식 요소입니다. |
|
kind | content |
표 셀 종류입니다. |
|
rowIndex |
integer |
셀의 행 인덱스입니다. |
|
rowSpan |
integer |
1 |
이 셀에 걸쳐 있는 행 수입니다. |
spans |
읽기 순서로 연결된 내용의 표 셀 위치입니다. |
DocumentTableCellKind
표 셀 종류입니다.
Name | 형식 | Description |
---|---|---|
columnHeader |
string |
열의 내용을 설명합니다. |
content |
string |
기본 콘텐츠/데이터를 포함합니다. |
description |
string |
테이블의 일부 내용에 대해 설명합니다. |
rowHeader |
string |
행의 내용을 설명합니다. |
stubHead |
string |
일반적으로 테이블의 왼쪽 위 모서리에 있는 행 머리글을 설명합니다. |
DocumentWord
연속된 문자 시퀀스로 구성된 단어 개체입니다. 중국어, 일본어 및 한국어와 같이 공백으로 구분되지 않은 언어의 경우 각 문자가 자체 단어로 표시됩니다.
Name | 형식 | Description |
---|---|---|
confidence |
number |
단어를 올바르게 추출할 때의 신뢰도입니다. |
content |
string |
단어의 텍스트 내용입니다. |
polygon |
number[] |
페이지의 왼쪽 위를 기준으로 좌표가 지정된 단어의 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다. |
span |
읽기 순서로 연결된 콘텐츠의 단어 위치입니다. |
Error
오류 개체입니다.
Name | 형식 | Description |
---|---|---|
code |
string |
서버에서 정의한 오류 코드 집합 중 하나입니다. |
details |
Error[] |
이 보고된 오류로 이어진 특정 오류에 대한 세부 정보 배열입니다. |
innererror |
오류에 대한 현재 개체보다 더 구체적인 정보를 포함하는 개체입니다. |
|
message |
string |
사람이 읽을 수 있는 오류 표현입니다. |
target |
string |
오류의 대상입니다. |
ErrorResponse
오류 응답 개체입니다.
Name | 형식 | Description |
---|---|---|
error |
오류 정보입니다. |
FontStyle
글꼴 스타일입니다.
Name | 형식 | Description |
---|---|---|
italic |
string |
문자는 오른쪽에 시각적으로 기울어집니다. |
normal |
string |
문자는 정상적으로 표시됩니다. |
FontWeight
글꼴 두께입니다.
Name | 형식 | Description |
---|---|---|
bold |
string |
문자는 더 두꺼운 스트로크로 표시됩니다. |
normal |
string |
문자는 정상적으로 표시됩니다. |
InnerError
오류에 대한 보다 구체적인 정보를 포함하는 개체입니다.
Name | 형식 | Description |
---|---|---|
code |
string |
서버에서 정의한 오류 코드 집합 중 하나입니다. |
innererror |
내부 오류입니다. |
|
message |
string |
사람이 읽을 수 있는 오류 표현입니다. |
LengthUnit
너비, 높이 및 다각형 속성에 사용되는 단위입니다. 이미지의 경우 단위는 "픽셀"입니다. PDF의 경우 단위는 "인치"입니다.
Name | 형식 | Description |
---|---|---|
inch |
string |
PDF 파일의 길이 단위입니다. |
pixel |
string |
이미지 파일의 길이 단위입니다. |
OperationStatus
작업 상태입니다.
Name | 형식 | Description |
---|---|---|
canceled |
string |
작업이 취소되었습니다. |
completed |
string |
작업이 완료되었습니다. |
failed |
string |
작업이 실패했습니다. |
notStarted |
string |
작업이 아직 시작되지 않았습니다. |
running |
string |
작업이 진행 중입니다. |
succeeded |
string |
작업이 성공했습니다. |
ParagraphRole
단락의 의미 체계 역할입니다.
Name | 형식 | Description |
---|---|---|
footnote |
string |
일반적으로 페이지의 기본 콘텐츠에 배치되는 메모입니다. |
formulaBlock |
string |
종종 공유 맞춤이 있는 수식 블록입니다. |
pageFooter |
string |
페이지의 아래쪽 가장자리 근처에 있는 텍스트입니다. |
pageHeader |
string |
페이지의 위쪽 가장자리 근처에 있는 텍스트입니다. |
pageNumber |
string |
페이지 번호입니다. |
sectionHeading |
string |
문서의 섹션을 설명하는 하위 제목입니다. |
title |
string |
전체 문서를 설명하는 최상위 제목입니다. |
StringIndexType
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다.
Name | 형식 | Description |
---|---|---|
textElements |
string |
유니코드 8.0.0에 정의된 사용자 인식 표시 문자 또는 그래프 클러스터입니다. |
unicodeCodePoint |
string |
단일 유니코드 코드 포인트로 표현되는 문자 단위입니다. Python 3에서 사용됩니다. |
utf16CodeUnit |
string |
16비트 유니코드 코드 단위로 표현되는 문자 단위입니다. JavaScript, Java 및 .NET에서 사용됩니다. |
Warning
오류 개체입니다.
Name | 형식 | Description |
---|---|---|
code |
string |
서버에서 정의한 경고 코드 집합 중 하나입니다. |
message |
string |
사람이 읽을 수 있는 경고 표현입니다. |
target |
string |
오류의 대상입니다. |