다음을 통해 공유


Document Classifiers - Get Classify Result

문서 분류자의 결과를 가져옵니다.

GET {endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-07-31-preview

URI 매개 변수

Name In(다음 안에) 필수 형식 Description
classifierId
path True

string

고유한 문서 분류자 이름입니다.

regex 패턴: ^[a-zA-Z0-9][a-zA-Z0-9._~-]{1,63}$

endpoint
path True

string

uri

문서 인텔리전스 서비스 엔드포인트입니다.

resultId
path True

string

uuid

작업 결과 ID를 분석합니다.

api-version
query True

string

이 작업에 사용할 API 버전입니다.

응답

Name 형식 Description
200 OK

AnalyzeResultOperation

요청이 성공했습니다.

Other Status Codes

ErrorResponse

예기치 않은 오류 응답입니다.

보안

Ocp-Apim-Subscription-Key

형식: apiKey
In(다음 안에): header

OAuth2Auth

형식: oauth2
Flow: accessCode
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/authorize
토큰 URL: https://login.microsoftonline.com/common/oauth2/token

범위

Name Description
https://cognitiveservices.azure.com/.default

예제

Get Classify Document Result

샘플 요청

GET https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/myClassifier/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-07-31-preview

샘플 응답

{
  "status": "succeeded",
  "createdDateTime": "2021-09-24T13:00:46Z",
  "lastUpdatedDateTime": "2021-09-24T13:00:49Z",
  "analyzeResult": {
    "apiVersion": "2024-07-31-preview",
    "modelId": "myClassifier",
    "stringIndexType": "textElements",
    "contentFormat": "text",
    "content": "",
    "pages": [
      {
        "pageNumber": 1,
        "width": 8.5,
        "height": 11,
        "unit": "inch",
        "spans": []
      },
      {
        "pageNumber": 2,
        "width": 8.5,
        "height": 11,
        "unit": "inch",
        "spans": []
      },
      {
        "pageNumber": 3,
        "width": 8.5,
        "height": 11,
        "unit": "inch",
        "spans": []
      }
    ],
    "documents": [
      {
        "docType": "formA",
        "boundingRegions": [
          {
            "pageNumber": 1,
            "polygon": [
              0,
              0,
              8.5,
              0,
              8.5,
              11,
              0,
              11
            ]
          },
          {
            "pageNumber": 2,
            "polygon": [
              0,
              0,
              8.5,
              0,
              8.5,
              11,
              0,
              11
            ]
          }
        ],
        "confidence": 0.97,
        "spans": []
      },
      {
        "docType": "formB",
        "boundingRegions": [
          {
            "pageNumber": 3,
            "polygon": [
              0,
              0,
              8.5,
              0,
              8.5,
              11,
              0,
              11
            ]
          }
        ],
        "confidence": 0.97,
        "spans": []
      }
    ]
  }
}

정의

Name Description
AddressValue

주소 필드 값입니다.

AnalyzeResult

문서 분석 결과입니다.

AnalyzeResultOperation

분석 작업의 상태 및 결과입니다.

BoundingRegion

입력의 특정 페이지에서 다각형 경계

ContentFormat

분석된 결과의 콘텐츠 형식입니다.

CurrencyValue

통화 필드 값입니다.

Document

문서의 위치 및 의미 체계 콘텐츠를 설명하는 개체입니다.

DocumentBarcode

바코드 개체입니다.

DocumentBarcodeKind

바코드 종류입니다.

DocumentCaption

테이블 또는 그림을 설명하는 캡션 개체입니다.

DocumentField

필드 값의 내용과 위치를 나타내는 개체입니다.

DocumentFieldType

필드 값의 의미 체계 데이터 형식입니다.

DocumentFigure

문서의 그림을 나타내는 개체입니다.

DocumentFootnote

표 또는 그림을 설명하는 각주 개체입니다.

DocumentFormula

수식 개체입니다.

DocumentFormulaKind

수식 종류입니다.

DocumentKeyValueElement

키-값 쌍의 필드 키 또는 값을 나타내는 개체입니다.

DocumentKeyValuePair

고유 필드 레이블(키) 및 필드 값(비어 있을 수 있음)이 있는 양식 필드를 나타내는 개체입니다.

DocumentLanguage

지정된 텍스트 범위에 대해 검색된 언어를 나타내는 개체입니다.

DocumentLine

단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다.

DocumentPage

입력에서 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다.

DocumentParagraph

일반적으로 공통 맞춤 및 간격이 있는 연속선으로 구성된 단락 개체입니다.

DocumentSection

문서의 섹션을 나타내는 개체입니다.

DocumentSelectionMark

선택 영역을 나타내는 확인란, 라디오 단추 및 기타 요소를 나타내는 선택 표시 개체입니다.

DocumentSelectionMarkState

선택 표시의 상태입니다.

DocumentSignatureType

서명의 존재.

DocumentSpan

오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다.

DocumentStyle

관찰된 텍스트 스타일을 나타내는 개체입니다.

DocumentTable

사각형 레이아웃으로 정렬된 표 셀로 구성된 테이블 개체입니다.

DocumentTableCell

표 셀의 위치와 내용을 나타내는 개체입니다.

DocumentTableCellKind

표 셀 종류입니다.

DocumentWord

연속된 문자 시퀀스로 구성된 단어 개체입니다. 중국어, 일본어 및 한국어와 같이 공백으로 구분되지 않은 언어의 경우 각 문자가 자체 단어로 표시됩니다.

Error

오류 개체입니다.

ErrorResponse

오류 응답 개체입니다.

FontStyle

글꼴 스타일입니다.

FontWeight

글꼴 두께입니다.

InnerError

오류에 대한 보다 구체적인 정보를 포함하는 개체입니다.

LengthUnit

너비, 높이 및 다각형 속성에 사용되는 단위입니다. 이미지의 경우 단위는 "픽셀"입니다. PDF의 경우 단위는 "인치"입니다.

OperationStatus

작업 상태입니다.

ParagraphRole

단락의 의미 체계 역할입니다.

StringIndexType

문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다.

Warning

오류 개체입니다.

AddressValue

주소 필드 값입니다.

Name 형식 Description
city

string

도시, 마을, 마을 등의 이름입니다.

cityDistrict

string

뉴욕시의 브루클린이나 런던의 웨스트민스터 시와 같은 도시 내의 구역 또는 자치구.

countryRegion

string

국가/지역.

house

string

세계 무역 센터와 같은 빌드 이름입니다.

houseNumber

string

집 또는 건물 번호입니다.

level

string

바닥 번호(예: 3F).

poBox

string

우체국 박스 번호입니다.

postalCode

string

메일 정렬에 사용되는 우편 번호입니다.

road

string

거리 이름입니다.

state

string

1단계 관리 부서입니다.

stateDistrict

string

특정 로캘에서 사용되는 2단계 관리 부서입니다.

streetAddress

string

도시, 주, countryRegion 및 postalCode를 제외한 거리 수준 주소입니다.

suburb

string

차이나타운과 같은 비공식 동네 이름입니다.

unit

string

아파트 또는 사무실 번호

AnalyzeResult

문서 분석 결과입니다.

Name 형식 Description
apiVersion

string

이 결과를 생성하는 데 사용되는 API 버전입니다.

content

string

모든 텍스트 및 시각적 요소의 문자열 표현을 읽기 순서로 연결합니다.

contentFormat

ContentFormat

분석 결과 최상위 콘텐츠의 형식입니다.

documents

Document[]

추출된 문서입니다.

figures

DocumentFigure[]

추출된 수치입니다.

keyValuePairs

DocumentKeyValuePair[]

추출된 키-값 쌍입니다.

languages

DocumentLanguage[]

검색된 언어입니다.

modelId

string

이 결과를 생성하는 데 사용되는 문서 모델 ID입니다.

pages

DocumentPage[]

분석된 페이지.

paragraphs

DocumentParagraph[]

추출된 단락입니다.

sections

DocumentSection[]

추출된 섹션입니다.

stringIndexType

StringIndexType

문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다.

styles

DocumentStyle[]

추출된 글꼴 스타일입니다.

tables

DocumentTable[]

추출된 테이블입니다.

warnings

Warning[]

발생한 경고 목록입니다.

AnalyzeResultOperation

분석 작업의 상태 및 결과입니다.

Name 형식 Description
analyzeResult

AnalyzeResult

문서 분석 결과입니다.

createdDateTime

string

분석 작업이 제출된 날짜 및 시간(UTC)입니다.

error

Error

문서 분석 중에 오류가 발생했습니다.

lastUpdatedDateTime

string

상태가 마지막으로 업데이트된 날짜 및 시간(UTC)입니다.

status

OperationStatus

작업 상태입니다. notStarted, running, succeeded 또는 failed

BoundingRegion

입력의 특정 페이지에서 다각형 경계

Name 형식 Description
pageNumber

integer

경계 영역을 포함하는 페이지의 1부터 시작하는 페이지 번호입니다.

polygon

number[]

페이지의 경계 다각형 또는 지정하지 않은 경우 전체 페이지입니다. 페이지의 왼쪽 위를 기준으로 지정된 좌표입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다.

ContentFormat

분석된 결과의 콘텐츠 형식입니다.

Name 형식 Description
markdown

string

구역 머리글, 표 등을 사용하여 문서 콘텐츠의 Markdown 표현

text

string

서식이 없는 문서 내용의 일반 텍스트 표현입니다.

CurrencyValue

통화 필드 값입니다.

Name 형식 Description
amount

number

통화 금액입니다.

currencyCode

string

확인된 통화 코드(ISO 4217)(있는 경우)입니다.

currencySymbol

string

통화 기호 레이블(있는 경우)입니다.

Document

문서의 위치 및 의미 체계 콘텐츠를 설명하는 개체입니다.

Name 형식 Description
boundingRegions

BoundingRegion[]

문서를 다루는 경계 영역입니다.

confidence

number

문서를 올바르게 추출할 때의 신뢰도입니다.

docType

string

문서 형식입니다.

fields

<string,  DocumentField>

명명된 필드 값의 사전입니다.

spans

DocumentSpan[]

문서 위치(읽기 순서가 연결된 콘텐츠)입니다.

DocumentBarcode

바코드 개체입니다.

Name 형식 Description
confidence

number

바코드를 올바르게 추출할 때의 신뢰도입니다.

kind

DocumentBarcodeKind

바코드 종류입니다.

polygon

number[]

페이지의 왼쪽 위를 기준으로 지정된 좌표를 사용하여 바코드의 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다.

span

DocumentSpan

읽기 순서로 연결된 콘텐츠의 바코드 위치입니다.

value

string

바코드 값입니다.

DocumentBarcodeKind

바코드 종류입니다.

Name 형식 Description
Aztec

string

ISO/IEC 24778:2008에 정의된 Aztec 코드입니다.

Codabar

string

ANSI/AIM BC3-1995에 정의된 코다바 바코드입니다.

Code128

string

ISO/IEC 15417:2007에 정의된 코드 128 바코드입니다.

Code39

string

ISO/IEC 16388:2007에 정의된 코드 39 바코드입니다.

Code93

string

ANSI/AIM BC5-1995에 정의된 코드 93 바코드입니다.

DataBar

string

GS1 DataBar 바코드.

DataBarExpanded

string

GS1 DataBar 확장 바코드.

DataMatrix

string

ISO/IEC 16022:2006에 정의된 데이터 매트릭스 코드입니다.

EAN13

string

GS1 13자리 국제 문서 번호(유럽 문서 번호).

EAN8

string

GS1 8자리 국제 문서 번호(유럽 문서 번호).

ITF

string

ANSI/AIM BC2-1995에 정의된 대로 5개의 바코드 중 2개 인터리브되었습니다.

MaxiCode

string

MAXiCode( ISO/IEC 16023:2000에 정의된 대로).

MicroQRCode

string

ISO/IEC 23941:2022에 정의된 마이크로 QR 코드입니다.

PDF417

string

ISO 15438에 정의된 PDF417

QRCode

string

ISO/IEC 18004:2015에 정의된 QR 코드입니다.

UPCA

string

GS1 12자리 유니버설 제품 코드.

UPCE

string

GS1 6자리 유니버설 제품 코드.

DocumentCaption

테이블 또는 그림을 설명하는 캡션 개체입니다.

Name 형식 Description
boundingRegions

BoundingRegion[]

캡션을 포함하는 경계 영역입니다.

content

string

캡션의 내용입니다.

elements

string[]

캡션의 자식 요소입니다.

spans

DocumentSpan[]

읽기 순서로 연결된 콘텐츠의 캡션 위치입니다.

DocumentField

필드 값의 내용과 위치를 나타내는 개체입니다.

Name 형식 Description
boundingRegions

BoundingRegion[]

필드를 포함하는 경계 영역입니다.

confidence

number

필드를 올바르게 추출할 때의 신뢰도입니다.

content

string

필드 콘텐츠입니다.

spans

DocumentSpan[]

읽기 순서로 연결된 콘텐츠의 필드 위치입니다.

type

DocumentFieldType

필드 값의 데이터 형식입니다.

valueAddress

AddressValue

주소 값입니다.

valueArray

DocumentField[]

필드 값의 배열입니다.

valueBoolean

boolean

부울 값입니다.

valueCountryRegion

string

3자 국가 코드 값(ISO 3166-1 alpha-3).

valueCurrency

CurrencyValue

통화 값입니다.

valueDate

string

YYYY-MM-DD 형식(ISO 8601)의 날짜 값입니다.

valueInteger

integer

정수 값입니다.

valueNumber

number

부동 소수점 값입니다.

valueObject

<string,  DocumentField>

명명된 필드 값의 사전입니다.

valuePhoneNumber

string

E.164 형식(예: +19876543210)의 전화 번호 값입니다.

valueSelectionGroup

string[]

선택 그룹 값입니다.

valueSelectionMark

DocumentSelectionMarkState

선택 표시 값입니다.

valueSignature

DocumentSignatureType

서명의 존재.

valueString

string

문자열 값입니다.

valueTime

string

hh:mm:ss 형식의 시간 값(ISO 8601)입니다.

DocumentFieldType

필드 값의 의미 체계 데이터 형식입니다.

Name 형식 Description
address

string

구문 분석된 주소입니다.

array

string

동일한 형식의 하위 필드 목록입니다.

boolean

string

true 또는 false로 정규화된 부울 값입니다.

countryRegion

string

ISO 3166-1 alpha-3 형식(예: 미국)으로 정규화된 국가/지역입니다.

currency

string

선택적 통화 기호 및 단위가 있는 통화 금액입니다.

date

string

ISO 8601(YYYY-MM-DD) 형식으로 정규화된 날짜입니다.

integer

string

부호 있는 64비트 정수로 정규화된 정수입니다.

number

string

배정밀도 부동 소수점으로 정규화된 부동 소수점 숫자입니다.

object

string

잠재적으로 다른 형식의 하위 필드의 명명된 목록입니다.

phoneNumber

string

E.164(+{CountryCode}{SubscriberNumber}) 형식으로 정규화된 전화 번호입니다.

selectionGroup

string

선택한 문자열 값의 배열입니다.

selectionMark

string

필드가 선택되었나요?

signature

string

서명이 있나요?

string

string

일반 텍스트입니다.

time

string

ISO 8601(hh:mm:ss) 형식으로 정규화된 시간입니다.

DocumentFigure

문서의 그림을 나타내는 개체입니다.

Name 형식 Description
boundingRegions

BoundingRegion[]

그림을 포함하는 경계 영역입니다.

caption

DocumentCaption

그림과 연결된 캡션입니다.

elements

string[]

캡션 또는 각주를 제외한 그림의 자식 요소입니다.

footnotes

DocumentFootnote[]

그림과 연결된 각주 목록입니다.

id

string

그림 ID입니다.

spans

DocumentSpan[]

읽기 순서로 연결된 콘텐츠의 그림 위치입니다.

DocumentFootnote

표 또는 그림을 설명하는 각주 개체입니다.

Name 형식 Description
boundingRegions

BoundingRegion[]

각주를 포함하는 경계 영역입니다.

content

string

각주 내용입니다.

elements

string[]

각주 자식 요소입니다.

spans

DocumentSpan[]

읽기 순서로 연결된 콘텐츠의 각주 위치입니다.

DocumentFormula

수식 개체입니다.

Name 형식 Description
confidence

number

수식을 올바르게 추출할 때의 신뢰도입니다.

kind

DocumentFormulaKind

수식 종류입니다.

polygon

number[]

페이지의 왼쪽 위를 기준으로 지정된 좌표를 사용하여 수식의 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다.

span

DocumentSpan

읽기 순서로 연결된 콘텐츠의 수식 위치입니다.

value

string

수식을 설명하는 LaTex 식입니다.

DocumentFormulaKind

수식 종류입니다.

Name 형식 Description
display

string

전체 줄을 차지하는 표시 모드의 수식입니다.

inline

string

단락 내용에 포함된 수식입니다.

DocumentKeyValueElement

키-값 쌍의 필드 키 또는 값을 나타내는 개체입니다.

Name 형식 Description
boundingRegions

BoundingRegion[]

키-값 요소를 포함하는 경계 영역입니다.

content

string

키-값 요소의 연결된 콘텐츠를 읽기 순서로 연결합니다.

spans

DocumentSpan[]

읽기 순서에 연결된 콘텐츠의 키-값 요소 위치입니다.

DocumentKeyValuePair

고유 필드 레이블(키) 및 필드 값(비어 있을 수 있음)이 있는 양식 필드를 나타내는 개체입니다.

Name 형식 Description
confidence

number

키-값 쌍을 올바르게 추출할 때의 신뢰도입니다.

key

DocumentKeyValueElement

키-값 쌍의 필드 레이블입니다.

value

DocumentKeyValueElement

키-값 쌍의 필드 값입니다.

DocumentLanguage

지정된 텍스트 범위에 대해 검색된 언어를 나타내는 개체입니다.

Name 형식 Description
confidence

number

언어를 올바르게 식별할 수 있는 신뢰도입니다.

locale

string

검색된 언어입니다. 값은 ISO 639-1 언어 코드(예: "en", "fr") 또는 BCP 47 언어 태그(예: "zh-Hans")일 수 있습니다.

spans

DocumentSpan[]

언어가 적용되는 연결된 콘텐츠의 텍스트 요소 위치입니다.

DocumentLine

단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다.

Name 형식 Description
content

string

포함된 요소의 연결된 콘텐츠를 읽기 순서로 연결합니다.

polygon

number[]

페이지의 왼쪽 위를 기준으로 좌표가 지정된 선의 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다.

spans

DocumentSpan[]

읽기 순서로 연결된 콘텐츠의 줄 위치입니다.

DocumentPage

입력에서 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다.

Name 형식 Description
angle

number

(-180, 180] 사이의 각도로 측정된 시계 방향으로 콘텐츠의 일반 방향입니다.

barcodes

DocumentBarcode[]

페이지에서 추출된 바코드입니다.

formulas

DocumentFormula[]

페이지에서 추출된 수식입니다.

height

number

이미지/PDF의 높이(각각 픽셀/인치)입니다.

lines

DocumentLine[]

페이지에서 추출된 줄로, 텍스트 요소와 시각적 요소가 모두 포함될 수 있습니다.

pageNumber

integer

입력 문서의 1부터 시작하는 페이지 번호입니다.

selectionMarks

DocumentSelectionMark[]

페이지에서 선택 표시를 추출했습니다.

spans

DocumentSpan[]

읽기 순서로 연결된 콘텐츠의 페이지 위치입니다.

unit

LengthUnit

너비, 높이 및 다각형 속성에 사용되는 단위입니다. 이미지의 경우 단위는 "픽셀"입니다. PDF의 경우 단위는 "인치"입니다.

width

number

이미지/PDF의 너비(각각 픽셀/인치)입니다.

words

DocumentWord[]

페이지에서 추출된 단어입니다.

DocumentParagraph

일반적으로 공통 맞춤 및 간격이 있는 연속선으로 구성된 단락 개체입니다.

Name 형식 Description
boundingRegions

BoundingRegion[]

단락을 포함하는 경계 영역입니다.

content

string

단락의 콘텐츠를 읽기 순서로 연결합니다.

role

ParagraphRole

단락의 의미 체계 역할입니다.

spans

DocumentSpan[]

읽기 순서로 연결된 콘텐츠의 단락 위치입니다.

DocumentSection

문서의 섹션을 나타내는 개체입니다.

Name 형식 Description
elements

string[]

섹션의 자식 요소입니다.

spans

DocumentSpan[]

읽기 순서로 연결된 콘텐츠의 섹션 위치입니다.

DocumentSelectionMark

선택 영역을 나타내는 확인란, 라디오 단추 및 기타 요소를 나타내는 선택 표시 개체입니다.

Name 형식 Description
confidence

number

선택 표시를 올바르게 추출할 때의 신뢰도입니다.

polygon

number[]

선택 영역 표시의 경계 다각형으로, 페이지의 왼쪽 위를 기준으로 좌표가 지정됩니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다.

span

DocumentSpan

읽기 순서가 연결된 콘텐츠의 선택 표시 위치입니다.

state

DocumentSelectionMarkState

선택 표시의 상태입니다.

DocumentSelectionMarkState

선택 표시의 상태입니다.

Name 형식 Description
selected

string

선택 표시가 선택되어 선택 영역 표시 안에 있는 check ✓ 또는 cross X로 표시되는 경우가 많습니다.

unselected

string

선택 표시가 선택되어 있지 않습니다.

DocumentSignatureType

서명의 존재.

Name 형식 Description
signed

string

서명이 검색됩니다.

unsigned

string

서명이 검색되지 않습니다.

DocumentSpan

오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다.

Name 형식 Description
length

integer

범위가 나타내는 콘텐츠의 문자 수입니다.

offset

integer

범위가 나타내는 콘텐츠의 인덱스(0부터 시작하는 인덱스)입니다.

DocumentStyle

관찰된 텍스트 스타일을 나타내는 개체입니다.

Name 형식 Description
backgroundColor

string

#rrggbb 16진수 형식의 배경색입니다.

color

string

#rrggbb 16진수 형식의 전경색입니다.

confidence

number

스타일을 올바르게 식별할 수 있습니다.

fontStyle

FontStyle

글꼴 스타일입니다.

fontWeight

FontWeight

글꼴 두께입니다.

isHandwritten

boolean

콘텐츠를 필기합니까?

similarFontFamily

string

CSS 규칙(예: 'Arial, sans-serif')에 따라 대체 글꼴이 있는 지원되는 글꼴 패밀리 집합 중에서 시각적으로 가장 유사한 글꼴입니다.

spans

DocumentSpan[]

스타일이 적용되는 연결된 콘텐츠의 텍스트 요소 위치입니다.

DocumentTable

사각형 레이아웃으로 정렬된 표 셀로 구성된 테이블 개체입니다.

Name 형식 Description
boundingRegions

BoundingRegion[]

테이블을 포함하는 경계 영역입니다.

caption

DocumentCaption

테이블과 연결된 캡션입니다.

cells

DocumentTableCell[]

표에 포함된 셀입니다.

columnCount

integer

테이블의 열 수입니다.

footnotes

DocumentFootnote[]

표와 연결된 각주 목록입니다.

rowCount

integer

테이블의 행 수입니다.

spans

DocumentSpan[]

읽기 순서로 연결된 콘텐츠의 테이블 위치입니다.

DocumentTableCell

표 셀의 위치와 내용을 나타내는 개체입니다.

Name 형식 Default value Description
boundingRegions

BoundingRegion[]

표 셀을 포함하는 경계 영역입니다.

columnIndex

integer

셀의 열 인덱스입니다.

columnSpan

integer

1

이 셀에 걸쳐 있는 열 수입니다.

content

string

테이블 셀의 연결된 내용을 읽기 순서로 연결합니다.

elements

string[]

표 셀의 자식 요소입니다.

kind

DocumentTableCellKind

content

표 셀 종류입니다.

rowIndex

integer

셀의 행 인덱스입니다.

rowSpan

integer

1

이 셀에 걸쳐 있는 행 수입니다.

spans

DocumentSpan[]

읽기 순서로 연결된 내용의 표 셀 위치입니다.

DocumentTableCellKind

표 셀 종류입니다.

Name 형식 Description
columnHeader

string

열의 내용을 설명합니다.

content

string

기본 콘텐츠/데이터를 포함합니다.

description

string

테이블의 일부 내용에 대해 설명합니다.

rowHeader

string

행의 내용을 설명합니다.

stubHead

string

일반적으로 테이블의 왼쪽 위 모서리에 있는 행 머리글을 설명합니다.

DocumentWord

연속된 문자 시퀀스로 구성된 단어 개체입니다. 중국어, 일본어 및 한국어와 같이 공백으로 구분되지 않은 언어의 경우 각 문자가 자체 단어로 표시됩니다.

Name 형식 Description
confidence

number

단어를 올바르게 추출할 때의 신뢰도입니다.

content

string

단어의 텍스트 내용입니다.

polygon

number[]

페이지의 왼쪽 위를 기준으로 좌표가 지정된 단어의 경계 다각형입니다. 숫자는 요소 방향을 기준으로 왼쪽(-180도 포함)에서 시계 방향으로 다각형 꼭짓점의 x, y 값을 나타냅니다.

span

DocumentSpan

읽기 순서로 연결된 콘텐츠의 단어 위치입니다.

Error

오류 개체입니다.

Name 형식 Description
code

string

서버에서 정의한 오류 코드 집합 중 하나입니다.

details

Error[]

이 보고된 오류로 이어진 특정 오류에 대한 세부 정보 배열입니다.

innererror

InnerError

오류에 대한 현재 개체보다 더 구체적인 정보를 포함하는 개체입니다.

message

string

사람이 읽을 수 있는 오류 표현입니다.

target

string

오류의 대상입니다.

ErrorResponse

오류 응답 개체입니다.

Name 형식 Description
error

Error

오류 정보입니다.

FontStyle

글꼴 스타일입니다.

Name 형식 Description
italic

string

문자는 오른쪽에 시각적으로 기울어집니다.

normal

string

문자는 정상적으로 표시됩니다.

FontWeight

글꼴 두께입니다.

Name 형식 Description
bold

string

문자는 더 두꺼운 스트로크로 표시됩니다.

normal

string

문자는 정상적으로 표시됩니다.

InnerError

오류에 대한 보다 구체적인 정보를 포함하는 개체입니다.

Name 형식 Description
code

string

서버에서 정의한 오류 코드 집합 중 하나입니다.

innererror

InnerError

내부 오류입니다.

message

string

사람이 읽을 수 있는 오류 표현입니다.

LengthUnit

너비, 높이 및 다각형 속성에 사용되는 단위입니다. 이미지의 경우 단위는 "픽셀"입니다. PDF의 경우 단위는 "인치"입니다.

Name 형식 Description
inch

string

PDF 파일의 길이 단위입니다.

pixel

string

이미지 파일의 길이 단위입니다.

OperationStatus

작업 상태입니다.

Name 형식 Description
canceled

string

작업이 취소되었습니다.

completed

string

작업이 완료되었습니다.

failed

string

작업이 실패했습니다.

notStarted

string

작업이 아직 시작되지 않았습니다.

running

string

작업이 진행 중입니다.

succeeded

string

작업이 성공했습니다.

ParagraphRole

단락의 의미 체계 역할입니다.

Name 형식 Description
footnote

string

일반적으로 페이지의 기본 콘텐츠에 배치되는 메모입니다.

formulaBlock

string

종종 공유 맞춤이 있는 수식 블록입니다.

pageFooter

string

페이지의 아래쪽 가장자리 근처에 있는 텍스트입니다.

pageHeader

string

페이지의 위쪽 가장자리 근처에 있는 텍스트입니다.

pageNumber

string

페이지 번호입니다.

sectionHeading

string

문서의 섹션을 설명하는 하위 제목입니다.

title

string

전체 문서를 설명하는 최상위 제목입니다.

StringIndexType

문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다.

Name 형식 Description
textElements

string

유니코드 8.0.0에 정의된 사용자 인식 표시 문자 또는 그래프 클러스터입니다.

unicodeCodePoint

string

단일 유니코드 코드 포인트로 표현되는 문자 단위입니다. Python 3에서 사용됩니다.

utf16CodeUnit

string

16비트 유니코드 코드 단위로 표현되는 문자 단위입니다. JavaScript, Java 및 .NET에서 사용됩니다.

Warning

오류 개체입니다.

Name 형식 Description
code

string

서버에서 정의한 경고 코드 집합 중 하나입니다.

message

string

사람이 읽을 수 있는 경고 표현입니다.

target

string

오류의 대상입니다.