다음을 통해 공유


DocumentPage 클래스

입력 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다.

버전 2023-07-31의 새로운 기능: 바코드수식 속성입니다.

상속
builtins.object
DocumentPage

생성자

DocumentPage(**kwargs: Any)

메서드

from_dict

DocumentPage 셰이프의 받아쓰기를 모델 자체로 변환합니다.

to_dict

DocumentPage의 받아쓰기 표현을 반환합니다.

from_dict

DocumentPage 셰이프의 받아쓰기를 모델 자체로 변환합니다.

from_dict(data: Dict) -> DocumentPage

매개 변수

data
dict
필수

DocumentPage 셰이프의 사전입니다.

반환

DocumentPage

반환 형식

to_dict

DocumentPage의 받아쓰기 표현을 반환합니다.

to_dict() -> Dict

반환

dict

반환 형식

특성

angle

(-180, 180] 사이의 각도로 측정된 콘텐츠의 일반 방향(시계 방향)입니다.

angle: float | None

barcodes

페이지에서 추출된 바코드입니다.

barcodes: List[DocumentBarcode]

formulas

페이지에서 추출된 수식

formulas: List[DocumentFormula]

height

이미지/PDF의 높이(각각 픽셀/인치)입니다.

height: float | None

lines

페이지에서 추출된 줄로, 텍스트 요소와 시각적 요소를 모두 포함할 수 있습니다.

lines: List[DocumentLine]

page_number

입력 문서의 1 기반 페이지 번호입니다.

page_number: int

selection_marks

페이지에서 추출된 선택 표시입니다.

selection_marks: List[DocumentSelectionMark]

spans

읽기 순서로 연결된 콘텐츠의 페이지 위치입니다.

spans: List[DocumentSpan]

unit

너비, 높이 및 경계 다각형 속성에 사용되는 단위입니다. 이미지의 경우 단위는 "pixel"입니다. PDF의 경우 단위는 "인치"입니다. 가능한 값은 "pixel", "inch"입니다.

unit: str | None

width

이미지/PDF의 너비(각각 픽셀/인치)입니다.

width: float | None

words

페이지에서 추출된 단어입니다.

words: List[DocumentWord]