다음을 통해 공유


FormPage 클래스

입력 문서에서 인식되는 페이지를 나타냅니다. 선, 단어, 선택 표시, 테이블 및 페이지 메타데이터를 포함합니다.

버전 v2.1의 새로운 기능: selection_marks 속성, to_dictfrom_dict 메서드 지원

상속
builtins.object
FormPage

생성자

FormPage(**kwargs: Any)

메서드

from_dict

FormPage 셰이프의 받아쓰기를 모델 자체로 변환합니다.

to_dict

FormPage의 받아쓰기 표현을 반환합니다.

from_dict

FormPage 셰이프의 받아쓰기를 모델 자체로 변환합니다.

from_dict(data: Dict) -> FormPage

매개 변수

data
dict
필수

FormPage 셰이프의 사전입니다.

반환

FormPage

반환 형식

to_dict

FormPage의 받아쓰기 표현을 반환합니다.

to_dict() -> Dict

반환

dict

반환 형식

특성

height

이미지/PDF의 높이(각각 픽셀/인치)입니다.

height: float

lines

include_field_elements true로 설정되면 인식된 텍스트 줄 목록이 반환됩니다. 콘텐츠를 인식하는 호출의 경우 이 목록은 항상 채워집니다. 반환되는 최대 줄 수는 페이지당 300개입니다. 특정 경우에는 근접이 더 높은 우선 순위로 처리되지만 선은 위에서 아래로, 왼쪽에서 오른쪽으로 정렬됩니다. 정렬 순서는 검색된 텍스트에 따라 달라지으므로 이미지 및 OCR 버전 업데이트 간에 변경될 수 있습니다. 따라서 비즈니스 논리는 주문이 아닌 실제 라인 위치를 기반으로 구축되어야 합니다. 줄의 읽기 순서는 reading_order 키워드(keyword) 인수로 지정할 수 있습니다(참고: begin_recognize_content begin_recognize_content_from_url 지원되는 reading_order).

lines: List[FormLine]

page_number

이 콘텐츠가 있는 페이지의 1 기반 번호입니다.

page_number: int

selection_marks

페이지에서 추출된 선택 표시 목록입니다.

selection_marks: List[FormSelectionMark]

tables

페이지에 포함된 추출된 테이블 목록입니다.

tables: List[FormTable]

text_angle

(-180, 180] 사이의 각도로 측정된 시계 방향으로 텍스트의 일반 방향입니다.

text_angle: float

unit

LengthUnit 너비, 높이 및 경계 상자 속성에 사용되는 입니다. 이미지의 경우 단위는 "pixel"입니다. PDF의 경우 단위는 "인치"입니다.

unit: str

width

이미지/PDF의 너비(각각 픽셀/인치)입니다.

width: float