DocumentPage 클래스
입력 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다.
버전 2023-07-31의 새로운 기능: 바코드 및 수식 속성입니다.
- 상속
-
builtins.objectDocumentPage
생성자
DocumentPage(**kwargs: Any)
메서드
from_dict |
DocumentPage 셰이프의 받아쓰기를 모델 자체로 변환합니다. |
to_dict |
DocumentPage의 받아쓰기 표현을 반환합니다. |
from_dict
DocumentPage 셰이프의 받아쓰기를 모델 자체로 변환합니다.
from_dict(data: Dict) -> DocumentPage
매개 변수
반환
DocumentPage
반환 형식
to_dict
특성
angle
(-180, 180] 사이의 각도로 측정된 콘텐츠의 일반 방향(시계 방향)입니다.
angle: float | None
barcodes
페이지에서 추출된 바코드입니다.
barcodes: List[DocumentBarcode]
formulas
페이지에서 추출된 수식
formulas: List[DocumentFormula]
height
이미지/PDF의 높이(각각 픽셀/인치)입니다.
height: float | None
lines
페이지에서 추출된 줄로, 텍스트 요소와 시각적 요소를 모두 포함할 수 있습니다.
lines: List[DocumentLine]
page_number
입력 문서의 1 기반 페이지 번호입니다.
page_number: int
selection_marks
페이지에서 추출된 선택 표시입니다.
selection_marks: List[DocumentSelectionMark]
spans
읽기 순서로 연결된 콘텐츠의 페이지 위치입니다.
spans: List[DocumentSpan]
unit
너비, 높이 및 경계 다각형 속성에 사용되는 단위입니다. 이미지의 경우 단위는 "pixel"입니다. PDF의 경우 단위는 "인치"입니다. 가능한 값은 "pixel", "inch"입니다.
unit: str | None
width
이미지/PDF의 너비(각각 픽셀/인치)입니다.
width: float | None
words
페이지에서 추출된 단어입니다.
words: List[DocumentWord]
GitHub에서 Microsoft와 공동 작업
이 콘텐츠의 원본은 GitHub에서 찾을 수 있으며, 여기서 문제와 끌어오기 요청을 만들고 검토할 수도 있습니다. 자세한 내용은 참여자 가이드를 참조하세요.
Azure SDK for Python
피드백
https://aka.ms/ContentUserFeedback
출시 예정: 2024년 내내 콘텐츠에 대한 피드백 메커니즘으로 GitHub 문제를 단계적으로 폐지하고 이를 새로운 피드백 시스템으로 바꿀 예정입니다. 자세한 내용은 다음을 참조하세요.다음에 대한 사용자 의견 제출 및 보기