次の方法で共有


DocumentPage クラス

入力のページから抽出されたコンテンツ要素とレイアウト要素。

バージョン 2023-07-31 の新機能: バーコード数式の プロパティ。

継承
builtins.object
DocumentPage

コンストラクター

DocumentPage(**kwargs: Any)

メソッド

from_dict

DocumentPage の図形のディクテーションをモデル自体に変換します。

to_dict

DocumentPage の dict 表現を返します。

from_dict

DocumentPage の図形のディクテーションをモデル自体に変換します。

from_dict(data: Dict) -> DocumentPage

パラメーター

data
dict
必須

DocumentPage の形のディクショナリ。

戻り値

DocumentPage

の戻り値の型 :

to_dict

DocumentPage の dict 表現を返します。

to_dict() -> Dict

戻り値

dict

の戻り値の型 :

属性

angle

時計回りの方向のコンテンツの一般的な向き(-180,180]の間の度数で測定されます。

angle: float | None

barcodes

ページからバーコードを抽出しました。

barcodes: List[DocumentBarcode]

formulas

ページから抽出された数式

formulas: List[DocumentFormula]

height

画像/PDF の高さ (ピクセル/インチ単位)。

height: float | None

lines

ページから抽出された行。テキスト要素とビジュアル要素の両方を含む可能性があります。

lines: List[DocumentLine]

page_number

入力ドキュメント内の 1 から始まるページ番号。

page_number: int

selection_marks

ページから抽出された選択マーク。

selection_marks: List[DocumentSelectionMark]

spans

読み取り順序の連結されたコンテンツ内のページの場所。

spans: List[DocumentSpan]

unit

幅、高さ、境界ポリゴンのプロパティで使用される単位。 画像の場合、単位は "ピクセル" です。 PDF の場合、単位は "inch" です。 指定できる値は、"pixel"、"inch" です。

unit: str | None

width

イメージ/PDF の幅 (ピクセル/インチ単位)。

width: float | None

words

ページから抽出された単語。

words: List[DocumentWord]