FormPage クラス

入力ドキュメントから認識されるページを表します。 行、単語、選択マーク、テーブル、およびページ メタデータが含まれます。

バージョン v2.1 の新機能: selection_marks プロパティ、 to_dict メソッドと from_dict メソッドのサポート

継承
builtins.object
FormPage

コンストラクター

FormPage(**kwargs: Any)

メソッド

from_dict

FormPage の図形のディクテーションをモデル自体に変換します。

to_dict

FormPage の dict 表現を返します。

from_dict

FormPage の図形のディクテーションをモデル自体に変換します。

from_dict(data: Dict) -> FormPage

パラメーター

data
dict
必須

FormPage の図形のディクショナリ。

戻り値

FormPage

の戻り値の型 :

to_dict

FormPage の dict 表現を返します。

to_dict() -> Dict

戻り値

dict

の戻り値の型 :

属性

height

画像/PDF の高さ (ピクセル/インチ単位)。

height: float

lines

include_field_elementsが true に設定されている場合は、認識されたテキスト行の一覧が返されます。 コンテンツを認識する呼び出しの場合、このリストは常に設定されます。 返される行の最大数は 1 ページあたり 300 行です。 行は上から下、左から右に並べ替えられますが、場合によっては近接性が高い優先順位で処理されます。 並べ替え順序は、検出されたテキストによって異なるため、イメージ間で変更され、OCR バージョンが更新される可能性があります。 したがって、ビジネス ロジックは、順序ではなく実際の行の場所に基づいて構築する必要があります。 行の読み取り順序は、reading_order キーワード (keyword) 引数で指定できます (注: reading_orderbegin_recognize_contentbegin_recognize_content_from_urlでのみサポートされます)。

lines: List[FormLine]

page_number

このコンテンツが存在するページの 1 から始まる番号。

page_number: int

selection_marks

ページから抽出された選択マークの一覧。

selection_marks: List[FormSelectionMark]

tables

ページに含まれる抽出されたテーブルの一覧。

tables: List[FormTable]

text_angle

時計回りの方向のテキストの一般的な向き(-180,180]の間の角度で測定されます。

text_angle: float

unit

LengthUnit幅、高さ、および境界ボックスのプロパティで使用される 。 画像の場合、単位は "ピクセル" です。 PDF の場合、単位は "inch" です。

unit: str

width

画像/PDF の幅をピクセル/インチ単位で指定します。

width: float