DocumentPage クラス
入力のページから抽出されたコンテンツ要素とレイアウト要素。
バージョン 2023-07-31 の新機能: バーコードと 数式の プロパティ。
- 継承
-
builtins.objectDocumentPage
コンストラクター
DocumentPage(**kwargs: Any)
メソッド
from_dict |
DocumentPage の図形のディクテーションをモデル自体に変換します。 |
to_dict |
DocumentPage の dict 表現を返します。 |
from_dict
DocumentPage の図形のディクテーションをモデル自体に変換します。
from_dict(data: Dict) -> DocumentPage
パラメーター
戻り値
DocumentPage
の戻り値の型 :
to_dict
属性
angle
時計回りの方向のコンテンツの一般的な向き(-180,180]の間の度数で測定されます。
angle: float | None
barcodes
ページからバーコードを抽出しました。
barcodes: List[DocumentBarcode]
formulas
ページから抽出された数式
formulas: List[DocumentFormula]
height
画像/PDF の高さ (ピクセル/インチ単位)。
height: float | None
lines
ページから抽出された行。テキスト要素とビジュアル要素の両方を含む可能性があります。
lines: List[DocumentLine]
page_number
入力ドキュメント内の 1 から始まるページ番号。
page_number: int
selection_marks
ページから抽出された選択マーク。
selection_marks: List[DocumentSelectionMark]
spans
読み取り順序の連結されたコンテンツ内のページの場所。
spans: List[DocumentSpan]
unit
幅、高さ、境界ポリゴンのプロパティで使用される単位。 画像の場合、単位は "ピクセル" です。 PDF の場合、単位は "inch" です。 指定できる値は、"pixel"、"inch" です。
unit: str | None
width
イメージ/PDF の幅 (ピクセル/インチ単位)。
width: float | None
words
ページから抽出された単語。
words: List[DocumentWord]
GitHub で Microsoft と共同作業する
このコンテンツのソースは GitHub にあります。そこで、issue や pull request を作成および確認することもできます。 詳細については、共同作成者ガイドを参照してください。
Azure SDK for Python
フィードバック
https://aka.ms/ContentUserFeedback」を参照してください。
以下は間もなく提供いたします。2024 年を通じて、コンテンツのフィードバック メカニズムとして GitHub の issue を段階的に廃止し、新しいフィードバック システムに置き換えます。 詳細については、「フィードバックの送信と表示