你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

FormPage 类

表示从输入文档识别的页面。 包含行、字词、选择标记、表和页面元数据。

版本 v2.1 中的新增功能: selection_marks 属性、 对to_dictfrom_dict 方法的支持

继承
builtins.object
FormPage

构造函数

FormPage(**kwargs: Any)

方法

from_dict

将 FormPage 形状中的 dict 转换为模型本身。

to_dict

返回 FormPage 的 dict 表示形式。

from_dict

将 FormPage 形状中的 dict 转换为模型本身。

from_dict(data: Dict) -> FormPage

参数

data
dict
必需

FormPage 形状的字典。

返回

FormPage

返回类型

to_dict

返回 FormPage 的 dict 表示形式。

to_dict() -> Dict

返回

dict

返回类型

属性

height

图像/PDF 的高度(以像素/英寸为单位)。

height: float

lines

include_field_elements 设置为 true 时,将返回已识别文本行的列表。 对于识别内容的调用,始终填充此列表。 返回的最大行数为每页 300 行。 这些行按从上到下、从左到右排序,但在某些情况下,邻近度以更高的优先级进行处理。 由于排序顺序取决于检测到的文本,因此它可能会在图像和 OCR 版本更新中更改。 因此,应基于实际行位置而不是订单构建业务逻辑。 行的读取顺序可由 reading_order 关键字 (keyword) 参数指定 (注意:reading_order仅在begin_recognize_contentbegin_recognize_content_from_url) 中受支持。

lines: List[FormLine]

page_number

包含此内容的页面的从 1 开始的编号。

page_number: int

selection_marks

从页面中提取的选择标记的列表。

selection_marks: List[FormSelectionMark]

tables

页中包含的提取表的列表。

tables: List[FormTable]

text_angle

顺时针方向的文本的一般方向,以 (-180, 180 之间的度为单位。

text_angle: float

unit

宽度 LengthUnit 、高度和边界框属性使用的 。 对于图像,单位为“像素”。 对于 PDF,单位为“英寸”。

unit: str

width

图像/PDF 的宽度(以像素/英寸为单位)。

width: float