你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

formrecognizer 包

aio

AccountProperties

帐户上所有自定义模型的摘要。

版本 v2.1 中的新增功能:支持 to_dictfrom_dict 方法

AddressValue

地址字段值。

版本 2023-07-31 中的新增功能: 单位city_districtstate_district郊区房屋级别 属性。

AnalyzeResult

文档分析结果。

AnalyzedDocument

描述文档的位置和语义内容的 对象。

BlobFileListSource

Azure Blob 存储中文件列表的内容源。

BlobSource

Azure Blob 存储的内容源。

BoundingRegion

对应于页面的边界区域。

ClassifierDocumentTypeDetails

训练数据源。

CurrencyValue

货币值元素。

版本 2023-07-31 中的新增功能: 代码 属性。

CustomDocumentModelsDetails

有关表单识别器资源下的自定义模型的详细信息。

CustomFormModel

表示已训练的模型。

版本 v2.1 中的新增功能: model_name属性 属性,支持 to_dictfrom_dict 方法

CustomFormModelField

模型将从分析的表单中提取的字段。

版本 v2.1 中的新增功能:支持 to_dictfrom_dict 方法

CustomFormModelInfo

自定义模型信息。

版本 v2.1 中的新增功能: model_name属性 属性,支持 to_dictfrom_dict 方法

CustomFormModelProperties

可选模型属性。

版本 v2.1 中的新增功能:支持 to_dictfrom_dict 方法

CustomFormSubmodel

表示从特定类型的表单中提取字段的子模型。

版本 v2.1 中的新增功能: model_id 属性,支持 to_dictfrom_dict 方法

DocumentAnalysisClient

DocumentAnalysisClient 分析文档和图像中的信息,并对文档进行分类。 它是一个接口,用于通过预生成模型分析 (收据、名片、发票、标识文档等) 、分析文档布局、分析常规文档类型以及使用生成模型分析自定义文档 (查看服务支持的模型的完整列表,请参阅: https://aka.ms/azsdk/formrecognizer/models) 。 它根据 URL 中的输入和来自流的输入提供不同的方法。

注意

DocumentAnalysisClient 应与 API 版本一起使用

2022-08-31 及最新版。 若要使用 API 版本 <=v2.1,请实例化 FormRecognizerClient。

版本 2022-08-31 中的新增功能: DocumentAnalysisClient 及其客户端方法。

DocumentAnalysisError

DocumentAnalysisError 包含服务返回的错误的详细信息。

DocumentAnalysisInnerError

DocumentAnalysisError 的内部错误详细信息。

DocumentBarcode

条形码对象。

DocumentClassifierDetails

文档分类器信息。 包括模型可分类的文档类型。

DocumentField

一个 对象,表示文档字段值的内容和位置。

版本 2023-07-31 中的新增功能: 布尔 值value_type和 布尔

DocumentFormula

公式对象。

DocumentKeyValueElement

表示字段键或键值对中的值的对象。

DocumentKeyValuePair

表示具有不同字段标签的文档字段的对象 (键) 和字段值 (可能为空) 。

DocumentLanguage

一个 对象,表示给定文本范围检测到的语言。

DocumentLine

一个内容行对象,该对象表示在文档的单行中找到的内容。

DocumentModelAdministrationClient

DocumentModelAdministrationClient 是用于生成和管理模型的表单识别器接口。

它提供用于生成模型和分类器的方法,以及用于查看和删除模型和分类器、查看模型和分类器操作、访问帐户信息、将模型复制到另一个表单识别器资源以及从现有模型集合撰写新模型的方法。

注意

DocumentModelAdministrationClient 应与 API 版本一起使用

2022-08-31 及最新版。 若要使用 API 版本 <=v2.1,请实例化 FormTrainingClient。

版本 2022-08-31 中的新增功能: DocumentModelAdministrationClient 及其客户端方法。

DocumentModelAdministrationLROPoller

实现一个协议,后跟返回的轮询器对象。

DocumentModelDetails

文档模型信息。 包括模型可以分析的文档类型。

版本 2023-07-31 中的新增功能: expires_on 属性。

DocumentModelSummary

文档模型信息的摘要,包括模型 ID、其说明以及创建模型时。

版本 2023-07-31 中的新增功能: expires_on 属性。

DocumentPage

从输入页中提取的内容和布局元素。

版本 2023-07-31 中的新增功能: 条形码公式 属性。

DocumentParagraph

一个段落对象,通常由具有共同对齐和间距的连续行组成。

版本 2023-07-31 中的新增功能: formulaBlock 角色。

DocumentSelectionMark

一个选择标记对象,表示检查框、单选按钮和其他指示所选内容的元素。

DocumentSpan

属性内容的连续区域,指定为偏移量和长度。

DocumentStyle

表示观察到的文本样式的 对象。

版本 2023-07-31 中的新增功能: similar_font_familyfont_stylefont_weight颜色background_color 属性。

DocumentTable

由以矩形布局排列的表格单元格组成的表对象。

DocumentTableCell

一个对象,表示表格单元格的位置和内容。

DocumentTypeDetails

DocumentTypeDetails 表示模型可以识别的文档类型,包括其字段和类型,以及这些字段的置信度。

DocumentWord

由连续字符序列组成的单词对象。 对于非空格分隔语言(如中文、日语和朝鲜语),每个字符都表示为自己的单词。

FieldData

包含表单域的数据。 这包括文本、窗体上文本的位置以及组成文本的元素的集合。

版本 v2.1 中的新增功能: FormSelectionMark 添加到field_elements列表中返回的类型,支持 to_dictfrom_dict 方法

FormElement

包含窗体元素的属性的基类型。

版本 v2.1 中的新增功能:支持 to_dictfrom_dict 方法

FormField

表示在输入表单中识别的字段。

版本 v2.1 中的新增功能:支持 to_dictfrom_dict 方法

FormLine

表示提取的文本行的 对象。

版本 v2.1 中的新增功能: 外观 属性、 对to_dictfrom_dict 方法的支持

FormPage

表示从输入文档识别的页面。 包含行、字词、选择标记、表和页面元数据。

版本 v2.1 中的新增功能: selection_marks 属性、 对to_dictfrom_dict 方法的支持

FormPageRange

窗体的从 1 开始的页面范围。

版本 v2.1 中的新增功能:支持 to_dictfrom_dict 方法

FormRecognizerClient

FormRecognizerClient 将表单和图像中的信息提取到结构化数据中。 它是一个接口,用于通过预生成模型进行分析, (收据、名片、发票、标识文档) 、从表单中识别内容/布局,以及分析已训练模型中的自定义表单。 它根据 URL 中的输入和来自流的输入提供不同的方法。

注意

FormRecognizerClient 应与 API 版本 <=v2.1 一起使用。

若要使用 API 版本 2022-08-31 及更新版本,请实例化 DocumentAnalysisClient。

FormRecognizerError

表示训练时发生的错误。

版本 v2.1 中的新增功能:支持 to_dictfrom_dict 方法

FormSelectionMark

有关提取的选择标记的信息。

v2.1 版中的新增功能:支持 to_dictfrom_dict 方法

FormTable

有关页面上包含的提取表的信息。

版本 v2.1 中的新增功能: bounding_box 属性、 对to_dictfrom_dict 方法的支持

FormTableCell

表示从输入文档识别的表格中包含的单元格。

版本 v2.1 中的新增功能: FormSelectionMark 已添加到field_elements列表中返回的类型,支持 to_dictfrom_dict 方法

FormTrainingClient

FormTrainingClient 是用于创建和管理自定义模型的表单识别器接口。 它提供用于在提供的窗体上训练模型的方法,以及用于查看和删除模型、访问帐户属性、将模型复制到另一个表单识别器资源以及从使用标签训练的现有模型集合中编写模型的方法。

注意

FormTrainingClient 应与 API 版本 <=v2.1 一起使用。

若要使用 API 版本 2022-08-31 及更新版本,请实例化 DocumentModelAdministrationClient。

FormWord

表示从输入文档中识别的单词。

v2.1 版中的新增功能:支持 to_dictfrom_dict 方法

OperationDetails

OperationDetails 包含有关模型操作的信息,包括操作的结果或错误(如果操作已完成)。

请注意,操作信息仅保留 24 小时。 如果操作成功,也可以使用 、、 <xref:azure.ai.formrecognizer.list_document_models><xref:azure.ai.formrecognizer.get_document_classifier><xref:azure.ai.formrecognizer.list_document_classifiers> API 访问<xref:azure.ai.formrecognizer.get_document_model>模型。

版本 2023-07-31 中的新增功能: documentClassifierBuild 类型和 DocumentClassifierDetails 结果。

OperationSummary

模型操作信息,包括操作的类型和状态、创建时间等。

请注意,操作信息仅保留 24 小时。 如果操作成功,则可以使用 <xref:azure.ai.formrecognizer.get_document_model>、、 <xref:azure.ai.formrecognizer.list_document_models><xref:azure.ai.formrecognizer.get_document_classifier><xref:azure.ai.formrecognizer.list_document_classifiers> API 访问模型。 若要了解操作失败的原因,请使用 <xref:azure.ai.formrecognizer.get_operation> 并提供 operation_id

版本 2023-07-31 中的新增功能: documentClassifierBuild 类型。

Point

边界框或多边形上点的 x、y 坐标。

v2.1 版中的新增功能:支持 to_dictfrom_dict 方法

QuotaDetails

已用配额、限制和下一次重置日期/时间。

RecognizedForm

表示已训练或预生成模型已识别的窗体。 fields 属性包含从窗体中提取的表单字段。 表、文本行/字词和选择标记按页提取,并在 pages 属性中找到。

v2.1 版中的新增功能: form_type_confidencemodel_id 属性、对 to_dictfrom_dict 方法的支持

ResourceDetails

有关表单识别器资源的详细信息。

版本 2023-07-31 中的新增功能: neural_document_model_quota 属性。

TextAppearance

表示文本行外观的 对象。

v2.1 版中的新增功能:支持 to_dictfrom_dict 方法

TrainingDocumentInfo

用于训练自定义模型的单个文档的报告。

v2.1 版中的新增功能: model_id 属性、 对to_dictfrom_dict 方法的支持

枚举

AnalysisFeature

要启用的文档分析功能。

CustomFormModelStatus

指示模型可供使用的状态。

DocumentAnalysisApiVersion

表单识别器 DocumentAnalysisClient 和 DocumentModelAdministrationClient 支持的 API 版本。

FieldValueType

字段值的语义数据类型。

版本 v2.1 中的新增功能: selectionMarkcountryRegion

FormContentType

用于上传的内容类型。

版本 v2.1 中的新增功能:支持 image/bmp

FormRecognizerApiVersion

表单识别器 FormRecognizerClient 和 FormTrainingClient 支持的 API 版本。

LengthUnit

宽度、高度和边界框属性使用的单位。 对于图像,单位为“像素”。 对于 PDF,单位为“英寸”。

ModelBuildMode

生成自定义模型时使用的模式。

有关详细信息,请参阅 https://aka.ms/azsdk/formrecognizer/buildmode

TrainingStatus

训练操作的状态。