Share via


FormPage Classe

Representa uma página reconhecida a partir do documento de entrada. Contém linhas, palavras, marcas de seleção, tabelas e metadados de página.

Novo na versão v2.1: propriedade selection_marks, suporte para métodos de to_dict e from_dict

Herança
builtins.object
FormPage

Construtor

FormPage(**kwargs: Any)

Métodos

from_dict

Converte um ditado na forma de uma Página de Formulário para o próprio modelo.

to_dict

Devolve uma representação de ditado do FormPage.

from_dict

Converte um ditado na forma de uma Página de Formulário para o próprio modelo.

from_dict(data: Dict) -> FormPage

Parâmetros

data
dict
Necessário

Um dicionário na forma de FormPage.

Devoluções

Página de Formulário

Tipo de retorno

to_dict

Devolve uma representação de ditado do FormPage.

to_dict() -> Dict

Devoluções

dict

Tipo de retorno

Atributos

height

A altura da imagem/PDF em píxeis/polegadas, respetivamente.

height: float

lines

Quando include_field_elements está definido como verdadeiro, é devolvida uma lista de linhas de texto reconhecidas. Para chamadas para reconhecer conteúdo, esta lista é sempre preenchida. O número máximo de linhas devolvidas é 300 por página. As linhas são ordenadas de cima para baixo, da esquerda para a direita, embora em certos casos a proximidade seja tratada com maior prioridade. Uma vez que a sequência de ordenação depende do texto detetado, pode mudar entre as imagens e as atualizações da versão do OCR. Assim, a lógica de negócio deve ser criada com base na localização real da linha em vez da ordem. A ordem de leitura das linhas pode ser especificada pelo argumento reading_order palavra-chave (Nota: reading_order suportada apenas em begin_recognize_content e begin_recognize_content_from_url).

lines: List[FormLine]

page_number

O número baseado em 1 da página na qual este conteúdo está presente.

page_number: int

selection_marks

Lista de marcas de seleção extraídas da página.

selection_marks: List[FormSelectionMark]

tables

Uma lista de tabelas extraídas contidas numa página.

tables: List[FormTable]

text_angle

A orientação geral do texto no sentido dos ponteiros do relógio, medida em graus entre (-180, 180].

text_angle: float

unit

A LengthUnit utilizada pelas propriedades de largura, altura e caixa delimitadora. Para imagens, a unidade é "pixel". Para PDF, a unidade é "polegada".

unit: str

width

A largura da imagem/PDF em píxeis/polegadas, respetivamente.

width: float