Compartilhar via


FormPage Classe

Representa uma página reconhecida do documento de entrada. Contém linhas, palavras, marcas de seleção, tabelas e metadados de página.

Novo na versão v2.1: propriedade selection_marks, suporte para métodos to_dict e from_dict

Herança
builtins.object
FormPage

Construtor

FormPage(**kwargs: Any)

Métodos

from_dict

Converte um dict na forma de um FormPage para o próprio modelo.

to_dict

Retorna uma representação de ditado de FormPage.

from_dict

Converte um dict na forma de um FormPage para o próprio modelo.

from_dict(data: Dict) -> FormPage

Parâmetros

data
dict
Obrigatório

Um dicionário na forma de FormPage.

Retornos

FormPage

Tipo de retorno

to_dict

Retorna uma representação de ditado de FormPage.

to_dict() -> Dict

Retornos

dict

Tipo de retorno

Atributos

height

A altura da imagem/PDF em pixels/polegadas, respectivamente.

height: float

lines

Quando include_field_elements é definido como true, uma lista de linhas de texto reconhecidas é retornada. Para chamadas para reconhecer conteúdo, essa lista é sempre preenchida. O número máximo de linhas retornadas é de 300 por página. As linhas são classificadas de cima para baixo, da esquerda para a direita, embora, em determinados casos, a proximidade seja tratada com prioridade mais alta. Como a ordem de classificação depende do texto detectado, ela pode ser alterada entre imagens e atualizações de versão do OCR. Portanto, a lógica de negócios deve ser criada sobre o local real da linha em vez da ordem. A ordem de leitura das linhas pode ser especificada pelo argumento reading_order palavra-chave (Observação: reading_order com suporte apenas em begin_recognize_content e begin_recognize_content_from_url).

lines: List[FormLine]

page_number

O número baseado em 1 da página na qual este conteúdo está presente.

page_number: int

selection_marks

Lista de marcas de seleção extraídas da página.

selection_marks: List[FormSelectionMark]

tables

Uma lista de tabelas extraídas contidas em uma página.

tables: List[FormTable]

text_angle

A orientação geral do texto no sentido horário, medida em graus entre (-180, 180].

text_angle: float

unit

O LengthUnit usado pelas propriedades de largura, altura e caixa delimitadora. Para imagens, a unidade é "pixel". Para PDF, a unidade é "polegada".

unit: str

width

A largura da imagem/PDF em pixels/polegadas, respectivamente.

width: float