Partilhar via


DocumentPage Classe

Elementos de conteúdo e esquema extraídos de uma página da entrada.

Novidades na versão 2023-07-31: os códigos de barras e as propriedades das fórmulas .

Herança
builtins.object
DocumentPage

Construtor

DocumentPage(**kwargs: Any)

Métodos

from_dict

Converte um ditado na forma de uma Página de Documentos para o próprio modelo.

to_dict

Devolve uma representação de ditado do DocumentPage.

from_dict

Converte um ditado na forma de uma Página de Documentos para o próprio modelo.

from_dict(data: Dict) -> DocumentPage

Parâmetros

data
dict
Necessário

Um dicionário na forma do DocumentPage.

Devoluções

DocumentPage

Tipo de retorno

to_dict

Devolve uma representação de ditado do DocumentPage.

to_dict() -> Dict

Devoluções

dict

Tipo de retorno

Atributos

angle

A orientação geral do conteúdo no sentido dos ponteiros do relógio, medida em graus entre (-180, 180].

angle: float | None

barcodes

Códigos de barras extraídos da página.

barcodes: List[DocumentBarcode]

formulas

Fórmulas extraídas da página

formulas: List[DocumentFormula]

height

A altura da imagem/PDF em píxeis/polegadas, respetivamente.

height: float | None

lines

Linhas extraídas da página, que contêm potencialmente elementos visuais e contextuais.

lines: List[DocumentLine]

page_number

Número de página baseado em 1 no documento de entrada.

page_number: int

selection_marks

Marcas de seleção extraídas da página.

selection_marks: List[DocumentSelectionMark]

spans

Localização da página no conteúdo concatenado da ordem de leitura.

spans: List[DocumentSpan]

unit

A unidade utilizada pelas propriedades de polígono de largura, altura e delimitação. Para imagens, a unidade é "pixel". Para PDF, a unidade é "polegada". Os valores possíveis incluem: "pixel", "polegada".

unit: str | None

width

A largura da imagem/PDF em píxeis/polegadas, respetivamente.

width: float | None

words

Palavras extraídas da página.

words: List[DocumentWord]