Compartilhar via


DocumentPage Classe

Elementos de conteúdo e layout extraídos de uma página da entrada.

Novo na versão 2023-07-31: as propriedades de códigos de barras e fórmulas .

Herança
builtins.object
DocumentPage

Construtor

DocumentPage(**kwargs: Any)

Métodos

from_dict

Converte um dict na forma de um DocumentPage para o próprio modelo.

to_dict

Retorna uma representação de ditado de DocumentPage.

from_dict

Converte um dict na forma de um DocumentPage para o próprio modelo.

from_dict(data: Dict) -> DocumentPage

Parâmetros

data
dict
Obrigatório

Um dicionário na forma de DocumentPage.

Retornos

Documentpage

Tipo de retorno

to_dict

Retorna uma representação de ditado de DocumentPage.

to_dict() -> Dict

Retornos

dict

Tipo de retorno

Atributos

angle

A orientação geral do conteúdo no sentido horário, medida em graus entre (-180, 180].

angle: float | None

barcodes

Códigos de barras extraídos da página.

barcodes: List[DocumentBarcode]

formulas

Fórmulas extraídas da página

formulas: List[DocumentFormula]

height

A altura da imagem/PDF em pixels/polegadas, respectivamente.

height: float | None

lines

Linhas extraídas da página, potencialmente contendo elementos textuais e visuais.

lines: List[DocumentLine]

page_number

Número de página baseado em 1 no documento de entrada.

page_number: int

selection_marks

Marcas de seleção extraídas da página.

selection_marks: List[DocumentSelectionMark]

spans

Local da página no conteúdo concatenado da ordem de leitura.

spans: List[DocumentSpan]

unit

A unidade usada pelas propriedades de polígono de largura, altura elimitadora. Para imagens, a unidade é "pixel". Para PDF, a unidade é "polegada". Os valores possíveis incluem: "pixel", "polegada".

unit: str | None

width

A largura da imagem/PDF em pixels/polegadas, respectivamente.

width: float | None

words

Palavras extraídas da página.

words: List[DocumentWord]