Compartilhar via


ai_parse_document

Analisa uma coluna que contém dados binários (blob) e retorna um VariantType. Gerará uma exceção se o blob de entrada for inválido.

Sintaxe

from pyspark.databricks.sql import functions as dbf

dbf.ai_parse_document(col=<col>, options=<options>)

Parâmetros

Parâmetro Tipo Description
col pyspark.sql.Column ou dados binários Um nome de coluna ou coluna que contém os blobs binários a serem analisados.
options dictopcional Um dicionário de opções para controlar o comportamento de análise.

Devoluções

pyspark.sql.Column: uma nova coluna de VariantType que contém o resultado da análise do documento. O resultado inclui um document objeto com pages e elements matrizes, juntamente com error_status e metadata. Cada elemento representa uma unidade discreta de conteúdo dentro do documento analisado, como um parágrafo de texto, tabela, figura ou marcador de layout. Para obter o esquema de saída completo e detalhes sobre elementos, consulte ai_parse_document.