Compartir a través de


ai_parse_document

Analiza una columna que contiene datos binarios (blob) y devuelve un valor VariantType. Produce una excepción si el blob de entrada no es válido.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.ai_parse_document(col=<col>, options=<options>)

Parámetros

Parámetro Tipo Description
col pyspark.sql.Column o datos binarios Un nombre de columna o columna que contiene los blobs binarios que se van a analizar.
options dictopcional Diccionario de opciones para controlar el comportamiento de análisis.

Devoluciones

pyspark.sql.Column: una nueva columna de VariantType que contiene el resultado del análisis del documento. El resultado incluye un document objeto con pages matrices y elements , junto con error_status y metadata. Cada elemento representa una unidad discreta de contenido dentro del documento analizado, como un párrafo de texto, una tabla, una figura o un marcador de diseño. Para obtener el esquema de salida completo y los detalles sobre los elementos, consulte ai_parse_document.