Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Analiza una columna que contiene datos binarios (blob) y devuelve un valor VariantType. Produce una excepción si el blob de entrada no es válido.
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.ai_parse_document(col=<col>, options=<options>)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
col |
pyspark.sql.Column o datos binarios |
Un nombre de columna o columna que contiene los blobs binarios que se van a analizar. |
options |
dictopcional |
Diccionario de opciones para controlar el comportamiento de análisis. |
Devoluciones
pyspark.sql.Column: una nueva columna de VariantType que contiene el resultado del análisis del documento. El resultado incluye un document objeto con pages matrices y elements , junto con error_status y metadata. Cada elemento representa una unidad discreta de contenido dentro del documento analizado, como un párrafo de texto, una tabla, una figura o un marcador de diseño. Para obtener el esquema de salida completo y los detalles sobre los elementos, consulte ai_parse_document.