Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Analisa uma coluna que contém dados binários (blob) e retorna um VariantType. Gerará uma exceção se o blob de entrada for inválido.
Sintaxe
from pyspark.databricks.sql import functions as dbf
dbf.ai_parse_document(col=<col>, options=<options>)
Parâmetros
| Parâmetro | Tipo | Description |
|---|---|---|
col |
pyspark.sql.Column ou dados binários |
Um nome de coluna ou coluna que contém os blobs binários a serem analisados. |
options |
dictopcional |
Um dicionário de opções para controlar o comportamento de análise. |
Devoluções
pyspark.sql.Column: uma nova coluna de VariantType que contém o resultado da análise do documento. O resultado inclui um document objeto com pages e elements matrizes, juntamente com error_status e metadata. Cada elemento representa uma unidade discreta de conteúdo dentro do documento analisado, como um parágrafo de texto, tabela, figura ou marcador de layout. Para obter o esquema de saída completo e detalhes sobre elementos, consulte ai_parse_document.