Freigeben über


ai_parse_document

Analysiert eine Spalte mit Binären Daten (Blob) und gibt einen VariantType-Wert zurück. Löst eine Ausnahme aus, wenn das Eingabe-BLOB ungültig ist.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.ai_parse_document(col=<col>, options=<options>)

Die Parameter

Parameter Typ Description
col pyspark.sql.Column oder Binärdaten Ein Spalten- oder Spaltenname, der die zu analysierenden binären Blobs enthält.
options dictwahlfrei Ein Wörterbuch mit Optionen zum Steuern des Analyseverhaltens.

Rückkehr

pyspark.sql.Column: Eine neue Spalte von VariantType, die das Dokumentanalyseergebnis enthält. Das Ergebnis enthält ein document Objekt mit pages und elements Arrays zusammen mit error_status und metadata. Jedes Element stellt eine diskrete Inhaltseinheit innerhalb des analysierten Dokuments dar, z. B. einen Textabsatz, eine Tabelle, eine Abbildung oder eine Layoutmarkierung. Vollständiges Ausgabeschema und Details zu Elementen finden Sie unter ai_parse_document.