Enriquecimiento de tablas de Delta Lake con metadatos personalizados
Databricks recomienda proporcionar siempre comentarios para tablas y columnas en tablas. Puede generar estos comentarios mediante IA. Consulte Agregar comentarios generados por IA a una tabla.
Unity Catalog también proporciona la capacidad de etiquetar datos. Consulte Aplicar etiquetas.
También puede registrar mensajes para confirmaciones individuales en tablas en un campo en el registro de transacciones de Delta Lake.
Establecimiento de metadatos de confirmación definidos por el usuario
Puede especificar cadenas definidas por el usuario como metadatos en confirmaciones, ya sea mediante la opción userMetadata
de DataFrameWriter o la configuración spark.databricks.delta.commitInfo.userMetadata
de SparkSession. Si se ha especificado tanto la opción como la configuración, la opción tiene preferencia. Estos metadatos definidos por el usuario son legibles en la operación de DESCRIBE HISTORY
. Consulte Trabajar con el historial de tablas de Delta Lake.
SQL
SET spark.databricks.delta.commitInfo.userMetadata=overwritten-for-fixing-incorrect-data
INSERT OVERWRITE default.people10m SELECT * FROM morePeople
Python
df.write.format("delta") \
.mode("overwrite") \
.option("userMetadata", "overwritten-for-fixing-incorrect-data") \
.save("/tmp/delta/people10m")
Scala
df.write.format("delta")
.mode("overwrite")
.option("userMetadata", "overwritten-for-fixing-incorrect-data")
.save("/tmp/delta/people10m")