Obohacení tabulek Delta Lake o vlastní metadata
Databricks doporučuje vždy poskytovat komentáře pro tabulky a sloupce v tabulkách. Tyto komentáře můžete vygenerovat pomocí AI. Viz Přidání komentářů generovaných AI do objektů katalogu Unity.
Katalog Unity také poskytuje možnost označit data. Viz Použití značek na zabezpečitelné objekty Katalogu Unity.
Můžete také protokolovat zprávy pro jednotlivá potvrzení do tabulek v poli v transakčním protokolu Delta Lake.
Nastavení metadat potvrzení definovaných uživatelem
Uživatelem definované řetězce můžete zadat jako metadata v potvrzeních, buď pomocí možnosti userMetadata
DataFrameWriter nebo konfigurace spark.databricks.delta.commitInfo.userMetadata
SparkSession . Pokud byly zadány obě, má tato možnost přednost. Tato uživatelsky definovaná metadata jsou v DESCRIBE HISTORY
operaci čitelná. Přečtěte si: Práce s historií tabulky Delta Lake.
SQL
SET spark.databricks.delta.commitInfo.userMetadata=some-comment
INSERT OVERWRITE target_table SELECT * FROM data_source
Python
df.write \
.mode("overwrite") \
.option("userMetadata", "some-comment") \
.table("target_table")
Scala
df.write
.mode("overwrite")
.option("userMetadata", "some-comment")
.table("target_table")