使用自定義元數據擴充 Delta Lake 數據表

Databricks 建議一律提供數據表和數據行的批注。 您可以使用 AI 產生這些批注。 請參閱 將 AI 產生的批註新增至數據表

Unity 目錄也提供標記數據的能力。 請參閱 套用標籤

您也可以記錄個別認可至 Delta Lake 事務歷史記錄中欄位數據表的訊息。

設定使用者定義的認可元數據

您可以使用 DataFrameWriter 選項 userMetadata 或 SparkSession 組態 spark.databricks.delta.commitInfo.userMetadata,將使用者定義字串指定為認可中的元數據。 如果兩者都已指定,則選項會採用喜好設定。 此使用者定義的元數據可在作業中 DESCRIBE HISTORY 讀取。 請參閱使用 Delta Lake 資料表歷程記錄

SQL


SET spark.databricks.delta.commitInfo.userMetadata=overwritten-for-fixing-incorrect-data
INSERT OVERWRITE default.people10m SELECT * FROM morePeople

Python

df.write.format("delta") \
  .mode("overwrite") \
  .option("userMetadata", "overwritten-for-fixing-incorrect-data") \
  .save("/tmp/delta/people10m")

Scala

df.write.format("delta")
  .mode("overwrite")
  .option("userMetadata", "overwritten-for-fixing-incorrect-data")
  .save("/tmp/delta/people10m")