Wzbogacanie tabel usługi Delta Lake za pomocą niestandardowych metadanych
Usługa Databricks zaleca zawsze udostępnianie komentarzy do tabel i kolumn w tabelach. Te komentarze można wygenerować przy użyciu sztucznej inteligencji. Zobacz Dodawanie komentarzy generowanych przez sztuczną inteligencję do tabeli.
Katalog aparatu Unity zapewnia również możliwość tagowania danych. Zobacz Stosowanie tagów do zabezpieczanych obiektów wykazu aparatu Unity.
Komunikaty dotyczące poszczególnych zatwierdzeń można również rejestrować w tabelach w polu w dzienniku transakcji usługi Delta Lake.
Ustawianie metadanych zatwierdzenia zdefiniowanego przez użytkownika
Ciągi zdefiniowane przez użytkownika można określić jako metadane w zatwierdzeniach przy użyciu opcji userMetadata
DataFrameWriter lub konfiguracji spark.databricks.delta.commitInfo.userMetadata
SparkSession. Jeśli oba z nich zostały określone, opcja przyjmuje preferencję. Te metadane zdefiniowane przez użytkownika można odczytać w DESCRIBE HISTORY
operacji. Zobacz Praca z historią tabel platformy Delta Lake.
SQL
SET spark.databricks.delta.commitInfo.userMetadata=overwritten-for-fixing-incorrect-data
INSERT OVERWRITE default.people10m SELECT * FROM morePeople
Python
df.write.format("delta") \
.mode("overwrite") \
.option("userMetadata", "overwritten-for-fixing-incorrect-data") \
.save("/tmp/delta/people10m")
Scala
df.write.format("delta")
.mode("overwrite")
.option("userMetadata", "overwritten-for-fixing-incorrect-data")
.save("/tmp/delta/people10m")
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla