Freigeben über


Empfehlungen zum Arbeiten mit dem DBFS-Stamm

Azure Databricks verwendet das DBFS-Stammverzeichnis als Standardspeicherort für einige Workspace-Aktionen. Databricks empfiehlt, Produktionsdaten oder vertrauliche Informationen nicht im DBFS-Stamm zu speichern. Dieser Artikel befasst sich mit Empfehlungen zur Vermeidung der versehentlichen Offenlegung vertraulicher Daten im DBFS-Stamm.

Hinweis

Azure Databricks konfiguriert einen separaten privaten Speicherort für dauerhafte Daten und Konfigurationen im kundeneigenen Cloudspeicher, der als internes DBFS bezeichnet wird. Dieser Speicherort wird Benutzern nicht angezeigt.

Wichtig

Ab dem 6. März 2023 verwenden neue Azure Databricks-Arbeitsbereiche Azure Data Lake Storage Gen2 Speicherkonten für den DBFS-Stamm. Zuvor bereitgestellte Arbeitsbereiche verwenden Blob Storage.

Informieren von Benutzern, Daten nicht im DBFS-Stamm zu speichern

Da der DBFS-Stamm für alle Benutzer in einem Arbeitsbereich zugänglich ist, können alle Benutzer auf die hier gespeicherten Daten zugreifen. Es ist wichtig, Benutzer anzuweisen, diesen Ort nicht für die Speicherung vertraulicher Daten zu verwenden. Der Standardspeicherort für verwaltete Tabellen im Hive-Metastore in Azure Databricks ist der DBFS-Stamm. Um zu verhindern, dass Endbenutzer, die verwaltete Tabellen erstellen, in den DBFS-Stamm schreiben, deklarieren Sie beim Erstellen von Datenbanken im Hive-Metastore einen Speicherort im externen Speicher.

Verwaltete Unity Catalog-Tabellen verwenden standardmäßig einen sicheren Speicherort. Databricks empfiehlt die Verwendung von Unity Catalog für verwaltete Tabellen.

Verwenden der Überwachungsprotokollierung zum Überwachen der Aktivität

Hinweis

Ausführliche Informationen zu DBFS-Überwachungsereignissen finden Sie unter DBFS-Ereignisse.

Verschlüsseln von DBFS-Stammdaten mit einem kundenseitig verwalteten Schlüssel

Sie können DBFS-Stammdaten mit einem kundenseitig verwalteten Schlüssel verschlüsseln. Weitere Informationen finden Sie unter Kundenseitig verwaltete Schlüssel für den DBFS-Stamm.

Wichtig

Deaktivieren Sie Storage account key access nicht für das Speicherkonto, in dem der DBFS-Stamm gesichert ist. Das Deaktivieren dieser Einstellung führt zu unerwarteten Verhaltensweisen und Fehlern.