Was ist DBFS?
Der Begriff DBFS wird verwendet, um zwei Teile der Plattform zu beschreiben:
- DBFS-Stamm
- DBFS-Bereitstellungen
Das Speichern und Zugreifen auf Daten mithilfe von DBFS-Stamm oder DBFS-Bereitstellungen ist ein veraltetes Muster und wird von Databricks nicht empfohlen. Empfehlungen für die Arbeit mit Dateien finden Sie unter Arbeiten mit Dateien in Azure Databricks.
Was ist das Databricks File System (DBFS)?
Der Begriff DBFS stammt aus dem Databricks File System, welches das verteilte Dateisystem beschreibt, das von Azure Databricks verwendet wird, um mit cloudbasiertem Speicher zu interagieren.
Die zugrunde liegende Technologie, die DBFS zugeordnet ist, ist noch Teil der Azure Databricks-Plattform. Beispielsweise ist dbfs:/
ein optionales Schema bei der Interaktion mit Unity-Katalogvolumes.
Frühere und aktuelle Warnungen und Hinweise zu DBFS gelten nur für den DBFS-Stamm oder die DBFS-Bereitstellungen.
Wie funktioniert DBFS mit Unity Catalog?
Databricks empfiehlt die Verwendung des Unity Catalog, um den Zugriff auf alle Daten zu verwalten.
Unity Catalog fügt die Konzepte externer Speicherorte, Speicheranmeldeinformationen und Volumes hinzu, um Organisationen den geringstprivilegierten Zugriff auf Daten im Cloudobjektspeicher zu ermöglichen.
Einige Sicherheitskonfigurationen bieten direkten Zugriff auf verwaltete Unity Catalog-Ressourcen und DBFS, in erster Linie für Organisationen, welche die Migration abgeschlossen haben oder teilweise zu Unity Catalog migriert sind. Weitere Informationen finden Sie unter Bewährte Methoden für DBFS und Unity Catalog.
Was ist der DBFS-Stamm?
Der DBFS-Stamm ist ein Speicherort, der während der Arbeitsbereichserstellung in dem Cloudkonto bereitgestellt wird, das den Azure Databricks-Arbeitsbereich enthält. Einzelheiten zur DBFS-Stammkonfiguration und -Bereitstellung finden Sie im Azure Databricks-Schnellstart.
Databricks empfiehlt nicht, Produktionsdaten, Bibliotheken oder Skipts im DBFS-Stamm zu speichern. Weitere Informationen unter Empfehlungen zum Arbeiten mit dem DBFS-Stamm.
Informationen zum Konfigurieren von kundenseitig verwalteten Schlüsseln für das Speicherkonto, das den DBFS-Stamm enthält, finden Sie unter Kundenseitig verwaltete Schlüssel für den DBFS-Stamm.
Informationen zum Einschränken des Netzwerkzugriffs auf das Speicherkonto, das den DBFS-Stamm enthält, finden Sie unter Aktivieren der Firewallunterstützung für Ihr Speicherkonto für einen Arbeitsbereich.
Einbinden von Objektspeicher
Hinweis
DBFS-Bereitstellungen sind veraltet. Databricks empfiehlt die Verwendung von Unity-Katalogvolumes. Weitere Informationen finden Sie unter Was sind Unity Catalog-Volumes?.
Durch das Einbinden des Objektspeichers in DBFS können Sie auf Objekte im Objektspeicher zugreifen, als ob sie sich im lokalen Dateisystem befänden. Hadoop-Konfigurationen des Bereitstellungsspeichers, die für den Zugriff auf den Speicher erforderlich sind. Weitere Informationen finden Sie unter Mount Cloud-Objektspeicher auf Azure Databricks.