Freigeben über


fs-Befehlsgruppe

Hinweis

Diese Informationen gelten für Databricks CLI-Versionen 0.205 und höher. Die Databricks CLI befindet sich in der öffentlichen Vorschau.

Die Verwendung von Databricks CLI unterliegt der Datenbricks-Lizenz - und Databricks-Datenschutzerklärung, einschließlich der Bestimmungen zu Nutzungsdaten.

Mit der Befehlsgruppe fs innerhalb der Databricks-CLI können Sie Volumes im Unity-Katalog sowie Databricks File System (DBFS)-Objekte automatisieren.

Sie führen fs-Befehle aus, indem Sie sie an databricks fs anfügen. Führen Sie fs aus, um Hilfe zum databricks fs -h-Befehl anzuzeigen.

fs-Befehle erfordern, dass Volumepfade mit dbfs:/Volumes und Verzeichnis- und Dateipfade in DBFS mit dbfs:/ beginnen müssen.

Wichtig

Die Verwendung der Databricks CLI- oder REST-APIs mit firewallfähigen Speichercontainern wird nicht unterstützt. Databricks empfiehlt, Databricks Connect oder AZ Storagezu verwenden.

Auflisten des Inhalts eines Verzeichnisses

Verwenden Sie den ls-Befehl, um den Inhalt eines Verzeichnisses in einem Volume oder im DBFS aufzulisten. Geben Sie den Pfad zum Verzeichnis an. In den folgenden Beispielen werden die Namen der Objekte aufgelistet, die im Stammverzeichnis des angegebenen Volumes oder im DBFS-Stamm gefunden wurden:

databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/

Um vollständige Informationen einschließlich Objekttypen, Größen, Änderungszeiten seit Epoche in Millisekunden sowie die Namen der Objekte anzuzeigen, verwenden Sie die --long option.-l In den folgenden Beispielen werden die vollständigen Informationen der Objekte im Stammverzeichnis des angegebenen Volumes oder in einem tmp Verzeichnis im DBFS-Stamm aufgeführt:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l

Verwenden Sie die Option --absolute, um vollständige Objektpfade anzuzeigen. In den folgenden Beispielen werden die vollständigen Informationen der Objekte und die vollständigen Pfade der Objekte im Stammverzeichnis des angegebenen Volumes oder in einem tmp Verzeichnis im DBFS-Stammverzeichnis aufgeführt:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute

Ausgeben des Inhalts einer Datei

Verwenden Sie den Befehl cat, um den Inhalt einer Datei auszugeben. Geben Sie den Pfad zu der Datei im DBFS an. In den folgenden Beispielen wird der Inhalt der Datei babynames.csv ausgegeben, die im Stammverzeichnis des angegebenen Volumes oder in einem tmp Verzeichnis im DBFS-Stammverzeichnis enthalten ist:

databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv

In den folgenden Beispielen werden Fehler zurückgegeben, da versucht wird, den Inhalt eines Verzeichnisses statt einer Datei auszugeben:

databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp

Erstellen eines Verzeichnisses

Verwenden Sie den Befehl mkdir, um ein Verzeichnis zu erstellen. Geben Sie den Pfad zu dem Verzeichnis an, das in einem Volume oder im DBFS erstellt werden soll. Wenn das Verzeichnis bereits vorhanden ist, geschieht nichts. In den folgenden Beispielen wird ein Verzeichnis erstellt, entweder im Stammverzeichnis des angegebenen Volumes benannt squirrel-data oder im DBFS-Stammverzeichnis in einem Verzeichnis namens tmp.

databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data

Kopieren eines Verzeichnisses oder einer Datei

Verwenden Sie den Befehl cp, um ein Verzeichnis oder eine Datei zu kopieren. Geben Sie die Pfade zum zu kopierenden Quellverzeichnis oder der zu kopierenden Datei und dem Ziel an. Sie können Verzeichnisse und Dateien zwischen dem lokalen Dateisystem und dem DBFS sowie Verzeichnisse und Dateien zwischen DBFS-Pfaden kopieren. Um vorhandene Dateien zu überschreiben, verwenden Sie die Option --overwrite. Verwenden Sie eine der Optionen --recursive oder -r, um Dateien in einem Verzeichnis rekursiv zu kopieren.

Der Befehl cp geht von file:/ aus, wenn file:/ nicht angegeben wird.

In den folgenden Beispielen wird ein Verzeichnis namens squirrel-data und dessen Inhalt aus einem lokalen Dateisystempfad in ein squirrels Verzeichnis im Stammverzeichnis des angegebenen Volumes oder im DBFS-Stamm kopiert.

databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r

Im folgenden Beispiel wird eine Datei mit dem Namen `squirrels.csv` aus einem lokalen Dateisystempfad in ein Verzeichnis namens `squirrel-data` im Stammverzeichnis des angegebenen Volumes oder des DBFS-Stamms kopiert. Wenn die Datei bereits im Ziel vorhanden ist, wird sie überschrieben.

databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite

Entfernen eines Verzeichnisses

Verwenden Sie den Befehl rm, um ein Verzeichnis zu entfernen. Geben Sie den Pfad zum vorhandenen Verzeichnis im DBFS an. In den folgenden Beispielen wird ein Verzeichnis mit dem Namen squirrel-data entweder aus dem Stamm des angegebenen Volumes oder aus einem Verzeichnis im DBFS-Stammverzeichnis tmp entfernt.

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data

Wenn das Verzeichnis nicht vorhanden ist, geschieht nichts, und es wird kein Fehler zurückgegeben.

Wenn das Verzeichnis vorhanden, aber nicht leer ist, wird ein Fehler zurückgegeben. Verwenden Sie eine der Optionen --recursive oder -r, um ein nicht leeres Verzeichnis und seinen gesamten Inhalt zu entfernen. In den folgenden Beispielen wird ein nicht leeres Verzeichnis mit dem Namen squirrel-data entweder aus dem Stammverzeichnis des angegebenen Volumes oder aus einem tmp-Verzeichnis im DBFS-Stamm entfernt.

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r