Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Note
Diese Informationen gelten für Databricks CLI-Versionen 0.205 und höher. Die Databricks CLI befindet sich in der öffentlichen Vorschau.
Die Verwendung von Databricks CLI unterliegt der Datenbricks-Lizenz - und Databricks-Datenschutzerklärung, einschließlich der Bestimmungen zu Nutzungsdaten.
Die sync Befehlsgruppe in der Databricks CLI ermöglicht die unidirektionale Synchronisierung von lokalem Code und Dateiänderungen in einem Verzeichnis auf Ihrem lokalen Entwicklungscomputer in einem Ordner in Ihrem Remote-Azure Databricks-Arbeitsbereich.
Note
-
syncDateiänderungen aus einem Ordner in einem Azure Databricks-Remotearbeitsbereich können nicht mit einem Verzeichnis auf Ihrem lokalen Entwicklungscomputer synchronisiert werden. -
syncKann Dateiänderungen von einem lokalen Entwicklungscomputer nur mit Arbeitsbereichsbenutzerdateien (/Users) in Ihrem Azure Databricks-Arbeitsbereich synchronisieren. Mit DBFS-Dateien kann nicht synchronisiert werden. Um Dateiänderungen von einem lokalen Entwicklungscomputer mit DBFS (dbfs:/) in Ihrem Azure Databricks-Arbeitsbereich zu synchronisieren, verwenden Sie das DbX-Synchronisierungsprogramm .
Databricks-Synchronisierung
Synchronisiert ein lokales Verzeichnis mit einem Arbeitsbereichsverzeichnis
databricks sync [flags] SRC DST
Arguments
SRC
Der Quellverzeichnispfad
DST
Der Zielverzeichnispfad
Options
--dry-run
Simulieren der Synchronisierungsausführung, ohne tatsächliche Änderungen vorzunehmen
--exclude strings
Muster, die aus der Synchronisierung ausgeschlossen werden sollen (können mehrmals angegeben werden)
--exclude-from string
Datei mit Mustern, die von der Synchronisierung ausgeschlossen werden sollen (ein Muster pro Zeile)
--full
Vollständige Synchronisierung durchführen (Standard ist inkrementell)
--include strings
Muster, die in die Synchronisierung aufgenommen werden sollen (können mehrmals angegeben werden)
--include-from string
Datei mit Mustern zum Einschließen zur Synchronisierung (ein Muster pro Zeile)
--interval duration
Abfrageintervall des Dateisystems (für --watch) (Default 1s)
--watch
Überwachen des lokalen Dateisystems für Änderungen
Examples
In den folgenden Abschnitten wird die Verwendung des sync Befehls veranschaulicht.
Inkrementelle Synchronisierung lokaler Dateiänderungen mit einem Remoteverzeichnis
Um eine einzelne, inkrementelle, unidirektionale Synchronisierung von Dateiänderungen innerhalb eines lokalen Verzeichnisses mit einem Ordner in einem Azure Databricks-Remotearbeitsbereich durchzuführen, führen Sie den sync Befehl wie folgt aus:
databricks sync <local-directory-path> <remote-directory-path>
Führen Sie beispielsweise den folgenden Befehl aus, um eine einmalige, unidirektionale inkrementelle Synchronisierung aller Dateiänderungen im Ordner my-local-folder des aktuellen lokalen Arbeitsverzeichnisses mit dem Ordner my-workspace-folder im Remote-Arbeitsbereich auszuführen:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder
In diesem Beispiel werden nur Dateiänderungen seit der letzten Ausführung des sync-Befehls mit /Users/someone@example.com/my-workspace-foldersynchronisiert. Standardmäßig wird die Arbeitsbereichs-URL innerhalb des Profils des Aufrufers DEFAULT verwendet, um den zu synchronisierenden Remotearbeitsbereich zu bestimmen.
Nur bestimmte Dateien synchronisieren
Wenn Sie bestimmte Dateien einschließen oder ausschließen wollen, die basierend auf spezifizierten Mustern synchronisiert werden sollen, verwenden Sie die Optionen --include, --include-from, --exclude oder --exclude-from.
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore
Note
Wenn Sie Dateien in einem Bündel synchronisieren möchten, verwenden Sie stattdessen die sync Konfigurationszuordnung. Weitere Informationen finden Sie unter sync.
Im folgenden Beispiel werden bestimmte Dateimuster von der Synchronisierung ausgeschlossen:
databricks sync --exclude "*.pyc" --exclude "__pycache__" ./my-local-folder /Users/someone@example.com/my-workspace-folder
Vollständige Synchronisierung lokaler Dateiänderungen mit einem Remoteverzeichnis
Um eine einzelne, vollständige, unidirektionale Synchronisierung von Dateiänderungen innerhalb eines lokalen Verzeichnisses mit einem Ordner in einem Azure Databricks-Remotearbeitsbereich durchzuführen, verwenden Sie unabhängig davon, wann der letzte sync Befehl ausgeführt wurde, die --full Option, z. B.:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full
Fortlaufende Synchronisierung lokaler Dateiänderungen mit einem Remoteverzeichnis
Um die fortlaufende, unidirektionale Synchronisierung von Dateiänderungen in einem lokalen Verzeichnis mit einem Ordner in einem Azure Databricks-Arbeitsbereich zu aktivieren, verwenden Sie die Option --watch, zum Beispiel:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch
Die unidirektionale Synchronisierung wird fortgesetzt, bis der Befehl über das Terminal beendet wird, was in der Regel durch Drücken von Ctrl + c oder Ctrl + z geschieht.
Das Abfragen möglicher Synchronisierungsereignisse werden standardmäßig einmal pro Sekunde ausgeführt. Um dieses Intervall zu ändern, verwenden Sie die Option --interval zusammen mit der Anzahl der Sekunden, nach der abgerufen werden sollen, gefolgt vom Zeichen s. Geben Sie z. B. Folgendes an, um das Intervall in fünf Sekunden zu ändern:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s
Ändern des Ausgabeformats für den Synchronisierungsstatus
Informationen zum Synchronisierungsstatus werden standardmäßig im Textformat an das Terminal ausgegeben. Um das Ausgabeformat für den Synchronisierungsstatus anzugeben, verwenden Sie die Option --output, und geben Sie entweder text (Standardeinstellung, wenn --output nichts anderes angegeben wird) oder json an, z. B.:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json
Anzeigen einer Vorschau von Dateivorgängen für eine Synchronisierung
Wenn Sie eine Vorschau einer Synchronisierung anzeigen möchten, ohne die Dateisynchronisierungsvorgänge tatsächlich auszuführen, verwenden Sie die --dry-run Option, z. B.:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete
Globale Kennzeichnungen
--debug
Gibt an, ob die Debugprotokollierung aktiviert werden soll.
-h oder --help
Hilfe für die Databricks CLI oder die zugehörige Befehlsgruppe oder den zugehörigen Befehl anzeigen.
--log-file Schnur
Eine Zeichenfolge, die die Datei darstellt, in die Ausgabeprotokolle geschrieben werden sollen. Wenn dieses Flag nicht angegeben ist, werden Ausgabeprotokolle standardmäßig in stderr geschrieben.
--log-format Format
Der Protokollformattyp text oder json. Der Standardwert ist text.
--log-level Schnur
Eine Zeichenfolge, die die Protokollformatebene darstellt. Wenn nicht angegeben, ist die Protokollformatebene deaktiviert.
-o, --output Typ
Der Befehlsausgabetyp text oder json. Der Standardwert ist text.
-p, --profile Schnur
Der Name des Profils in der ~/.databrickscfg Datei, das zum Ausführen des Befehls verwendet werden soll. Wenn dieses Flag nicht angegeben ist, aber existiert, wird das Profil DEFAULT verwendet.
--progress-format Format
Das Format zum Anzeigen von Statusprotokollen: default, , append, inplaceoder json
-t, --target Schnur
Falls zutreffend, das zu verwendende Bündelziel