Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Commande
Note
Ces informations s’appliquent à Databricks CLI versions 0.205 et ultérieures. L’interface CLI Databricks est en préversion publique.
L’utilisation de l’interface CLI Databricks est soumise à la licence Databricks et à la notification de confidentialité Databricks, y compris les dispositions relatives aux données d’utilisation.
Le sync groupe de commandes dans l’interface CLI Databricks permet la synchronisation unidirectionnelle du code local et des modifications de fichiers dans un répertoire de votre ordinateur de développement local vers un dossier de votre espace de travail Azure Databricks distant.
Note
-
syncimpossible de synchroniser les modifications de fichier d’un dossier dans un espace de travail Azure Databricks distant vers un répertoire sur votre ordinateur de développement local. -
syncpeut synchroniser les modifications de fichiers d’un ordinateur de développement local uniquement aux fichiers de l'utilisateur d’espace de travail (/Users) dans votre espace de travail Azure Databricks. Il ne peut pas se synchroniser avec des fichiers DBFS (dbfs:/). Pour synchroniser les modifications de fichier d’un ordinateur de développement local vers DBFS (dbfs:/) dans votre espace de travail Azure Databricks, utilisez l’utilitaire de synchronisation dbx .
synchronisation de Databricks
Synchronisez un répertoire local avec un répertoire d’espace de travail.
databricks sync [flags] SRC DST
Arguments
SRC
Chemin d’accès au répertoire source
DST
Chemin d’accès au répertoire de destination
Options
--dry-run
Simuler l’exécution de la synchronisation sans apporter de modifications réelles
--exclude strings
Modèles à exclure de la synchronisation (peuvent être spécifiés plusieurs fois)
--exclude-from string
Fichier contenant des modèles à exclure de la synchronisation (un modèle par ligne)
--full
Effectuer une synchronisation complète (la valeur par défaut est incrémentielle)
--include strings
Modèles à inclure dans la synchronisation (peuvent être spécifiés plusieurs fois)
--include-from string
Fichier contenant des modèles à inclure pour la synchronisation (un modèle par ligne)
--interval duration
Intervalle d’interrogation du système de fichiers (pour --watch) (par défaut 1s)
--watch
Regarder le système de fichiers local pour les modifications
Examples
Les sections suivantes montrent comment utiliser la sync commande.
Synchroniser de manière incrémentielle les modifications de fichiers locaux dans un répertoire distant
Pour effectuer une synchronisation unidirectionnelle unique et unique des modifications de fichiers dans un répertoire local vers un dossier d’un espace de travail Azure Databricks distant, exécutez la sync commande, comme suit :
databricks sync <local-directory-path> <remote-directory-path>
Par exemple, pour effectuer une synchronisation unidirectionnelle et ponctuelle de toutes les modifications de fichier dans le dossier nommé my-local-folder dans le répertoire de travail actif local, vers le dossier my-workspace-folder de l’espace de travail distant, exécutez la commande suivante :
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder
Dans cet exemple, seules les modifications de fichier depuis la dernière exécution de la commande sync sont synchronisées avec /Users/someone@example.com/my-workspace-folder. Par défaut, l’URL de l’espace de travail dans le profil de l’appelant DEFAULT est utilisée pour déterminer l’espace de travail distant à synchroniser.
Synchroniser uniquement des fichiers spécifiques
Pour inclure ou exclure des fichiers spécifiques à synchroniser en fonction des modèles spécifiés, utilisez les options --include, --include-from, --exclude ou --exclude-from.
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore
Note
Si vous souhaitez synchroniser des fichiers dans un bundle, utilisez plutôt le sync mappage de configuration. Voir sync.
L’exemple suivant exclut certains modèles de fichiers de la synchronisation :
databricks sync --exclude "*.pyc" --exclude "__pycache__" ./my-local-folder /Users/someone@example.com/my-workspace-folder
Synchroniser de manière complète les modifications de fichiers locaux dans un répertoire distant
Pour effectuer une synchronisation unique et complète des modifications de fichiers dans un répertoire local vers un dossier d’un espace de travail Azure Databricks distant, quelle que soit la dernière sync commande exécutée, utilisez l’option --full , par exemple :
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full
Synchroniser de manière continue les modifications de fichiers locaux dans un répertoire distant
Pour activer la synchronisation continue et unidirectionnelle des modifications de fichiers dans un répertoire local, vers un dossier d’un espace de travail Azure Databricks distant, utilisez l’option --watch , par exemple :
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch
La synchronisation unidirectionnelle se poursuit jusqu’à ce que la commande soit arrêtée à partir du terminal, généralement en appuyant sur Ctrl + c ou Ctrl + z.
L’interrogation des événements de synchronisation possibles se produit une fois par seconde par défaut. Pour modifier cet intervalle, utilisez l’option --interval ainsi que le nombre de secondes à interroger suivi du caractère s, par exemple pour cinq secondes :
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s
Modifier le format de sortie de la progression de la synchronisation
Les informations de progression de la synchronisation sont générées par défaut dans le terminal au format texte. Pour spécifier le format de sortie de la progression de synchronisation, utilisez l’option --output, en spécifiant text (par défaut, si --output n’est pas spécifié autrement) ou json, par exemple :
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json
Aperçu des opérations de fichier pour une synchronisation
Pour afficher un aperçu d’une synchronisation sans effectuer réellement les opérations de synchronisation de fichiers, utilisez l’option --dry-run , par exemple :
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete
Indicateurs globaux
--debug
Active la journalisation du débogage.
-h ou --help
Affiche l’aide pour l’interface CLI de Databricks, le groupe de commandes associé ou la commande concernée.
--log-file chaîne
Chaîne représentant le fichier dans lequel écrire les journaux de sortie. Si cet indicateur n’est pas défini, les journaux de sortie sont écrits par défaut dans stderr.
--log-format format
Format des journaux : text ou json. La valeur par défaut est text.
--log-level chaîne
Chaîne représentant le niveau de journalisation. Si cet indicateur n’est pas défini, le niveau de format de journal est désactivé.
Type -o, --output
Type de sortie de commande, text ou json. La valeur par défaut est text.
-p, --profile chaîne
Nom du profil dans le ~/.databrickscfg fichier à utiliser pour exécuter la commande. Si cet indicateur n’est pas spécifié, s’il existe, le profil nommé DEFAULT est utilisé.
--progress-format format
Format d’affichage des journaux d’activité de progression : default, append, inplace ou json
-t, --target chaîne
Le cas échéant, la cible d’offre groupée à utiliser