Partager via


Commande sync

Note

Ces informations s’appliquent à Databricks CLI versions 0.205 et ultérieures. L’interface CLI Databricks est en préversion publique.

L’utilisation de l’interface CLI Databricks est soumise à la licence Databricks et à la notification de confidentialité Databricks, y compris les dispositions relatives aux données d’utilisation.

Le sync groupe de commandes dans l’interface CLI Databricks permet la synchronisation unidirectionnelle du code local et des modifications de fichiers dans un répertoire de votre ordinateur de développement local vers un dossier de votre espace de travail Azure Databricks distant.

Note

  • sync impossible de synchroniser les modifications de fichier d’un dossier dans un espace de travail Azure Databricks distant vers un répertoire sur votre ordinateur de développement local.
  • sync peut synchroniser les modifications de fichiers d’un ordinateur de développement local uniquement aux fichiers de l'utilisateur d’espace de travail (/Users) dans votre espace de travail Azure Databricks. Il ne peut pas se synchroniser avec des fichiers DBFS (dbfs:/). Pour synchroniser les modifications de fichier d’un ordinateur de développement local vers DBFS (dbfs:/) dans votre espace de travail Azure Databricks, utilisez l’utilitaire de synchronisation dbx .

synchronisation de Databricks

Synchronisez un répertoire local avec un répertoire d’espace de travail.

databricks sync [flags] SRC DST

Arguments

SRC

    Chemin d’accès au répertoire source

DST

    Chemin d’accès au répertoire de destination

Options

--dry-run

    Simuler l’exécution de la synchronisation sans apporter de modifications réelles

--exclude strings

    Modèles à exclure de la synchronisation (peuvent être spécifiés plusieurs fois)

--exclude-from string

    Fichier contenant des modèles à exclure de la synchronisation (un modèle par ligne)

--full

    Effectuer une synchronisation complète (la valeur par défaut est incrémentielle)

--include strings

    Modèles à inclure dans la synchronisation (peuvent être spécifiés plusieurs fois)

--include-from string

    Fichier contenant des modèles à inclure pour la synchronisation (un modèle par ligne)

--interval duration

    Intervalle d’interrogation du système de fichiers (pour --watch) (par défaut 1s)

--watch

    Regarder le système de fichiers local pour les modifications

Indicateurs globaux

Examples

Les sections suivantes montrent comment utiliser la sync commande.

Synchroniser de manière incrémentielle les modifications de fichiers locaux dans un répertoire distant

Pour effectuer une synchronisation unidirectionnelle unique et unique des modifications de fichiers dans un répertoire local vers un dossier d’un espace de travail Azure Databricks distant, exécutez la sync commande, comme suit :

databricks sync <local-directory-path> <remote-directory-path>

Par exemple, pour effectuer une synchronisation unidirectionnelle et ponctuelle de toutes les modifications de fichier dans le dossier nommé my-local-folder dans le répertoire de travail actif local, vers le dossier my-workspace-folder de l’espace de travail distant, exécutez la commande suivante :

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder

Dans cet exemple, seules les modifications de fichier depuis la dernière exécution de la commande sync sont synchronisées avec /Users/someone@example.com/my-workspace-folder. Par défaut, l’URL de l’espace de travail dans le profil de l’appelant DEFAULT est utilisée pour déterminer l’espace de travail distant à synchroniser.

Synchroniser uniquement des fichiers spécifiques

Pour inclure ou exclure des fichiers spécifiques à synchroniser en fonction des modèles spécifiés, utilisez les options --include, --include-from, --exclude ou --exclude-from.

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore

Note

Si vous souhaitez synchroniser des fichiers dans un bundle, utilisez plutôt le sync mappage de configuration. Voir sync.

L’exemple suivant exclut certains modèles de fichiers de la synchronisation :

databricks sync --exclude "*.pyc" --exclude "__pycache__" ./my-local-folder /Users/someone@example.com/my-workspace-folder

Synchroniser de manière complète les modifications de fichiers locaux dans un répertoire distant

Pour effectuer une synchronisation unique et complète des modifications de fichiers dans un répertoire local vers un dossier d’un espace de travail Azure Databricks distant, quelle que soit la dernière sync commande exécutée, utilisez l’option --full , par exemple :

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full

Synchroniser de manière continue les modifications de fichiers locaux dans un répertoire distant

Pour activer la synchronisation continue et unidirectionnelle des modifications de fichiers dans un répertoire local, vers un dossier d’un espace de travail Azure Databricks distant, utilisez l’option --watch , par exemple :

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch

La synchronisation unidirectionnelle se poursuit jusqu’à ce que la commande soit arrêtée à partir du terminal, généralement en appuyant sur Ctrl + c ou Ctrl + z.

L’interrogation des événements de synchronisation possibles se produit une fois par seconde par défaut. Pour modifier cet intervalle, utilisez l’option --interval ainsi que le nombre de secondes à interroger suivi du caractère s, par exemple pour cinq secondes :

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s

Modifier le format de sortie de la progression de la synchronisation

Les informations de progression de la synchronisation sont générées par défaut dans le terminal au format texte. Pour spécifier le format de sortie de la progression de synchronisation, utilisez l’option --output, en spécifiant text (par défaut, si --output n’est pas spécifié autrement) ou json, par exemple :

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json

Aperçu des opérations de fichier pour une synchronisation

Pour afficher un aperçu d’une synchronisation sans effectuer réellement les opérations de synchronisation de fichiers, utilisez l’option --dry-run , par exemple :

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete

Indicateurs globaux

--debug

  Active la journalisation du débogage.

-h ou --help

    Affiche l’aide pour l’interface CLI de Databricks, le groupe de commandes associé ou la commande concernée.

--log-file chaîne

    Chaîne représentant le fichier dans lequel écrire les journaux de sortie. Si cet indicateur n’est pas défini, les journaux de sortie sont écrits par défaut dans stderr.

--log-format format

    Format des journaux : text ou json. La valeur par défaut est text.

--log-level chaîne

    Chaîne représentant le niveau de journalisation. Si cet indicateur n’est pas défini, le niveau de format de journal est désactivé.

Type -o, --output

    Type de sortie de commande, text ou json. La valeur par défaut est text.

-p, --profile chaîne

    Nom du profil dans le ~/.databrickscfg fichier à utiliser pour exécuter la commande. Si cet indicateur n’est pas spécifié, s’il existe, le profil nommé DEFAULT est utilisé.

--progress-format format

    Format d’affichage des journaux d’activité de progression : default, append, inplace ou json

-t, --target chaîne

    Le cas échéant, la cible d’offre groupée à utiliser