Partager via


Tutoriel : Créer et déployer un bundle dans l’espace de travail

Pour vous aider à commencer à utiliser les Asset Bundles de Databricks dans l'espace de travail, ce tutoriel vous guide dans la création d’un bundle avec un travail, son déploiement et l’exécution du travail dans le bundle, le tout depuis l'espace de travail.

Pour connaître les conditions requises pour l’utilisation d’offres groupées dans l’espace de travail, consultez Les bundles de ressources Databricks dans les conditions requises pour l’espace de travail.

Pour plus d’informations sur les offres groupées, consultez Qu’est-ce que databricks Asset Bundles ?.

Créer un bundle

Tout d’abord, créez un bundle dans l’espace de travail Databricks :

  1. Accédez au dossier Git dans lequel vous souhaitez créer votre bundle.

    Conseil / Astuce

    Si vous avez déjà ouvert le dossier Git dans l’éditeur de l’espace de travail, vous pouvez utiliser le menu contextuel de création du navigateur d’espace de travail pour accéder rapidement au dossier Git. Consultez les contextes de création.

  2. Cliquez sur le bouton Créer , puis sur Groupe de ressources. Vous pouvez également cliquer avec le bouton droit sur le dossier Git ou sur son kebab associé dans l’arborescence de l’espace de travail, puis cliquez sur Créer> unensemble de ressources :

    Créer un ensemble de ressources

  3. Dans la boîte de dialogue Créer un bundle d'actifs, donnez un nom au bundle, tel que totally-awesome-bundle. Le nom du bundle ne peut contenir que des lettres, des chiffres, des traits d'union et des traits de soulignement. Sélectionnez Projet vide , puis cliquez sur Créer et déployer .

    Boîte de dialogue Créer un paquet de ressources

Cela crée un bundle initial dans le dossier Git, qui inclut un .gitignore fichier de configuration Git et le fichier Databricks Asset Bundles databricks.yml requis. Le databricks.yml fichier contient la configuration principale de l’offre groupée. Pour plus d’informations, consultez la configuration de Databricks Asset Bundle.

Nouveau bundle de ressources

Ajouter un bloc-notes

Ensuite, ajoutez un bloc-notes à votre pack. Le bloc-notes de l’exemple suivant imprime « Hello World ! ».

  1. Cliquez sur la vignette de projet groupé Ajouter un notebook. Vous pouvez également cliquer sur le kebab du bundle dans la table des matières, puis sur Créer un>bloc-notes.

  2. Renommez le bloc-notes en helloworld.

  3. Définissez la langue du bloc-notes sur Python et collez les éléments suivants dans la cellule du bloc-notes :

    print("Hello World!")
    

Définir un travail

Définissez maintenant un travail qui exécute le notebook.

  1. Cliquez sur l’icône de déploiement du bundle pour basculer vers le panneau Déploiements .

    Icône du panneau Déploiements

  2. Dans la section Ressources groupées , cliquez sur Ajouter, puis Nouvelle définition de travail.

    Créer une définition de travail

  3. Tapez run-notebook dans le champ Nom du travail de la fenêtre de dialogue Ajouter un travail à un bundle existant. Cliquez sur Ajouter et déployer.

  4. Une boîte de dialogue De confirmation de déploiement pour le développement s’affiche avec des informations sur la ressource de travail qui sera créée dans l’espace de travail cible de développement. Cliquez sur Déployer.

  5. Revenez aux fichiers du bundle en cliquant sur l’icône de dossier au-dessus de l’icône déploiements. Une ressource d'emploi run-notebook.job.yml a été créée avec du YAML de base pour le poste et un exemple de tâche de travail YAML supplémentaire commenté.

  6. Ajoutez une tâche de bloc-notes à la définition du travail. Remplacez l’exemple YAML dans le run-notebook.job.yml fichier par les éléments suivants :

    resources:
      jobs:
        run_notebook:
          name: run-notebook
          queue:
            enabled: true
          tasks:
            - task_key: my-notebook-task
              notebook_task:
                notebook_path: ../helloworld.ipynb
    

    Configuration de tâche de bloc-notes de travail YAML

Pour plus d’informations sur la définition d’un travail dans YAML, consultez travail. Pour obtenir la syntaxe YAML pour d’autres types de tâches de travail pris en charge, consultez Ajouter des tâches à des travaux dans Databricks Asset Bundles.

Déployer l’offre groupée

Ensuite, déployez le bundle et exécutez le travail qui contient la tâche de helloworld notebook.

  1. Dans le volet Déploiements de l’offre groupée sous Cibles, cliquez sur la liste déroulante pour sélectionner l’espace dev de travail cible s’il n’est pas déjà sélectionné. Les espaces de travail cibles sont définis dans la targets cartographie de l’ensemble databricks.yml. Consultez les modes de déploiement de Databricks Asset Bundle .

    Choisir le déploiement cible

  2. Cliquez sur le bouton Déployer . Le bundle est validé et les détails de la validation s’affichent dans une boîte de dialogue.

  3. Passez en revue les détails du déploiement dans cette boîte de dialogue De confirmation de déploiement pour le développement , puis cliquez sur Déployer.

    Dialogue Déployer sur dev

    Importante

    Le déploiement de paquets et l’exécution de ressources dans ces paquets exécutent du code en tant qu’utilisateur actuel. Vérifiez que vous approuvez le code dans le bundle, y compris YAML, qui peut contenir des paramètres de configuration qui exécutent des commandes.

L’état du déploiement est généré dans la fenêtre de sortie du projet .

Exécuter le travail

Les ressources groupées déployées sont répertoriées sous Ressources groupées. Cliquez sur l’icône de lecture associée à la ressource de travail pour l’exécuter.

Répertorier les ressources déployées

Accédez à Exécutions de tâches depuis la barre de navigation de gauche pour voir l’exécution du paquet. Le nom de l’exécution du travail groupé est préfixé, par exemple [dev someone] run-notebook.

Étapes suivantes