Partager via


Déployer une application Databricks

Après avoir créé et développé votre application Azure Databricks, déployez-la pour la rendre accessible dans l’espace de travail Azure Databricks. Le déploiement génère votre application, installe des dépendances et l’exécute à l’aide de la configuration définie dans vos fichiers projet. Vous pouvez déployer des applications à l’aide de l’interface utilisateur Azure Databricks ou de l’interface CLI Databricks.

Remarque

Si vous créez une application à partir d’un modèle, Azure Databricks la déploie automatiquement lorsque vous la créez pour la première fois. Toutefois, vous pouvez toujours le redéployer ultérieurement après avoir apporté des modifications. Consultez Créer une application Databricks à partir d’un modèle.

Logique de déploiement

Databricks Apps prend en charge le déploiement d’applications qui utilisent Python, Node.jsou une combinaison des deux. Cela permet des architectures flexibles, telles qu’un front-end Node.js avec un back-end Python.

Pendant le déploiement, le processus de génération recherche un package.json fichier à la racine du répertoire de votre application pour déterminer si Node.js est utilisé. S'il est présent, il inclut des étapes de construction spécifiques à Node.js ainsi que des étapes Python. La logique de déploiement suit ce modèle :

S’il package.json est présent :

  1. Exécutez npm install
  2. Exécuter pip install -r requirements.txt (s’il existe)
  3. Exécuter npm run build (si un build script est défini dans package.json)
  4. Exécutez la commande spécifiée dans app.yaml, ou npm run start si aucune commande n’est spécifiée

Remarque

Si aucune commande n’est spécifiée, app.yamlAzure Databricks npm run starts’exécute, même si l’application inclut du code Python. Pour exécuter à la fois Python et Node.js processus, définissez un script personnalisé start qui utilise un outil comme concurrently pour lancer les deux. Par exemple : concurrently "npm run start:node" "python my_app.py".

Si package.json n’est pas présent :

  1. Exécuter pip install -r requirements.txt (s’il existe)
  2. Exécutez la commande spécifiée dans app.yaml, ou python <my-app>.py si aucune commande n’est spécifiée

Préparer le déploiement

Avant de déployer votre application, vérifiez que votre projet inclut les composants nécessaires :

En outre, assurez-vous que le service principal de l'application a accès au dossier de code source.

Choisir une source de déploiement

Vous pouvez déployer des applications Databricks à partir des sources suivantes :

  • Dossier de l’espace de travail : chargez des fichiers d’application dans un dossier d’espace de travail et déployez-y. Il s’agit de la méthode de déploiement standard.
  • Dépôt Git : configurez un référentiel Git pour une application et déployez directement sans charger de fichiers dans l’espace de travail. L’application lit le code de la référence Git configurée (branche, balise ou validation) chaque fois que vous déployez. Tous les principaux fournisseurs Git sont pris en charge, notamment GitHub, GitLab et Bitbucket. Pour obtenir la liste complète des fournisseurs pris en charge, consultez Connecter votre fournisseur Git à Databricks.

Vous pouvez basculer entre l’espace de travail et les sources Git pour la même application à tout moment.

Déployer l’application

Les sections suivantes décrivent comment déployer à partir d’un dossier d’espace de travail ou directement à partir d’un dépôt Git.

Déployer à partir d’un dossier d’espace de travail

Interface utilisateur Databricks

Pour déployer une application à partir de l’interface utilisateur Azure Databricks :

  1. Chargez les fichiers d’application dans votre espace de travail Azure Databricks. Pour obtenir des instructions, consultez Importer un fichier.
  2. Cliquez sur icône de calculCalcul dans la barre latérale.
  3. Accédez à l’onglet Applications , puis cliquez sur le lien vers votre application dans la colonne Nom .
  4. Cliquez sur Déployer et sélectionnez le dossier dans votre espace de travail où vous avez chargé les fichiers d’application.
  5. Cliquez sur Sélectionner, puis Déployer.
  6. Passez en revue la configuration, puis cliquez sur Déployer.

Interface CLI de Databricks

Pour déployer une application à l’aide de l’interface CLI :

  1. Ouvrez un terminal et accédez au répertoire qui contient vos fichiers d’application.

  2. Chargez vos fichiers d’application dans l’espace de travail Azure Databricks à l’aide de la sync commande. Remplacez le chemin d’accès par l’emplacement de l’espace de travail où vous souhaitez charger les fichiers.

    databricks sync --watch . /Workspace/Users/my-email@org.com/my-app
    

    L’indicateur --watch conserve le processus de synchronisation en cours d’exécution et charge automatiquement les modifications lorsque vous modifiez des fichiers localement. Pour exclure des fichiers ou répertoires spécifiques de la synchronisation, ajoutez-les à un .gitignore fichier dans votre répertoire d’application local. Les fichiers courants à exclure sont node_modules/, , .env__pycache__/, .DS_Storeet tous les fichiers de données volumineux ou artefacts de build.

  3. Vérifiez le chargement en affichant les fichiers dans votre espace de travail. Cliquez sur l'icône Espace de travail dans la barre latérale et accédez au répertoire que vous avez créé pour votre application.

  4. Déployez l’application en exécutant la commande suivante. Remplacez le nom de l’application et le chemin du code source par vos valeurs.

    databricks apps deploy my-app-name \
       --source-code-path /Workspace/Users/my-email@org.com/my-app
    

    L’interface CLI affiche la progression du déploiement et confirme l’exécution de l’application.

Déployer à partir d’un référentiel Git

Important

Cette fonctionnalité est en version bêta. Si un administrateur désactive la fonctionnalité, les applications existantes déployées à partir de Git continuent à s’exécuter, mais vous ne pouvez pas les redéployer ou les redémarrer tant que vous n’avez pas réactivé la préversion ou supprimé le référentiel de l’application.

Pour déployer une application à partir d’un référentiel Git, ajoutez le référentiel au niveau de l’application, puis spécifiez la référence Git lorsque vous la déployez. Votre référentiel Git doit contenir les fichiers d’application, notamment app.yamlles dépendances et le point d’entrée. Tous les principaux fournisseurs Git sont pris en charge, notamment GitHub, GitLab et Bitbucket.

Pour configurer et déployer une application à partir de Git :

  1. Chargez vos fichiers d’application dans un dépôt Git.
  2. À partir de votre espace de travail Azure Databricks, cliquez sur l’icône calculdans la barre latérale.
  3. Accédez à l’onglet Applications et sélectionnez une application existante à modifier ou cliquez sur Créer une application.
  4. Dans l’étape Configurer le dépôt Git , entrez l’URL du dépôt Git (par exemple https://github.com/org/repo) et sélectionnez un fournisseur Git.
  5. Cliquez sur Créer une application ou Enregistrer pour revenir à la page des détails de l’application.
  6. Pour les dépôts privés, le principal de service de l’application doit avoir des informations d’identification Git configurées. Dans la page des détails de l’application, cliquez sur Configurer les informations d’identification Git. Vous pouvez également modifier l’application et ajouter les informations d’identification à l’étape Configurer le référentiel Git . Vous devez disposer CAN MANAGE d’autorisations sur l’application pour ajouter des informations d’identification Git. Pour obtenir des instructions pour chaque fournisseur, consultez Connecter votre fournisseur Git à Databricks.

Important

Pour la sécurité, Azure Databricks supprime toutes les informations d’identification Git associées au principal de service de l’application lorsque vous modifiez la source de déploiement (de Git à l’espace de travail ou à l’espace de travail vers Git) ou lorsque vous modifiez le référentiel Git. La modification de la référence Git ne supprime pas les informations d’identification. Après avoir modifié la source ou le référentiel de déploiement, vous devez reconfigurer les informations d’identification Git pour effectuer le déploiement à partir de Git à nouveau.

Remarque

Les créateurs d’applications reçoivent CAN MANAGE automatiquement des autorisations sur le principal de service uniquement lorsque la fonctionnalité bêta du déploiement Git est activée. Si vous avez créé une application pendant la désactivation de la fonctionnalité, vous n’avez peut-être pas l’autorisation d’ajouter des informations d’identification Git.

Les entités de service prennent en charge un identifiant Git par fournisseur. La mise à jour d’informations d’identification, par exemple via la console de compte, remplace les informations d’identification existantes pour ce fournisseur et affecte toutes les applications utilisant ce principal de service avec ce fournisseur.

Ensuite, déployez l’application :

  1. Dans la page des détails de l’application, cliquez sur Déployer.
  2. Sélectionnez Depuis Git.
  3. Pour référence Git, entrez le nom de la branche, la balise ou la validation SHA (par exemple, main, v1.0.0ou un hachage de validation).
  4. Pour le Reference type, spécifiez le type de référence, tel qu’une branche, un tag ou un commit.
  5. Cliquez sur Déployer.

Pour les références de branche ou de balise, Azure Databricks déploie le commit le plus récent de cette branche ou de cette balise. Pour les références SHA de validation, Azure Databricks déploie toujours cette validation spécifique. Si les informations d’identification Git du principal de service ne sont pas valides ou ont expiré, le déploiement échoue.

Comportement après le déploiement

Une fois le déploiement terminé, Azure Databricks démarre votre application en fonction de la valeur définie command dans votre app.yaml fichier ou des valeurs par défaut en cours d’exécution python app.py. La page détails de l’application affiche l’état actuel et fournit l’accès aux journaux, à l’historique du déploiement et aux informations d’environnement.

Afficher la page de détails de l’application après le déploiement de l’application

Pour afficher la sortie de l’application déployée, cliquez sur le lien de l’application.

Accédez à l’onglet Journaux pour le débogage et la surveillance du runtime. Consultez la journalisation et la surveillance des applications Databricks.

Mettre à jour ou redéployer l’application

Redéployez votre application après avoir apporté des modifications au code source ou à la configuration. Le redéploiement applique vos dernières mises à jour sans recréer l’application. Vous pouvez redéployer à partir de l’espace de travail ou du référentiel Git à tout moment.

Redéployer à partir d’un dossier d’espace de travail

Pour redéployer à partir d’un dossier d’espace de travail :

  1. Mettez à jour vos fichiers d’application dans le dossier de l’espace de travail.
  2. Sélectionnez l’application, puis cliquez sur Déployer.
  3. Si le chemin du code source a changé ou que vous passez d’une source Git, cliquez sur la flèche en regard de Déployer et sélectionnez Déployer à l’aide d’une autre source.

Redéployer à partir d’un référentiel Git

Pour redéployer à partir d’un dépôt Git :

  1. Envoyez vos modifications au dépôt Git.
  2. Dans votre espace de travail Azure Databricks, sélectionnez votre application, puis cliquez sur Déployer.
  3. Si la référence Git a changé ou que vous passez d’une source d’espace de travail, cliquez sur la flèche en regard de Déployer et sélectionnez Déployer à l’aide d’une autre source.

Pour modifier le référentiel Git ou les informations d’identification, modifiez la configuration de l’application. La suppression du référentiel Git de l'application impose le déploiement depuis l'espace de travail.

Important

La modification du référentiel Git ou le basculement entre les sources de déploiement (Git et l’espace de travail) supprime toutes les informations d’identification Git pour le principal de service de l’application. Vous devez reconfigurer les informations d’identification avant de déployer à nouveau à partir de Git.

Résoudre les problèmes de déploiement

Si votre application ne parvient pas à déployer ou ne s’exécute pas comme prévu, essayez les étapes de résolution des problèmes suivantes :

  • Vérifiez les logs pour les messages d'erreur ou la sortie d'exécution.
  • Validez la app.yaml syntaxe et les paramètres.
  • Vérifiez que les secrets et les variables d’environnement de la env section sont résolus correctement.
  • Vérifiez que toutes les dépendances requises sont incluses ou installées.

Pour les déploiements de référentiel Git :

  • Pour les référentiels privés, vérifiez que l’entité de service de l’application a des informations d'identification Git configurées.
  • Vérifiez que l’URL du dépôt Git est correcte.
  • Vérifiez que la référence Git (branche, balise ou validation) existe dans le référentiel.

Étapes suivantes