Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Après avoir créé et développé votre application Azure Databricks, déployez-la pour la rendre accessible dans l’espace de travail Azure Databricks. Le déploiement génère votre application, installe des dépendances et l’exécute à l’aide de la configuration définie dans vos fichiers projet. Vous pouvez déployer des applications à l’aide de l’interface utilisateur Azure Databricks ou de l’interface CLI Databricks.
Remarque
Si vous créez une application à partir d’un modèle, Azure Databricks la déploie automatiquement lorsque vous la créez pour la première fois. Toutefois, vous pouvez toujours le redéployer ultérieurement après avoir apporté des modifications. Consultez Créer une application Databricks à partir d’un modèle.
Logique de déploiement
Databricks Apps prend en charge le déploiement d’applications qui utilisent Python, Node.jsou une combinaison des deux. Cela permet des architectures flexibles, telles qu’un front-end Node.js avec un back-end Python.
Pendant le déploiement, le processus de génération recherche un package.json fichier à la racine du répertoire de votre application pour déterminer si Node.js est utilisé. S'il est présent, il inclut des étapes de construction spécifiques à Node.js ainsi que des étapes Python. La logique de déploiement suit ce modèle :
S’il package.json est présent :
- Exécutez
npm install - Exécuter
pip install -r requirements.txt(s’il existe) - Exécuter
npm run build(si unbuildscript est défini danspackage.json) - Exécutez la commande spécifiée dans
app.yaml, ounpm run startsi aucune commande n’est spécifiée
Remarque
Si aucune commande n’est spécifiée, app.yamlAzure Databricks npm run starts’exécute, même si l’application inclut du code Python. Pour exécuter à la fois Python et Node.js processus, définissez un script personnalisé start qui utilise un outil comme concurrently pour lancer les deux. Par exemple : concurrently "npm run start:node" "python my_app.py".
Si package.json n’est pas présent :
- Exécuter
pip install -r requirements.txt(s’il existe) - Exécutez la commande spécifiée dans
app.yaml, oupython <my-app>.pysi aucune commande n’est spécifiée
Préparer le déploiement
Avant de déployer votre application, vérifiez que votre projet inclut les composants nécessaires :
-
Script principal : votre fichier de point d’entrée, tel que
app.pyouapp.js. -
Fichier facultatif
app.yaml: si votre application nécessite une commande personnalisée ou des variables d’environnement, incluez unapp.yamlfichier pour configurer l’exécution. Consultez Configurer l’exécution de l’application Databricks avecapp.yaml. - Dépendances : vérifiez que toutes les dépendances sont disponibles. Consultez Gérer les dépendances pour une application Databricks.
-
Valeurs de secrets ou d’environnement : si vous utilisez la
envsection dansapp.yaml, vérifiez que les secrets référencés ou les sources externes sont correctement configurés et accessibles. Consultez Ajouter des ressources à une application Databricks.
En outre, assurez-vous que le service principal de l'application a accès au dossier de code source.
Choisir une source de déploiement
Vous pouvez déployer des applications Databricks à partir des sources suivantes :
- Dossier de l’espace de travail : chargez des fichiers d’application dans un dossier d’espace de travail et déployez-y. Il s’agit de la méthode de déploiement standard.
- Dépôt Git : configurez un référentiel Git pour une application et déployez directement sans charger de fichiers dans l’espace de travail. L’application lit le code de la référence Git configurée (branche, balise ou validation) chaque fois que vous déployez. Tous les principaux fournisseurs Git sont pris en charge, notamment GitHub, GitLab et Bitbucket. Pour obtenir la liste complète des fournisseurs pris en charge, consultez Connecter votre fournisseur Git à Databricks.
Vous pouvez basculer entre l’espace de travail et les sources Git pour la même application à tout moment.
Déployer l’application
Les sections suivantes décrivent comment déployer à partir d’un dossier d’espace de travail ou directement à partir d’un dépôt Git.
Déployer à partir d’un dossier d’espace de travail
Interface utilisateur Databricks
Pour déployer une application à partir de l’interface utilisateur Azure Databricks :
- Chargez les fichiers d’application dans votre espace de travail Azure Databricks. Pour obtenir des instructions, consultez Importer un fichier.
- Cliquez sur
Calcul dans la barre latérale. - Accédez à l’onglet Applications , puis cliquez sur le lien vers votre application dans la colonne Nom .
- Cliquez sur Déployer et sélectionnez le dossier dans votre espace de travail où vous avez chargé les fichiers d’application.
- Cliquez sur Sélectionner, puis Déployer.
- Passez en revue la configuration, puis cliquez sur Déployer.
Interface CLI de Databricks
Pour déployer une application à l’aide de l’interface CLI :
Ouvrez un terminal et accédez au répertoire qui contient vos fichiers d’application.
Chargez vos fichiers d’application dans l’espace de travail Azure Databricks à l’aide de la
synccommande. Remplacez le chemin d’accès par l’emplacement de l’espace de travail où vous souhaitez charger les fichiers.databricks sync --watch . /Workspace/Users/my-email@org.com/my-appL’indicateur
--watchconserve le processus de synchronisation en cours d’exécution et charge automatiquement les modifications lorsque vous modifiez des fichiers localement. Pour exclure des fichiers ou répertoires spécifiques de la synchronisation, ajoutez-les à un.gitignorefichier dans votre répertoire d’application local. Les fichiers courants à exclure sontnode_modules/, ,.env__pycache__/,.DS_Storeet tous les fichiers de données volumineux ou artefacts de build.Vérifiez le chargement en affichant les fichiers dans votre espace de travail. Cliquez sur l'icône
dans la barre latérale et accédez au répertoire que vous avez créé pour votre application.Déployez l’application en exécutant la commande suivante. Remplacez le nom de l’application et le chemin du code source par vos valeurs.
databricks apps deploy my-app-name \ --source-code-path /Workspace/Users/my-email@org.com/my-appL’interface CLI affiche la progression du déploiement et confirme l’exécution de l’application.
Déployer à partir d’un référentiel Git
Important
Cette fonctionnalité est en version bêta. Si un administrateur désactive la fonctionnalité, les applications existantes déployées à partir de Git continuent à s’exécuter, mais vous ne pouvez pas les redéployer ou les redémarrer tant que vous n’avez pas réactivé la préversion ou supprimé le référentiel de l’application.
Pour déployer une application à partir d’un référentiel Git, ajoutez le référentiel au niveau de l’application, puis spécifiez la référence Git lorsque vous la déployez. Votre référentiel Git doit contenir les fichiers d’application, notamment app.yamlles dépendances et le point d’entrée. Tous les principaux fournisseurs Git sont pris en charge, notamment GitHub, GitLab et Bitbucket.
Pour configurer et déployer une application à partir de Git :
- Chargez vos fichiers d’application dans un dépôt Git.
- À partir de votre espace de travail Azure Databricks, cliquez sur
dans la barre latérale. - Accédez à l’onglet Applications et sélectionnez une application existante à modifier ou cliquez sur Créer une application.
- Dans l’étape Configurer le dépôt Git , entrez l’URL du dépôt Git (par exemple
https://github.com/org/repo) et sélectionnez un fournisseur Git. - Cliquez sur Créer une application ou Enregistrer pour revenir à la page des détails de l’application.
- Pour les dépôts privés, le principal de service de l’application doit avoir des informations d’identification Git configurées. Dans la page des détails de l’application, cliquez sur Configurer les informations d’identification Git. Vous pouvez également modifier l’application et ajouter les informations d’identification à l’étape Configurer le référentiel Git . Vous devez disposer
CAN MANAGEd’autorisations sur l’application pour ajouter des informations d’identification Git. Pour obtenir des instructions pour chaque fournisseur, consultez Connecter votre fournisseur Git à Databricks.
Important
Pour la sécurité, Azure Databricks supprime toutes les informations d’identification Git associées au principal de service de l’application lorsque vous modifiez la source de déploiement (de Git à l’espace de travail ou à l’espace de travail vers Git) ou lorsque vous modifiez le référentiel Git. La modification de la référence Git ne supprime pas les informations d’identification. Après avoir modifié la source ou le référentiel de déploiement, vous devez reconfigurer les informations d’identification Git pour effectuer le déploiement à partir de Git à nouveau.
Remarque
Les créateurs d’applications reçoivent CAN MANAGE automatiquement des autorisations sur le principal de service uniquement lorsque la fonctionnalité bêta du déploiement Git est activée. Si vous avez créé une application pendant la désactivation de la fonctionnalité, vous n’avez peut-être pas l’autorisation d’ajouter des informations d’identification Git.
Les entités de service prennent en charge un identifiant Git par fournisseur. La mise à jour d’informations d’identification, par exemple via la console de compte, remplace les informations d’identification existantes pour ce fournisseur et affecte toutes les applications utilisant ce principal de service avec ce fournisseur.
Ensuite, déployez l’application :
- Dans la page des détails de l’application, cliquez sur Déployer.
- Sélectionnez Depuis Git.
- Pour référence Git, entrez le nom de la branche, la balise ou la validation SHA (par exemple,
main,v1.0.0ou un hachage de validation). - Pour le Reference type, spécifiez le type de référence, tel qu’une branche, un tag ou un commit.
- Cliquez sur Déployer.
Pour les références de branche ou de balise, Azure Databricks déploie le commit le plus récent de cette branche ou de cette balise. Pour les références SHA de validation, Azure Databricks déploie toujours cette validation spécifique. Si les informations d’identification Git du principal de service ne sont pas valides ou ont expiré, le déploiement échoue.
Comportement après le déploiement
Une fois le déploiement terminé, Azure Databricks démarre votre application en fonction de la valeur définie command dans votre app.yaml fichier ou des valeurs par défaut en cours d’exécution python app.py. La page détails de l’application affiche l’état actuel et fournit l’accès aux journaux, à l’historique du déploiement et aux informations d’environnement.
Pour afficher la sortie de l’application déployée, cliquez sur le lien de l’application.
Accédez à l’onglet Journaux pour le débogage et la surveillance du runtime. Consultez la journalisation et la surveillance des applications Databricks.
Mettre à jour ou redéployer l’application
Redéployez votre application après avoir apporté des modifications au code source ou à la configuration. Le redéploiement applique vos dernières mises à jour sans recréer l’application. Vous pouvez redéployer à partir de l’espace de travail ou du référentiel Git à tout moment.
Redéployer à partir d’un dossier d’espace de travail
Pour redéployer à partir d’un dossier d’espace de travail :
- Mettez à jour vos fichiers d’application dans le dossier de l’espace de travail.
- Sélectionnez l’application, puis cliquez sur Déployer.
- Si le chemin du code source a changé ou que vous passez d’une source Git, cliquez sur la flèche en regard de Déployer et sélectionnez Déployer à l’aide d’une autre source.
Redéployer à partir d’un référentiel Git
Pour redéployer à partir d’un dépôt Git :
- Envoyez vos modifications au dépôt Git.
- Dans votre espace de travail Azure Databricks, sélectionnez votre application, puis cliquez sur Déployer.
- Si la référence Git a changé ou que vous passez d’une source d’espace de travail, cliquez sur la flèche en regard de Déployer et sélectionnez Déployer à l’aide d’une autre source.
Pour modifier le référentiel Git ou les informations d’identification, modifiez la configuration de l’application. La suppression du référentiel Git de l'application impose le déploiement depuis l'espace de travail.
Important
La modification du référentiel Git ou le basculement entre les sources de déploiement (Git et l’espace de travail) supprime toutes les informations d’identification Git pour le principal de service de l’application. Vous devez reconfigurer les informations d’identification avant de déployer à nouveau à partir de Git.
Résoudre les problèmes de déploiement
Si votre application ne parvient pas à déployer ou ne s’exécute pas comme prévu, essayez les étapes de résolution des problèmes suivantes :
- Vérifiez les logs pour les messages d'erreur ou la sortie d'exécution.
- Validez la
app.yamlsyntaxe et les paramètres. - Vérifiez que les secrets et les variables d’environnement de la
envsection sont résolus correctement. - Vérifiez que toutes les dépendances requises sont incluses ou installées.
Pour les déploiements de référentiel Git :
- Pour les référentiels privés, vérifiez que l’entité de service de l’application a des informations d'identification Git configurées.
- Vérifiez que l’URL du dépôt Git est correcte.
- Vérifiez que la référence Git (branche, balise ou validation) existe dans le référentiel.