Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Databricks Apps vous permet de créer des applications de données et d’IA sécurisées sur la plateforme Databricks que vous pouvez facilement partager avec des utilisateurs. En développant une application Databricks avec PySpark et Databricks Connect, vous pouvez tirer parti de la puissance d’Apache Spark dans votre application. Comme pour un pilote JDBC, Databricks Connect peut être incorporé dans n’importe quelle application pour interagir avec Databricks. De plus, Databricks Connect fournit l’expressivité complète de Python via PySpark, ce qui vous permet d’exécuter toutes les transformations de données avec Spark sur le calcul Databricks.
Pour plus d’informations sur les applications et Databricks Connect, consultez Databricks Apps et Qu’est-ce que Databricks Connect ?.
Ce tutoriel explique comment créer une application Databricks simple dans l’espace de travail Databricks, puis la développer localement à l’aide de Databricks Connect. L’application s’exécute sur un calcul serverless avec Python 3.11 et Databricks Connect 15.4.*. Pour utiliser une autre version, la version de Python et les versions Databricks Connect doivent être compatibles. Consultez les versions de Databricks Connect.
Conseil / Astuce
Pour obtenir un exemple d’application plus avancé qui utilise Databricks Connect, consultez le référentiel GitHub Databricks Demos.
Spécifications
- Votre espace de travail Databricks et votre environnement de développement local doivent répondre aux exigences de Databricks Apps. Consultez Configurer votre espace de travail Databricks Apps et votre environnement de développement.
- Votre espace de travail Databricks doit avoir Unity Catalog et le calcul serverless activés.
- Databricks CLI version 0.250.0 ou ultérieure est installée sur votre ordinateur local. Pour vérifier la version de Databricks CLI installée, exécutez la commande
databricks -v. Pour installer l’interface CLI Databricks, consultez Installer ou mettre à jour l’interface CLI Databricks. - Python 3.11 est installé sur votre ordinateur local.
Étape 1 : Configurer l’authentification et le calcul serverless
Ce tutoriel utilise le calcul sans serveur et l'authentification utilisateur-machine (U2M) Databricks OAuth ainsi qu'un profil de configuration Databricks pour authentifier votre espace de travail Databricks.
Utilisez l’interface CLI Databricks pour lancer la connexion OAuth en exécutant la commande suivante. Utilisez DEFAULT le nom du profil et suivez les instructions à l’écran pour vous connecter à votre espace de travail Databricks.
databricks auth login --configure-serverless --host <workspace-url>
Étape 2 : Créer une application
Créez maintenant une application Databricks dans l’espace de travail.
Dans votre espace de travail Databricks, cliquez sur + Nouvelle>application dans la barre latérale gauche.
Sous Installer à partir d’un modèle, accédez à l’onglet Dash.
Choisissez le modèle Hello World .
Nommez l’application dash-hello-world , puis cliquez sur Installer.
Cela crée une application basée sur le modèle sélectionné, la déploie sur votre espace de travail et la démarre. Pour afficher l’application, cliquez sur l’URL en cours d’exécution en haut de la page Vue d’ensemble :
Étape 3 : Copier l’application sur votre ordinateur local
Ensuite, téléchargez le code source de l’application sur votre ordinateur local.
Copiez la première commande sous Synchroniser les fichiers sur la page de l’application.
Dans un terminal local, créez un répertoire
dash-hello-world, puis exécutez la commande copiée, par exemple :mkdir dash-hello-world cd dash-hello-world databricks workspace export-dir /Workspace/Users/someone@example.com/databricks_apps/dash-hello-world_2025_12_01-18_38/dash-hello-world-app .
La commande copie deux nouveaux fichiers dans le répertoire nommé app.py et app.yaml.
app.yaml définit la configuration de l’application, y compris son point d’entrée et ses autorisations.
app.py contient le code qui implémente les fonctionnalités et l’interface utilisateur de l’application.
Étape 4 : Ajouter Databricks Connect
Créez un environnement virtuel Python pour votre application Databricks et ajoutez-y databricks-connect en tant qu’exigence.
Créez un environnement virtuel appelé
.myvenvà la racine du dossier du projet et activez-le :python3.11 -m venv .myvenv source .myvenv/bin/activateMettez à jour les dépendances de votre application dans le
requirements.txtde votre projet. Ajouterdatabricks-connect==15.4.*:dash== 3.3.* dash-bootstrap-components==2.0.* pandas plotly==6.5.* databricks-sql-connector databricks-sdk python-dotenv dash-ag-grid databricks-connect==15.4.*Installez les dépendances dans
requirements.txtdans votre environnement virtuel :pip install -r requirements.txt
Étape 5 : Modifier l’application et tester localement
Personnalisez et développez votre application localement.
Mettez à jour
app.pypour lire des données à partir de Databricks à l’aide de Databricks Connect et tirez parti d’Apache Spark pour effectuer des transformations de données. En outre, ajoutez du code pour rendre les données interactives, ajoutez une option de style et autorisez les chargements de données.# app.py import pandas as pd from dash import Dash, dcc, html import plotly.express as px import dash_bootstrap_components as dbc from databricks.connect.session import DatabricksSession from pyspark.sql.functions import col spark = DatabricksSession.builder.serverless().getOrCreate() # Data transformations with Spark in Python df = (spark.read.table("samples.nyctaxi.trips") .select('trip_distance', 'fare_amount') .filter(col('trip_distance') < 10) .limit(1000)) chart_data = df.toPandas() # Initialize the Dash app with Bootstrap styling dash_app = Dash(__name__, external_stylesheets=[dbc.themes.BOOTSTRAP]) # Define the app layout dash_app.layout = dbc.Container([ dbc.Row([dbc.Col(html.H1('Trip cost by distance'), width=12)]), dcc.Graph( id='fare-scatter', figure=px.scatter(chart_data, x='trip_distance', y='fare_amount', labels={'trip_distance': 'Trip distance (miles)', 'fare_amount': 'Fare amount (USD)'}, template='simple_white'), style={'height': '500px', 'width': '1000px'} ) ], fluid=True) if __name__ == '__main__': dash_app.run(debug=True)Exécutez et testez votre application localement. Vous pouvez utiliser Python ou l’interface CLI Databricks pour l’exécuter.
Exécutez l’application Python.
python app.pyAccédez à
http://127.0.0.1:8050/dans une fenêtre de navigateur pour voir l’application.Vous pouvez également utiliser la
databricks apps run-localcommande pour exécuter et déboguer l’application. Cette commande installe toutes les dépendances et prépare l’environnement virtuel, puis démarre l’application et le débogueur sur le port 5678.databricks apps run-local --prepare-environment --debugAccédez à http://localhost:8001 dans une fenêtre de navigateur pour voir l’application.
Pour définir des points d’arrêt dans Visual Studio Code, installez l’extension du débogueur Python, puis accédez à Exécuter>Démarrer le débogage>Attacher à distance.
Étape 6 : Redéployer l’application
Enfin, téléchargez votre application modifiée localement dans votre espace de travail Databricks et réalisez son déploiement sur les ressources de calcul.
Important
Pour éviter de charger l’ensemble de votre environnement virtuel Python dans Databricks, votre projet doit contenir un fichier .gitignore à la racine comportant .myvenv, ou être placé dans le dossier .myvenv qui exclut ces fichiers.
Dans votre espace de travail Databricks, cliquez sur Calcul, puis Applications. Sélectionnez l’application
dash-hello-world.Sous Synchroniser les fichiers, copiez la commande sous Synchroniser les modifications ultérieures vers Databricks et exécutez-la à partir du dossier de projet d’application local :
databricks sync --watch . /Workspace/Users/someone@example.com/databricks_apps/dash-hello-world_2025_12_05-21_35/dash-hello-world-appPour déployer l’application modifiée sur la plateforme de calcul, copiez la commande sous Déployer vers les applications Databricks sur la page de l’application et exécutez-la à partir du dossier de votre projet d’application local :
databricks apps deploy dash-hello-world --source-code-path /Workspace/Users/someone@example.com/databricks_apps/dash-hello-world_2025_12_05-21_35/dash-hello-world-app
Si le déploiement réussit, la commande génère la confirmation JSON :
{
"create_time": "2025-12-06T01:30:16Z",
"creator": "someone@example.com",
"deployment_artifacts": {
"source_code_path": "/Workspace/Users/1234abcd-5678-90ab-cdef-123456abcdef/src/abcd1234efgh5678ijkl9012mnop3456"
},
"deployment_id": "abcd1234efgh5678ijkl9012mnop3456",
"mode": "SNAPSHOT",
"source_code_path": "/Workspace/Users/someone@example.com/databricks_apps/dash-hello-world_2025_12_05-21_35/dash-hello-world-app",
"status": {
"message": "App started successfully",s
"state": "SUCCEEDED"
},
"update_time": "2025-12-06T01:30:20Z"
}
Étapes suivantes
- Configurez l’autorisation pour gérer les personnes pouvant accéder à votre application et les modifier.
- Intégrez votre application à des fonctionnalités de plateforme Databricks telles que les secrets Databricks ou Databricks SQL.
- Partagez votre application avec d’autres utilisateurs dans votre espace de travail ou au sein de votre organisation.
- Explorez les modèles d’application et expérimentez les différentes infrastructures et fonctionnalités.