Utiliser SQLAlchemy avec Azure Databricks

Azure Databricks fournit un dialecteSQLAlchemy (le système utilisé par SQLAlchemy pour communiquer avec divers types de bases de données et d’implémentations d’API de base de données) pour Azure Databricks. SQLAlchemy est un kit d’outils Python SQL et un mappeur relationnel objet (ORM). SQLAlchemy offre une suite bien connue de modèles de persistance au niveau de l’entreprise conçue pour un accès efficace et à hautes performances aux bases de données et adaptée pour un langage de domaine simple et de type Python. Consultez Fonctionnalités et philosophie.

Le dialecte SQLAlchemy pour Azure Databricks doit être installé pour utiliser les fonctionnalités SQLAlchemy avec Azure Databricks. Cet article traite du dialecte SQLAlchemy pour Azure Databricks version 1.0 et 2.0, qui sera basé sur Databricks SQL Connector pour Python version 4.0.0 ou ultérieure.

Spécifications

Un ordinateur de développement exécutant Python >=3.8 et <=3.11.
Databricks vous recommande d’utiliser des environnements virtuels Python, tels que ceux fournis par venv inclus avec Python. Les environnements virtuels vous permettent d’assurer que vous utilisez une combinaison des bonnes versions de Python et du connecteur Databricks SQL. La configuration et l’utilisation des environnements virtuels n’entrent pas dans le cadre de cet article. Pour plus d’informations, consultez la Création d’environnements virtuels.
Cluster ou entrepôt SQL existant.

Commencez

Installez databricks-sqlalchemy pour SQLAlchemy v1 à l’aide de pip install databricks-sqlalchemy~=1.0 ou de SQLAlchemy v2 à l’aide de pip install databricks-sqlalchemy. Pour obtenir des informations sur la version, voir l’Historique des versions databricks-sqlalchemy.
Collectez les informations suivantes pour le cluster ou l’entrepôt SQL que vous souhaitez utiliser :

Groupe
- Nom d’hôte du serveur du cluster. Vous pouvez extraire celui-ci de la valeur Nom d'hôte du serveur sous l’onglet Options avancées > JDBC/ODBC pour votre cluster.
- Chemin d’accès HTTP du cluster. Vous pouvez extraire celui-ci de la valeur Chemin d'accès HTTP sous l’onglet Options avancées > JDBC/ODBC pour votre cluster.
Entrepôt SQL
- Nom d’hôte du serveur de l’entrepôt SQL. Vous pouvez l’obtenir à partir de la valeur Nom d'hôte du serveur sous l’onglet Détails de la connexion pour votre entrepôt SQL.
- Chemin HTTP de l’entrepôt SQL. Vous pouvez l’obtenir à partir de la valeur Chemin HTTP sous l’onglet Détails de la connexion pour votre entrepôt SQL.

Authentification

Le dialecte SQLAlchemy pour Azure Databricks prend en charge l’authentification par jeton d’accès personnel.

Pour créer un jeton d’accès personnel Azure Databricks, suivez les étapes décrites dans Créer des jetons d’accès personnels pour les utilisateurs de l’espace de travail.

Pour authentifier le dialecte SQLAlchemy, utilisez l’extrait de code suivant. Cet extrait suppose que vous avez défini les variables d’environnement suivantes :

DATABRICKS_TOKEN, défini sur le jeton d'accès personnel d'Azure Databricks.
DATABRICKS_SERVER_HOSTNAME réglé sur la valeur Nom d'hôte de serveur de votre cluster ou entrepôt SQL.
DATABRICKS_HTTP_PATH, défini sur la valeur Chemin HTTP de votre cluster ou SQL warehouse.
DATABRICKS_CATALOG, défini pour le catalogue cible dans Unity Catalog.
DATABRICKS_SCHEMA, défini selon le schéma cible (également appelé base de données) dans le Catalogue Unity.

Pour définir des variables d’environnement, consultez la documentation de votre système d’exploitation.

import os
from sqlalchemy import create_engine

access_token    = os.getenv("DATABRICKS_TOKEN")
server_hostname = os.getenv("DATABRICKS_SERVER_HOSTNAME")
http_path       = os.getenv("DATABRICKS_HTTP_PATH")
catalog         = os.getenv("DATABRICKS_CATALOG")
schema          = os.getenv("DATABRICKS_SCHEMA")

engine = create_engine(
  url = f"databricks://token:{access_token}@{server_hostname}?" +
        f"http_path={http_path}&catalog={catalog}&schema={schema}"
)

# ...

Vous utilisez la variable précédente engine pour vous connecter à votre catalogue et schéma spécifiés via votre ressource de calcul Azure Databricks.

SQLAlchemy v1

Pour des exemples de connexion, consultez cet exemple de fichier example.py

SQLAlchemy v2

Pour obtenir des exemples de connexion, consultez la section suivante et le fichier sqlalchemy_example.py dans GitHub.

Informations de référence sur DBAPI

Référentiel GitHub databricks-sqlalchemy v1
SQLAlchemy v1 README.md
Référentiel GitHub databricks-sqlalchemy v2
SQLAlchemy v2 README.md

Ressources supplémentaires

Commentaires

Est-ce que cette page vous a été utile?

Last updated on 2026-01-24

Utiliser SQLAlchemy avec Azure Databricks

Spécifications

Commencez

Groupe

Entrepôt SQL

Authentification

SQLAlchemy v1

SQLAlchemy v2

Informations de référence sur DBAPI

Ressources supplémentaires

Commentaires

Ressources supplémentaires