Partager via


Concepts SQL de Databricks

Cette page présente les concepts fondamentaux dont vous avez besoin pour utiliser Databricks SQL efficacement.

Interfaces et outils

Interface Description
Éditeur SQL Interface basée sur un navigateur pour l’écriture et l’exécution de requêtes SQL. Inclut l’assistance d’IA intégrée, les commentaires de code et l’historique des versions.
IA/BI Solution décisionnelle qui inclut des tableaux de bord et des Genie spaces pour l’analyse des données en libre-service et l’exploration de données conversationnelle.
Notebooks Documents interactifs qui combinent SQL avec Python, Scala ou R. Attachez un notebook à un entrepôt SQL pour exécuter SQL en même temps que d’autres langages.
Vue des métriques Couche sémantique permettant de définir des métriques métier réutilisables avec des calculs cohérents entre les requêtes et les tableaux de bord.
Alertes Les moniteurs automatisés qui évaluent les résultats des requêtes par rapport à une condition et fournissent des notifications lorsque la condition est remplie.
Tâches Exécution planifiée des requêtes SQL pour le traitement automatisé des données et les workflows de création de rapports.
ETL Définissez et actualisez les tables de streaming et les vues matérialisées dans Databricks SQL pour les pipelines ETL incrémentiels.
REST API Interface programmatique permettant d’automatiser et de gérer des objets Databricks SQL.

Requêtes et calculs

Concept Description
Requête Instruction SQL qui récupère ou transforme des données. Les requêtes dans Databricks SQL sont enregistrées, versionées et réutilisables.
SQL Warehouse Ressource de calcul qui exécute des requêtes SQL. Toutes les interfaces Databricks SQL exécutent des requêtes sur un entrepôt SQL.
Historique des requêtes Enregistrement des requêtes exécutées, notamment le temps d’exécution, l’utilisation des ressources et les caractéristiques de performances.
Profil de requête Vue détaillée du plan d’exécution d’une requête. Utilisez-le pour identifier les goulots d’étranglement et les opportunités d’optimisation.
Visualisation Représentation graphique des résultats de requête, comme un graphique à barres, un graphique en courbes ou une table.

Gestion des données

Concept Description
Tableau de bord Collection de visualisations et de commentaires générés à partir d’une ou plusieurs requêtes. Les tableaux de bord sont partageables et prennent en charge le filtrage interactif.
Vue métrique Définition nommée et réutilisable d’une métrique métier soutenue par une expression SQL. Applique des calculs cohérents entre les équipes et les outils.
Table de streaming Une table qui ingère les données de manière incrémentielle à partir d'une source en continu, gérée par un pipeline SQL Databricks.
Vue matérialisée Vue précomputée dont les résultats sont stockés et actualisés automatiquement par un pipeline Databricks SQL.

Authentification et autorisation

Concept Description
Utilisateur et groupe Un utilisateur est un individu unique ayant accès à l’espace de travail Azure Databricks. Un groupe est une collection d’utilisateurs gérés ensemble à des fins de contrôle d’accès.
Jeton d’accès personnel Informations d’identification utilisées pour s’authentifier auprès de l’API REST et connecter des outils tiers aux entrepôts SQL.
Liste des contrôles d’accès Ensemble d’autorisations attachées à un objet qui déterminent quels acteurs peuvent effectuer quelles actions sur l'objet.
Unity Catalogue Couche de gouvernance pour Azure Databricks. Fournit le contrôle d'accès centralisé, l'audit, la traçabilité et la découverte des données dans l'ensemble des espaces de travail.