Écrire des requêtes et explorer des données dans l’éditeur SQL
L’interface utilisateur d’Azure Databricks comprend un éditeur SQL que vous pouvez utiliser pour créer des requêtes, parcourir les données disponibles et créer des visualisations. Vous pouvez également partager vos requêtes enregistrées avec d’autres membres de l’équipe dans l’espace de travail. Cet article explique comment utiliser l’éditeur SQL pour écrire, exécuter et gérer des requêtes. Une nouvelle version de l’éditeur SQL est disponible en préversion publique. Pour savoir comment activer et utiliser le nouvel éditeur SQL, consultez Collaborer avec des collègues à l’aide du nouvel éditeur SQL.
Après avoir ouvert l’éditeur, vous pouvez créer une requête SQL ou parcourir les données disponibles. L’éditeur de texte prend en charge l’autocomplétion, la mise en forme automatique et divers autres raccourcis clavier.
Vous pouvez ouvrir plusieurs requêtes à l’aide des onglets de requête situés en haut de l’éditeur de texte. Des commandes sont disponibles sous chaque onglet de requête pour exécuter la requête, la marquer comme favorite et vous connecter à un entrepôt SQL. Vous pouvez également Enregistrer, Planifier ou Partager des requêtes.
Ouvrir l’éditeur SQL
Pour ouvrir l’éditeur SQL dans l’IU Azure Databricks, cliquez sur Éditeur SQL dans la barre latérale.
L’éditeur SQL s’ouvre sur la dernière requête ouverte. Si aucune requête n’existe ou si toutes vos requêtes ont été explicitement fermées, une nouvelle requête s’ouvre. Elle est automatiquement nommée Nouvelle requête et l’horodateur de création est ajouté dans le titre.
Se connecter au calcul
Vous devez disposer au minimum des autorisations CAN USE sur un entrepôt SQL en cours d’exécution pour exécuter des requêtes. Vous pouvez utiliser la liste déroulante en haut de l’éditeur pour voir les options disponibles. Pour filtrer la liste, entrez du texte dans la zone de texte.
La première fois que vous créez une requête, la liste des entrepôts SQL disponibles s’affiche par ordre alphabétique. Ensuite, lors de la création d’une requête, le dernier entrepôt SQL utilisé est sélectionné.
L’icône en regard de l’entrepôt SQL indique l’état :
- En cours d’exécution
- Démarrage
- Arrêté
Remarque
Si aucun entrepôt SQL ne figure dans la liste, contactez l’administrateur de votre espace de travail.
L’entrepôt SQL sélectionné redémarre automatiquement quand vous exécutez votre requête. Pour découvrir d’autres façons de démarrer un entrepôt SQL, consultez Démarrer un entrepôt.
Parcourir des objets de données dans l’éditeur SQL
Si vous disposez de l’autorisation de lecture des métadonnées, le navigateur de schémas dans l’éditeur SQL affiche les bases de données et les tables disponibles. Vous pouvez également parcourir les objets de données à partir de Catalog Explorer.
Vous pouvez parcourir les objets de base de données régis par Unity Catalog dans Catalog Explorer sans calcul actif. Pour explorer les données dans le hive_metastore
et d’autres catalogues non régis par Unity Catalog, vous devez vous attacher au calcul avec des privilèges appropriés. Consultez Gouvernance des données avec Unity Catalog.
Remarque
Si aucun objet de données ne se trouve dans le navigateur de schémas ou dans Catalog Explorer, contactez l’administrateur de votre espace de travail.
Cliquez sur en haut du navigateur de schémas pour actualiser le schéma. Vous pouvez filtrer le schéma en tapant des chaînes de filtre dans la zone de recherche.
Cliquez sur un nom de table pour afficher les colonnes de cette table.
Créer une requête
Vous pouvez entrer du texte pour créer une requête dans l’éditeur SQL. Vous pouvez insérer des éléments à partir du navigateur de schémas pour référencer des catalogues et des tables.
Tapez votre requête dans l’éditeur SQL.
L’éditeur SQL prend en charge l’autocomplétion. À mesure que vous entrez du texte, l’autocomplétion suggère des complétions. Par exemple, si une saisie valide à l’emplacement du curseur est une colonne, l’autocomplétion suggère un nom de colonne. Si vous tapez
select * from table_name as t where t.
, l’autocomplétion reconnaît quet
est un alias pourtable_name
et suggère les colonnes à l’intérieur detable_name
.(Facultatif) Cliquez sur Enregistrer quand vous avez terminé d’appliquer les modifications. Par défaut, la requête est enregistrée dans votre dossier de base d’utilisateur, ou vous pouvez sélectionner un autre emplacement. Ensuite, cliquez sur Enregistrer.
Activer et désactiver l’autocomplétion
La fonctionnalité d’autocomplétion en direct peut compléter des jetons de schéma, des identificateurs de syntaxe de requête (comme SELECT
et JOIN
) et des titres d’extrait de requête. Cette fonctionnalité est activée par défaut, sauf si votre schéma de base de données dépasse 5 000 jetons (tables ou colonnes).
Utilisez le bouton bascule sous l’éditeur SQL pour activer ou désactiver l’autocomplétion en direct.
- Pour désactiver l’autocomplétion en direct, appuyez sur Ctrl+Espace ou cliquez sur le bouton sous l’éditeur SQL.
Enregistrer des requêtes
Utilisez le bouton Enregistrer en haut à droite de l’éditeur SQL pour enregistrer votre requête.
Important
Lorsque vous modifiez une requête sans cliquer explicitement sur Enregistrer, cet état est conservé en tant que brouillon de requête. Les brouillons de requête sont conservés pendant 30 jours. Après 30 jours, les brouillons de requête sont automatiquement supprimés. Pour conserver vos modifications, vous devez les enregistrer explicitement.
Modifier plusieurs requêtes
Par défaut, l’éditeur SQL utilise des onglets pour vous permettre de modifier plusieurs requêtes en même temps. Pour ouvrir un nouvel onglet, cliquez sur +, puis sélectionnez Créer une requête ou Ouvrir une requête existante. Cliquez sur Ouvrir une requête existante pour afficher votre liste de requêtes enregistrées. Cliquez sur Mes requêtes ou Favoris pour filtrer la liste des requêtes. Dans la ligne contenant la requête que vous souhaitez afficher, cliquez sur Ouvrir.
Exécuter une ou plusieurs requêtes
Pour exécuter une requête ou toutes les requêtes :
Sélectionnez un entrepôt SQL.
Mettez en surbrillance une requête dans l’éditeur SQL (si le volet de requêtes compte plusieurs requêtes).
Appuyez sur Ctrl/Cmd + Entrée ou cliquez sur Exécuter (1000) pour afficher les résultats sous forme de tableau dans le volet des résultats.
Remarque
Le paramètre Limite 1000 est sélectionné par défaut pour toutes les requêtes afin de limiter à 1 000 le nombre de lignes retournées par la requête. Si une requête est enregistrée avec le paramètre Limite 1000, celui-ci s’applique à toutes les exécutions de la requête (y compris dans les tableaux de bord). Pour retourner toutes les lignes de cette requête, vous pouvez désélectionner LIMITE 1000 en cliquant sur la liste déroulante Exécuter (1000). Si vous souhaitez spécifier une autre limite sur le nombre de lignes, vous pouvez ajouter une clause LIMIT
dans votre requête avec la valeur de votre choix.
Arrêter une requête
Pour terminer une requête pendant son exécution, cliquez sur Annuler. Un administrateur peut arrêter une requête en cours d’exécution démarrée par un autre utilisateur en consultant Terminer une requête en cours d’exécution.
Options de requête
Vous pouvez utiliser le menu contextuel à trois points en haut de l’éditeur de requête pour accéder à des options de menu vous permettant de cloner, rétablir, mettre en forme et modifier les informations d’une requête.
Revenir à la requête enregistrée
Lorsque vous modifiez une requête, l’option Annuler les modifications apparaît dans le menu contextuel de celle-ci. Vous pouvez cliquer sur Rétablir pour revenir à la version enregistrée.
Abandon et restauration de requêtes
Pour déplacer une requête vers la corbeille :
- Cliquez sur le menu contextuel à trois points en regard de la requête dans l’éditeur SQL, puis sélectionnezDéplacer vers la Corbeille.
- Cliquez sur Déplacer vers la corbeille pour confirmer.
Pour restaurer une requête à partir de la corbeille :
- Dans la liste Toutes les requêtes, cliquez sur .
- Cliquez sur une requête.
- Cliquez sur le menu contextuel kebab en haut à droite de l’éditeur SQL, puis sélectionnez Restaurer.
Définir la description de la requête et afficher les informations de requête
Pour définir une description de requête :
Cliquez sur le menu contextuel à trois points en regard de la requête, puis cliquez sur Modifier les informations de la requête.
Dans la zone de texte Description, entrez votre description. Ensuite, cliquez sur Enregistrer. Vous pouvez également voir dans cette boîte de dialogue l’historique de la requête, notamment ses dates de création et de mise à jour.
Marquer des requêtes comme favorites et les étiqueter
Vous pouvez utiliser des favoris et des étiquettes pour filtrer les listes de requêtes et de tableaux de bord affichées sur la page d’arrivée de votre espace de travail ainsi que sur chacune des pages contenant des listes de requêtes et de tableaux de bord.
Favoris : pour marquer une requête comme favorite, cliquez sur l’étoile à gauche de son titre dans la liste Requêtes. L’étoile devient jaune.
Étiquettes : vous pouvez étiqueter des requêtes et des tableaux de bord avec une chaîne explicite pour votre organisation.
Ajouter un indicateur
Ajoutez des étiquettes dans l’éditeur de requête.
Cliquez sur le menu contextuel à trois points en regard de la requête, puis cliquez sur Modifier les informations de la requête. Une boîte de dialogue Informations sur la requête s’affiche.
Si aucune étiquette n’est appliquée à la requête, le message Ajouter des étiquettes s’affiche dans la zone de texte où les étiquettes sont répertoriées. Pour créer une étiquette, tapez-la dans la zone. Pour entrer plusieurs étiquettes, appuyez sur Tab entre chaque entrée.
Cliquez sur Enregistrer pour appliquer les étiquettes et fermer la boîte de dialogue.
Supprimer des étiquettes
- Cliquez sur le menu contextuel à trois points en regard de la requête, puis cliquez sur Modifier les informations de la requête.
- Cliquez sur le X d’une étiquette pour la supprimer.
- Cliquez sur Enregistrer pour fermer la boîte de dialogue.
Afficher les résultats de la requête
Après l’exécution d’une requête, les résultats s’affichent dans le volet situé en dessous de la requête. La Nouvelle table de résultats est Activée pour les nouvelles requêtes. Si nécessaire, cliquez sur la liste déroulante pour la désactiver. Les images de cette section utilisent la nouvelle table de résultats.
Vous pouvez interagir avec les résultats de votre requête et les explorer à l’aide du volet de résultats. Le volet de résultats comprend les fonctionnalités suivantes pour explorer les résultats :
Visualisations, filtres et paramètres
Cliquez sur pour ajouter une visualisation, un filtre ou un paramètre. Les options suivantes s’affichent :
Visualisation : les visualisations peuvent vous aider à explorer le jeu de résultats. Pour obtenir la liste complète des types de visualisations disponibles, consultez Types de visualisations.
Filtre : les filtres vous permettent de limiter le jeu de résultats après l’exécution d’une requête. Vous pouvez appliquer des filtres pour afficher de manière sélective différents sous-ensembles des données. Pour savoir comment utiliser des filtres, consultez Filtres de requête.
Paramètre : les paramètres vous permettent de limiter le jeu de résultats en remplaçant des valeurs dans une requête au moment de l’exécution. Pour savoir comment appliquer des paramètres de requête, consultez Utiliser les paramètres de requête.
Modifiez, téléchargez ou ajoutez à un tableau de bord
Important
- Databricks recommande d’utiliser des tableaux de bord IA/BI (anciennement tableaux de bord Lakeview). Les versions antérieures des tableaux de bord, précédemment appelées tableaux de bord Databricks SQL, sont désormais appelées tableaux de bord hérités. Databricks déconseille de créer des tableaux de bord hérités.
- Convertissez les tableaux de bord hérités en utilisant l’outil de migration ou l’API REST. Consultez Cloner un tableau de bord hérité en tableau de bord AI/BI pour obtenir des instructions sur l’utilisation de l’outil de migration intégré. Consultez Tutoriels sur les tableaux de bord pour obtenir des tutoriels sur la création et la gestion de tableaux de bord en utilisant l’API REST.
Cliquez sur le dans un onglet de résultats pour afficher d’autres options.
- Cliquez sur Modifier pour personnaliser les résultats affichés dans la visualisation.
- Cliquez sur Supprimer pour supprimer l’onglet des résultats.
- Cliquez sur Dupliquer pour cloner l’onglet des résultats.
- Cliquez sur Ajouter au tableau de bord pour copier la requête et la visualisation dans un nouveau tableau de bord.
- Cette action crée un tableau de bord qui inclut toutes les visualisations associées à la requête. Consultez Tableaux de bord pour savoir comment modifier votre tableau de bord.
- Vous êtes invité(e) à choisir un nom pour le nouveau tableau de bord. Le nouveau tableau de bord est enregistré dans votre dossier d’accueil.
- Vous ne pouvez pas ajouter de résultats à un tableau de bord existant.
- Cliquez sur Ajouter au tableau de bord hérité pour ajouter l’onglet résultats à un tableau de bord hérité nouveau ou existant.
- Cliquez sur l’une des options de téléchargement pour télécharger les résultats. Pour plus d’informations et de limites, consultez la description suivante.
Télécharger les résultats : vous pouvez télécharger les résultats dans un fichier CSV, TSV ou Excel.
Vous pouvez télécharger jusqu’à environ 1 Go de données de résultats à partir de Databricks SQL au format CSV et TSV, et jusqu’à 100 000 lignes dans un fichier Excel.
La taille finale du téléchargement de fichier peut être légèrement supérieure ou inférieure à 1 Go, car la limite de 1 Go est appliquée à une étape antérieure au téléchargement final du fichier.
Remarque
Si vous ne parvenez pas à télécharger une requête, c’est que l’administrateur de votre espace de travail a désactivé le téléchargement pour votre espace de travail.
Exécutions précédentes
Vous pouvez voir les exécutions précédentes de la requête, y compris la syntaxe complète de la requête. Les exécutions passées s’ouvrent en mode lecture seule et incluent des boutons pour Cloner dans une nouvelle requête ou Reprendre la modification. Cet onglet n’affiche pas les exécutions planifiées.
Explorer les résultats
Les résultats de la requête retournés apparaissent sous la requête. L’onglet Résultats bruts est rempli avec les lignes retournées. Vous pouvez utiliser des filtres intégrés pour réorganiser les résultats par valeurs croissantes ou décroissantes. Vous pouvez également utiliser le filtre pour rechercher des lignes de résultats qui incluent une valeur spécifique.
Vous pouvez utiliser des onglets dans le volet de résultats pour ajouter des visualisations, des filtres et des paramètres.
Filtrer la liste des requêtes enregistrées dans la fenêtre des requêtes
Dans la fenêtre des requêtes, vous pouvez filtrer la liste de toutes les requêtes selon la liste des requêtes que vous avez créées (Mes requêtes), les requêtes favorites et les étiquettes.
Automatiser les mises à jour
Vous pouvez utiliser le bouton Planifier pour définir une cadence automatique pour les exécutions de requêtes. Les mises à jour automatiques peuvent vous aider à tenir vos tableaux de bord et rapports à jour avec les données les plus récentes. Les requêtes planifiées peuvent également activer des alertes Databricks SQL, un type spécial de tâche planifiée qui envoie des notifications lorsqu’une valeur atteint un seuil spécifié.
Consultez Planifier une requête.
Consultez la Présentation des alertes Databricks SQL.
Partager des requêtes
Le bouton Partager vous permet de partager votre requête avec d’autres utilisateurs de votre espace de travail. Si vous partagez une requête, choisissez les options suivantes :
- Exécuter en tant que propriétaire (informations d’identification du propriétaire) : ce paramètre signifie que les viewers peuvent voir les mêmes résultats que le propriétaire de la requête. Cela s’applique aux exécutions de requêtes planifiées ou manuelles.
- Exécuter en tant que viewer (identifiants du viewer) : ce paramètre limite les résultats aux autorisations attribuées au viewer.
Voir Configurer les autorisations de requête.
Étape suivante
Pour apprendre à utiliser des requêtes avec l’interface utilisateur d’Azure Databricks, consultez Accéder à des requêtes enregistrées et les gérer.