Partager via


Écrire des requêtes et explorer des données dans le nouvel éditeur SQL

L’interface utilisateur Databricks inclut un éditeur SQL que vous pouvez utiliser pour créer des requêtes, collaborer avec des collègues, parcourir les données disponibles et créer des visualisations. Cette page explique comment utiliser l’éditeur SQL pour écrire, exécuter, gérer et partager des requêtes.

Cet article explique comment utiliser le nouvel éditeur SQL. Pour en savoir plus sur l’utilisation de l’éditeur SQL hérité, consultez Écrire des requêtes et explorer les données dans l’éditeur SQL hérité.

Ouvrez l’éditeur SQL

Pour ouvrir l’éditeur SQL dans l’interface utilisateur Azure Databricks, cliquez sur Icône SQL EditorSQL Editor dans la barre latérale.

L’éditeur SQL s’ouvre sur votre dernière requête ouverte. Si aucune requête n’existe ou que toutes vos requêtes ont été explicitement fermées, la page d’accueil de l’éditeur SQL s’ouvre.

Activer le nouvel éditeur SQL

Utilisez l'option de bascule Nouvel éditeur SQL, à droite des listes déroulantes de catalogue et de schéma, pour activer le nouvel éditeur. Sur les écrans étroits, vous pouvez trouver le bouton New SQL editor en cliquant sur le menu kebab Icône du menu kebab. à droite des sélecteurs de catalogue et de schéma.

Capture d’écran montrant l’éditeur SQL avec le nouvel éditeur de requêtes désactivé

Activez le nouvel éditeur pour toute requête que vous possédez :

  • Cliquez sur New SQL editor: OFF. Un menu contextuel New SQL editor s’ouvre.
    • La case à cocher Apply to all of my queries (Appliquer à toutes mes requêtes) est sélectionnée par défaut. Conservez ce paramètre pour activer l’éditeur pour toutes les requêtes dont vous êtes propriétaire.
    • Pour activer le nouvel éditeur uniquement pour la requête active, décochez la case Apply to all of my queries.
  • Mettez le bouton New SQL editor sur ON.

Le nouvel éditeur SQL ne peut pas être utilisé pour toutes les requêtes. Vous ne pouvez pas passer au nouvel éditeur SQL pour une requête si l’une des conditions suivantes s'applique :

  • Vous n’êtes pas propriétaire de la requête.
  • La requête contient des listes déroulantes basées sur des requêtes, qui ne sont pas prises en charge. Consultez Utiliser les paramètres de requête.

Lorsque vous activez le nouvel éditeur SQL, votre requête s’ouvre dans la nouvelle interface utilisateur. Le jeu de résultats reste vide jusqu’à ce que vous exécutiez la requête.

Note

Les résultats de la requête sont partagés avec tous les collaborateurs et sont limités à 64 000 lignes.

Orientation

Cette rubrique souligne les différences clés de l’interface utilisateur et explique comment trouver et utiliser les fonctionnalités disponibles.

Capture d’écran affichant l’éditeur SQL avec des repères numérotés comme indiqué dans le texte.

  1. Accéder au système de fichiers de l’espace de travail : vous pouvez accéder aux objets de votre espace de travail et les organiser directement depuis l’éditeur SQL.
  2. Utiliser l’assistant Databricks intégré : discutez avec l’assistant pour vous aider à rédiger, affiner ou comprendre les requêtes. Exécutez le code généré par l’assistant depuis le panneau latéral.
  3. Réduire les sections de code : cliquez sur la flèche de réduction à gauche d’un bloc de code pour masquer ou afficher des sections de code de manière sélective. Cela peut faciliter la navigation dans des fichiers volumineux.
  4. Ouvrir la palette de commandes : la palette de commandes inclut des actions courantes, des raccourcis clavier, des thèmes personnalisés et des liens pour vous aider à trouver rapidement ce dont vous avez besoin. Une fois ouverte, utilisez la barre de recherche pour rechercher des outils et des raccourcis spécifiques.
  5. Commentaire sur le code : ajoutez des commentaires au code pour favoriser la collaboration.
  6. Consulter l’historique des versions : examinez les modifications récentes apportées à votre requête.

Se connecter au calcul

Vous devez disposer au moins des autorisations CAN USE sur un entrepôt SQL pour exécuter des requêtes. Vous pouvez utiliser la liste déroulante en haut de l’éditeur pour voir les options disponibles. Pour filtrer la liste, entrez du texte dans la zone de texte.

Sélecteur d’entrepôt de données SQL

La première fois que vous créez une requête, la liste des entrepôts de données SQL disponibles s’affiche par ordre alphabétique. L’entrepôt de données SQL utilisé en dernier est sélectionné la fois suivante que vous créez une requête. Si votre espace de travail est activé pour sélectionner un entrepôt SQL par défaut, vous pouvez personnaliser votre entrepôt par défaut. Consultez Définir un entrepôt par défaut au niveau de l’utilisateur.

L’icône en regard de l’entrepôt SQL indique l’état :

  • En cours d’exécution Running
  • Arrêté Arrêté

Note

S’il n’y a aucun entrepôt SQL dans la liste, contactez l’administrateur de votre espace de travail.

L’entrepôt de données SQL sélectionné redémarrera automatiquement lors de l’exécution de votre requête. Veuillez consulter la section Démarrer un entrepôt de données SQL pour découvrir d’autres façons de démarrer un entrepôt SQL.

Parcourir les ressources et obtenir de l’aide

Utilisez le volet gauche de l’éditeur SQL pour parcourir les fichiers d’espace de travail, afficher les objets de données et obtenir de l’aide de Databricks Assitant.

Le volet gauche de l’éditeur SQL inclut des onglets pour le navigateur de fichiers de l’espace de travail, le navigateur de schéma et l’Assistant Databricks.

Parcourir les fichiers de l’espace de travail

Cliquez sur l’icône Dossier pour ouvrir le dossier utilisateur de votre espace de travail. Vous pouvez parcourir tous les fichiers de l’espace de travail auquel vous avez accès à partir de cette partie de l’interface utilisateur.

Parcourir les objets de données

Si vous disposez de l’autorisation de lecture des métadonnées, le navigateur de schémas dans l’éditeur SQL affiche les bases de données et les tables disponibles. Vous pouvez également explorer les objets de données depuis Catalog Explorer.

Vous pouvez naviguer dans les objets de base de données régis par Unity Catalog dans Catalog Explorer sans calcul actif. Pour explorer des données dans le hive_metastore et d’autres catalogues non régis par Unity Catalog, vous devez être connecté à une capacité de calcul avec les privilèges appropriés. Consultez la gouvernance des données avec Azure Databricks.

Note

Si aucun objet de données n’apparaît dans le navigateur de schémas ou dans Catalog Explorer, contactez l’administrateur de votre espace de travail.

Cliquez sur Icône d’actualisation du schéma en haut du navigateur de schémas pour actualiser le schéma. Vous pouvez taper dans la barre de recherche pour filtrer les ressources par nom. Cliquer sur l’icône Filtre pour filtrer les objets par type.

Cliquez sur le nom d’un objet dans le navigateur pour afficher plus de détails sur l’objet. Par exemple, cliquez sur un nom de schéma pour afficher les tables de ce schéma. Cliquez sur un nom de table pour afficher les colonnes de cette table.

Obtenir de l’aide de l’Assistant Databricks

Cliquez sur l’icône Assistant de base de données pour ouvrir une fenêtre de chat avec l’Assistant Databricks. Cliquez sur une question suggérée ou entrez votre propre question pour interagir avec l’Assistant Databricks.

Créer une requête

Vous pouvez saisir du texte pour créer une requête dans l’éditeur SQL. Vous pouvez insérer des éléments depuis le navigateur de schémas pour référencer des catalogues et des tables.

  1. Tapez votre requête dans l’éditeur SQL.

    L’éditeur SQL prend en charge l’autocomplétion. Pendant la saisie, la fonction d’autocomplétion suggère des compléments. Par exemple, si une saisie valide à l’emplacement du curseur est une colonne, l’autocomplétion suggère un nom de colonne. Si vous tapez select * from table_name as t where t., l’autocomplétion reconnaît que t est un alias pour table_name et suggère les colonnes à l’intérieur de table_name. Vous pouvez également utiliser la saisie semi-automatique pour référencer des extraits de requête.

    Alias d’autocomplétion

  2. (Facultatif) Cliquez sur Enregistrer quand vous avez terminé d’appliquer les modifications. Par défaut, la requête est enregistrée dans votre dossier d’accueil utilisateur. Pour enregistrer la requête à un autre emplacement, sélectionnez le dossier cible, puis cliquez sur Déplacer.

Note

Les nouvelles requêtes sont automatiquement nommées Nouvelle requête avec l’horodatage de création ajouté dans le titre. Par défaut, les nouvelles requêtes créées sans contexte de dossier spécifique sont créées dans le dossier Brouillons de votre répertoire de base. Lorsque de nouvelles requêtes sont enregistrées ou renommées, elles sont supprimées des brouillons.

Interroger les sources de données

Vous pouvez identifier une source de requête à l’aide d’un nom de table complet dans la requête elle-même ou en sélectionnant une combinaison de catalogue et de schéma dans les sélecteurs de liste déroulante, ainsi que le nom de la table dans la requête. Un nom de table complet dans la requête remplace les sélecteurs de catalogue et de schéma dans l’éditeur SQL. Si un nom de table ou de colonne contient des espaces, entourez ces identifiants d’accent grave dans vos requêtes SQL.

Note

Le nombre maximal de résultats retournés dans une table est de 64 000 lignes ou 10 Mo, selon la valeur la plus petite.

Les exemples suivants montrent comment interroger différents objets de type table que vous pouvez stocker dans un catalogue.

Interroger une table ou une vue standard

L’exemple suivant interroge une table à partir du samples catalogue.

SELECT
  o_orderdate,
  o_orderkey,
  o_custkey,
  o_totalprice,
  o_shippriority
FROM
  samples.tpch.orders

Interroger une vue de métriques

L’exemple suivant interroge une vue de métrique qui utilise une table à partir du catalogue d’exemples comme source. Elle évalue les trois mesures et agrégats répertoriés sur Order Month et Order Status. Elle retourne les résultats triés par Order Month. Pour créer une vue de métrique similaire dans votre espace de travail, consultez Créer une vue de métrique.

Toutes les évaluations de mesure doivent être encapsulées dans la MEASURE fonction. Voir measure la fonction d’agrégation.


SELECT
 `Order Month`,
 `Order Status`,
 MEASURE(`Order Count`),
 MEASURE(`Total Revenue`),
 MEASURE(`Total Revenue per Customer`)
FROM
 orders_metric_view
GROUP BY ALL
ORDER BY 1 ASC;

Optimiser une requête avec l’Assistant Databricks

Cliquez sur l’icône Assistant base de données. Icône Assistant située sur le côté droit de l’éditeur pour obtenir de l’aide et des suggestions en ligne lorsque vous rédigez des requêtes. La /optimize commande slash invite l’Assistant à évaluer et à optimiser les requêtes. Pour plus d’informations, consultez Optimiser le code Python, PySpark et SQL.

Requête optimisée générée à l’aide de la commande /optimize avec l’Assistant Databricks

Modifier plusieurs onglets de requête

Par défaut, l’éditeur SQL utilise des onglets pour pouvoir ouvrir et modifier plusieurs requêtes simultanément. Pour ouvrir un nouvel onglet, cliquez sur +, puis sélectionnez Créer une requête ou Ouvrir une requête existante. Cliquez sur Ouvrir une requête existante pour afficher la liste des requêtes. L’onglet Pour vous offre une liste organisée de sugestions en fonction de votre utilisation. Utilisez l’onglet Tout pour rechercher toute requête à laquelle vous avez accès.

Boîte de dialogue des requêtes

Exécuter une seule requête ou des requêtes multi-instructions

Vous pouvez écrire des requêtes à plusieurs instructions dans un seul onglet d’éditeur. Pour utiliser plusieurs instructions de requête dans un seul onglet, terminez chaque instruction par un point-virgule (;).

Pour exécuter une requête unique :

  1. Sélectionnez un entrepôt SQL.
  2. Mettez en surbrillance une requête dans l’éditeur SQL (si plusieurs requêtes se trouvent dans le panneau de requêtes).
  3. Appuyez sur Ctrl/Cmd + Entrée ou cliquez sur Exécuter (1000) pour afficher les résultats sous forme de tableau dans le volet des résultats.

Note

Par défaut, Exécuter toutes les instructions et Limit 1000 sont sélectionnés.

  • Pour exécuter uniquement l’instruction active, désélectionnez Exécuter toutes les instructions.
  • Si une requête est enregistrée avec le paramètre Limite 1000 , ce paramètre s’applique à toutes les exécutions de requête. Pour renvoyer toutes les lignes (jusqu’à 64 000 lignes ou 10 Mo, selon la valeur la plus petite), effacez LIMIT 1 000 dans le menu déroulant Exécuter (1000). Pour spécifier une limite différente sur le nombre de lignes, ajoutez une LIMIT clause dans votre requête.

Arrêter une requête

Pour terminer une requête pendant son exécution, cliquez sur Annuler. Un administrateur peut arrêter une requête en cours d’exécution démarrée par un autre utilisateur en affichant l’option Terminer une requête en cours d’exécution.

Partager une requête

Le nouvel éditeur SQL gère les autorisations en deux parties :

Exécution interactive : les requêtes dans le nouvel éditeur SQL s’exécutent toujours avec les informations d’identification Run as viewer (Exécuter en tant que spectateur). Les résultats des requêtes sont accessibles à toute personne ayant accès à la requête. Les utilisateurs disposant au moins des autorisations CAN EDIT peuvent modifier le brouillon de la requête partagée. De plus, les modifications non enregistrées sont visibles par toute personne ayant les autorisations CAN VIEW ou supérieures. Les utilisateurs doivent disposer au moins de l’autorisation CAN USE sur l’entrepôt associé pour exécuter des requêtes.

Paramètres d’informations d’identification : Les paramètres d’autorisation pour les alertes héritées, les flux de travail et les tableaux de bord hérités sont identiques à ceux de l’éditeur SQL hérité. En fonction de vos préférences, ces ressources peuvent être exécutées avec les informations d’identification du propriétaire ou du spectateur.

Veuillez consulter la section Configurer les autorisations des requêtes pour en savoir plus sur les paramètres d’informations d’identification Run as owner (Exécuter en tant que propriétaire) et Run as viewer (Exécuter en lecture seule). Veuillez consulter la section ACL des requêtes pour apprendre à gérer l’accès à l’objet de requête.

Collaborer sur des requêtes en temps réel

GIF montrant plusieurs utilisateurs modifiant une requête.

Une fois la requête partagée, vous pouvez écrire en collaboration ou déboguer les requêtes en direct via l’édition collaborative. Les éditeurs peuvent également commenter des lignes de code individuelles pour poser des questions ou ajouter des suggestions.

Contrôler une requête avec le contrôle de source

Les fichiers de requête SQL de Databricks (extension : .dbquery.ipynb) sont pris en charge dans les dossiers Git Databricks . Vous pouvez utiliser un dossier Git pour contrôler vos fichiers de requête et les partager dans d’autres espaces de travail avec des dossiers Git qui accèdent au même dépôt Git. Si vous choisissez de désactiver le nouvel éditeur SQL après avoir commité ou cloné une requête dans un dossier Git Databricks, supprimez et reclonez ce dossier Git pour éviter les comportements inattendus.

Enregistrement d’une requête

Le contenu des requêtes dans le nouvel éditeur SQL est enregistré automatiquement en continu. Le bouton Enregistrer contrôle si le contenu de requête brouillon doit être appliqué aux ressources associées, comme les tableaux de bord hérités, les flux de travail ou les alertes héritées. Si la requête est partagée avec les informations d’identification Run as owner (Exécuter en tant que propriétaire), seul le propriétaire de la requête peut utiliser le bouton Save (Enregistrer) pour propager les modifications. Si les informations d’identification sont définies sur Exécuter en tant que lecteur, tout utilisateur ayant au moins CAN MANAGE les droits peut enregistrer la requête.

Afficher les résultats de la requête

Vous pouvez comparer les sorties de chaque instruction avec plusieurs jeux de résultats. Lorsque vous exécutez plusieurs instructions SQL depuis une seule fenêtre d’édition, vous pouvez utiliser l’interface utilisateur dans le panneau Output (Résultat) en bas de l’écran pour faire défiler les différents jeux de résultats.

Le nouvel éditeur SQL permet de faire défiler différentes tables dans le panneau des résultats.

Vous pouvez interagir avec les résultats de vos requêtes et les explorer à l’aide du volet des résultats. Le volet de résultats inclut les fonctionnalités suivantes pour explorer les résultats.

Visualisations

Cliquez sur l’icône Signe Plus pour ajouter une visualisation. Les visualisations peuvent vous aider à explorer le jeu de résultats. Consultez les types de visualisation de l’éditeur Notebook et SQL pour obtenir la liste complète des types de visualisation disponibles.

Cliquez sur flèche vers le bas sur un onglet de visualisation pour afficher des options supplémentaires.

Options permettant de personnaliser une visualisation ou d’ajouter à un tableau de bord.

  • Cliquez sur Télécharger pour télécharger les données représentées dans la visualisation sous forme de fichier CSV, TSV ou Excel.
  • Cliquez sur Supprimer pour supprimer la visualisation.
  • Cliquez sur Duplicate (Dupliquer) pour cloner l’onglet des résultats.
  • Cliquez sur Renommer pour renommer la visualisation.
  1. Cliquez sur Modifier pour modifier la visualisation.

  2. Cliquez sur Ajouter au tableau de bord pour copier la requête et la visualisation dans un nouveau tableau de bord IA/BI.

  3. Sélectionnez Créer un tableau de bord ou Ajouter au tableau de bord existant.

    • Créez un tableau de bord : Crée un tableau de bord qui inclut toutes les visualisations associées à la requête. Un nom vous est demandé pour le nouveau tableau de bord. Le nouveau tableau de bord est enregistré dans votre dossier personnel.
    • Ajouter au tableau de bord existant : Ajoute votre requête et vos visualisations associées à un tableau de bord existant. Utilisez le menu déroulant pour choisir le tableau de bord auquel le jeu de données et la visualisation doivent être ajoutés.

Télécharger les résultats

Vous pouvez télécharger les résultats sous forme de fichier CSV ou Excel. Les téléchargements CSV prennent en charge jusqu’à environ 5 Go de données. Cliquez sur Circonflexe inversé dans un onglet de résultats pour afficher les options de téléchargement. La taille finale du téléchargement de fichier peut être légèrement supérieure ou inférieure à 5 Go, car la limite de 5 Go est appliquée à une étape antérieure au téléchargement final du fichier.

Options de téléchargement des résultats et d’ajout aux tableaux de bord.

Note

Si vous ne pouvez pas télécharger une requête, cela signifie que l’administrateur de votre espace de travail a désactivé le téléchargement dans l’espace de travail.

Filtres

Les filtres vous permettent de limiter le jeu de résultats après l’exécution d’une requête. Vous pouvez appliquer des filtres pour afficher de manière sélective différents sous-ensembles de données. Utilisez l’Assistant pour vous aider à ajouter un filtre pour les résultats.

Pour ajouter un filtre :

  1. Cliquez sur l’icône Filtrer. Icône de filtre.
  2. Entrez du texte pour décrire le type de filtre que vous souhaitez appliquer. Un filtre nommé est appliqué au jeu de résultats.

Pour modifier un filtre :

  1. Cliquez sur le nom du filtre.
  2. Utilisez les menus déroulants et les champs de texte pour ajuster les paramètres de filtre.
  3. (Facultatif) Sélectionnez Sensible à la casse pour rendre le filtre sensible à la casse.
  4. (Facultatif) Cliquez sur Ajouter une condition OR pour ajouter un filtre supplémentaire.

Ajouter des paramètres

Les paramètres vous permettent de limiter le jeu de résultats en remplaçant les valeurs dans une requête au moment de l’exécution. Veuillez consulter la section Travailler avec des paramètres de requête pour savoir comment appliquer des paramètres.

Modifications de la syntaxe des paramètres

Les requêtes écrites dans l’éditeur SQL hérité qui utilisent des accolades doubles ({{}}) pour marquer les paramètres doivent être modifiées pour s’exécuter dans le nouvel éditeur SQL. Le nouvel éditeur SQL utilise la même syntaxe de paramètres que les autres outils Databricks, comme les tableaux de bord AI/BI, AI/BI Genie et les notebooks.

Les paramètres dans le nouvel éditeur SQL sont définis en utilisant la syntaxe de paramètre nommé. Les paramètres nommés sont des paramètres dans une requête qui sont précédés d’un deux-points, par exemple :parameter_name.

Veuillez consulter la section Marqueurs de paramètre nommé pour consulter la documentation de référence SQL. Veuillez consulter la section Exemples de syntaxe de paramètre nommé pour des exemples de conversion de la syntaxe de paramètres de l’éditeur SQL classique en marqueurs de paramètre nommé.

Types de filtres pris en charge

Le tableau suivant présente les types de filtres pris en charge dans le nouvel éditeur SQL. La deuxième colonne indique si le filtre fonctionne également dans l’éditeur SQL hérité.

Type de filtre Pris en charge dans l’éditeur classique
Est égal à Oui
N’est pas égal à Non
Est l’un des Oui
N’est pas l’un des Non
Contient Oui
Ne contient pas Non
Commence par Oui
Ne commence pas par Non
Se termine par Non
Ne se termine pas par Non
Est null Non
N’est pas null Non
Supérieur à Non
Supérieur ou égal à Non
Inférieur à Non
Inférieur ou égal à Non
Entre Oui
Avant Non
Après Non
Est vrai Oui
Est faux Oui
Conditions OR Non

Utiliser des raccourcis clavier

Le nouvel éditeur SQL inclut de nombreux raccourcis clavier intégrés pour vous aider à travailler rapidement. Le tableau suivant identifie les raccourcis clavier couramment utilisés.

Fonction Raccourci macOS Raccourci Windows
Exécuter une requête Cmd + Enter Ctrl + Enter
Exécuter une seule instruction sélectionnée Cmd + Shift + Enter Ctrl + Shift + Enter
Autocomplétion Ctrl + Space Ctrl + Space
Augmenter la taille de police Option + + (touche Plus) Alt + + (touche Plus)
Réduire la taille de police Option + - (touche Moins) Alt + - (touche Moins)
Mettre en forme le code SQL Cmd + Shift + F Ctrl + Shift + F
Afficher tous les raccourcis Esc puis H Esc puis H

Désactiver le nouvel éditeur SQL

Pour désactiver le nouvel éditeur SQL :

  • Cliquez sur New SQL editor: ON (Nouvel éditeur SQL : ACTIVÉ). Un menu contextuel New SQL editor s’ouvre.
  • Basculez le bouton New SQL Editor (Nouvel éditeur SQL) sur OFF.
  • Dans la boîte de dialogue de confirmation, choisissez de désactiver le nouvel éditeur uniquement pour la requête active ou pour toutes les requêtes éligibles.
    • La case Disable for all eligible queries (Désactiver pour toutes les requêtes éligibles) est décochée. Conservez ce paramètre si vous souhaitez désactiver le nouvel éditeur uniquement pour la requête active.
    • Pour désactiver le nouvel éditeur SQL pour toutes vos requêtes, cochez la case Disable for all eligible queries (Désactiver pour toutes les requêtes éligibles).

Pour empêcher l’ouverture automatique des requêtes dans le nouvel éditeur SQL :

  1. Dans l’espace de travail Databricks, cliquez sur votre nom d’utilisateur dans la barre supérieure, puis sélectionnez Paramètres.
  2. Dans le volet gauche, sous Utilisateur, cliquez sur l’onglet Développeur .
  3. Désactivez Créer et ouvrir toutes les requêtes éligibles dans le nouvel éditeur SQL.

Les administrateurs d’espace de travail peuvent désactiver cette fonctionnalité au niveau de l’espace de travail en visitant le portail en préversion et en recherchant l’éditeur SQL. Consultez Gérer les préversions d’Azure Databricks.