Visualiser des requêtes et créer un tableau de bord hérité

Ce tutoriel utilise le jeu de données New York City taxi dans Exemples. Il vous montre comment utiliser l’éditeur SQL dans Databricks SQL pour créer une visualisation de chacune des requêtes, puis créer un tableau de bord à l’aide de ces visualisations. Il vous montre également comment créer un paramètre de tableau de bord pour chacune des visualisations du tableau de bord.

Remarque

Les tableaux de bord (anciennement tableaux de bord Lakeview) sont désormais en disponibilité générale.

Les tableaux de bord ne sont pas disponibles dans les régions Azure Government. Utilisez des tableaux de bord hérités.

  • Azure Databricks recommande de créer des tableaux de bord à l’aide des outils les plus récents. Consultez Tableaux de bord.
  • Les tableaux de bord Databricks SQL d’origine sont désormais appelés tableaux de bord hérités. Ils continueront d’être pris en charge et mis à jour en ce qui concerne les résolutions de bogues critiques, mais les nouvelles fonctionnalités seront limitées. Vous pouvez continuer à utiliser des tableaux de bord hérités pour la création et la consommation.
  • Convertissez les tableaux de bord hérités à l’aide de l’outil de migration ou de l’API REST. Consultez Cloner un tableau de bord hérité en tableau de bord Lakeview pour obtenir des instructions sur l’utilisation de l’outil de migration intégré. Consultez Tutoriel : Gérer des tableaux de bord avec l’API REST Databricks afin d’obtenir un exemple de workflow pour les conversions utilisant l’API REST.

Se connecter à Databricks SQL avec l’éditeur SQL

  1. Cliquez sur Icône New (NouveauNouveau dans la barre latérale et sélectionnez Requête.

    L’éditeur SQL s’ouvre.

  2. Sélectionnez un entrepôt.

    La première fois que vous créez une requête, la liste des entrepôts SQL disponibles s’affiche par ordre alphabétique. Lors de la création suivante d’une requête, le dernier entrepôt utilisé est sélectionné.

  3. Cliquez sur Serverless Starter Warehouse. Cet entrepôt est créé automatiquement pour vous aider à démarrer rapidement. Si serverless n’est pas activé pour votre espace de travail, choisissez Starter Warehouse. Pour obtenir des informations sur la création d’entrepôts SQL, consultez Créer un entrepôt SQL.

Requête pour la distribution de l’heure de prise en charge

  1. Dans l’éditeur SQL, collez la requête suivante dans la nouvelle fenêtre de requête pour retourner la distribution de la prise en charge des taxis par heure.

    SELECT
    date_format(tpep_pickup_datetime, "HH") AS `Pickup Hour`,
    count(*) AS `Number of Rides`
    FROM
    samples.nyctaxi.trips
    GROUP BY 1
    
  2. Appuyez sur Ctrl/Cmd + Entrée ou cliquez sur Exécuter (1000). Après quelques secondes, les résultats de la requête sont affichés sous la requête dans le volet des résultats.

    La case Limite 1000 est sélectionnée par défaut pour toutes les requêtes pour s’assurer que la requête renvoie au maximum 1000 lignes. Si une requête est enregistrée avec le paramètre Limite 1000, ce paramètre s’applique à toutes les exécutions de la requête (y compris dans les tableaux de bord). Si vous souhaitez retourner toutes les lignes de cette requête, vous pouvez désélectionner LIMITE 1000 en cliquant sur la liste déroulante Exécuter (1000). Si vous souhaitez spécifier une autre limite sur le nombre de lignes, vous pouvez ajouter une clause LIMIT dans votre requête avec la valeur de votre choix.

    Le résultat de la requête s’affiche dans l’onglet Résultats.

  3. Cliquez sur Enregistrer et enregistrez la requête comme Pickup hour.

    Résultats de votre première requête nyc taxi

Créer une visualisation de la distribution de la prise en charge des taxis par heure.

  1. Près de l’onglet Résultats, cliquez sur +, puis sur Visualisation.

    L’éditeur de visualisation affiche.

  2. Dans la liste déroulante Type de visualisation, vérifiez que Barre est sélectionnée.

  3. Remplacez le nom de la visualisation par Bar chart.

  4. Vérifiez que Pickup Hour est spécifié pour la liste déroulante de la colonne Y.

  5. Vérifiez que Number of Rides et Sum sont spécifiés pour la liste déroulante de la colonne X.

    Distribution de l’heure de prise en charge

  6. Cliquez sur Enregistrer.

    Le graphique enregistré s’affiche dans l’éditeur SQL.

  1. Dans l’éditeur SQL, cliquez sur + puis sur Créer une requête.

  2. Dans la nouvelle fenêtre de requête, collez la requête suivante pour retourner les tendances tarifaires quotidiennes.

     SELECT
      T.weekday,
      CASE
        WHEN T.weekday = 1 THEN 'Sunday'
        WHEN T.weekday = 2 THEN 'Monday'
        WHEN T.weekday = 3 THEN 'Tuesday'
        WHEN T.weekday = 4 THEN 'Wednesday'
        WHEN T.weekday = 5 THEN 'Thursday'
        WHEN T.weekday = 6 THEN 'Friday'
        WHEN T.weekday = 7 THEN 'Saturday'
        ELSE 'N/A'
      END AS day_of_week,
      T.fare_amount,
      T.trip_distance
    FROM
      (
        SELECT
          dayofweek(tpep_pickup_datetime) as weekday,
          *
        FROM
          `samples`.`nyctaxi`.`trips`
      ) T
    
  3. Cliquez sur Enregistrer et enregistrez la requête comme Daily fare to distance analysis.

  1. Près de l’onglet Résultats, cliquez sur +, puis sur Visualisation.

    L’éditeur de visualisation affiche.

  2. Dans la liste déroulante Type de visualisation, sélectionnez Nuage de points.

  3. Remplacez le nom de la visualisation par Fare by distance.

  4. Sur l’onglet Général, définissez la valeur de la colonne X sur trip_distance et définissez la valeur des colonnes Y sur fare_amount.

  5. Dans la liste déroulante Regrouper par, définissez la valeur sur day_of_week.

  6. Sur l’onglet Axe X, définissez la valeur Nom sur Trip distance (miles).

  7. Sur l’onglet Axe Y, définissez la valeur Nom sur Fare Amount (USD).

  8. Cliquez sur Enregistrer.

    Le graphique enregistré s’affiche dans l’éditeur SQL.

    Tendance tarifaire quotidienne

Créer un tableau de bord avec ces visualisations

  1. Cliquez sur Nouvelle icôneNouveau dans la barre latérale et sélectionnez Tableau de bord hérité.

  2. Définissez le nom du tableau de bord sur NYC taxi trip analysis.

  3. Cliquez sur Enregistrer.

  4. Dans la liste déroulante Choisir un entrepôt, sélectionnez Serverless Starter Warehouse. Si serverless n’est pas activé pour votre espace de travail, choisissez Starter Warehouse.

  5. Dans la liste déroulante Ajouter, cliquez sur Visualisation.

  6. Dans la fenêtre Ajouter un widget de visualisation , sélectionnez la requête Analyse prix/distance quotidienne.

  7. Dans la liste Sélectionner une visualisation existante, sélectionnez Tarif par distance.

  8. Dans la zone de texte Titre, entrez Daily fare trends.

    Add visualization widget (Ajouter un widget de visualisation)

  9. Cliquez sur Ajouter au tableau de bord hérité.

    La visualisation Tendances tarifaires quotidiennes s’affiche sur la surface de conception du tableau de bord.

  10. Dans la liste déroulante Ajouter pour ajouter un deuxième widget au tableau de bord, puis cliquez sur Visualisation.

  11. Dans la fenêtre Ajouter un widget de visualisation, sélectionnez la requête Heure de prise en charge.

  12. Dans la liste Sélectionner une visualisation existante, sélectionnez Graphique à barres.

  13. Dans la zone de texte Titre, entrez Pickup hour distribution.

  14. Cliquez sur Ajouter au tableau de bord hérité.

  15. Redimensionnez cette visualisation pour qu’elle corresponde à la largeur de la première visualisation dans le tableau de bord.

  16. Cliquez sur Fin de l’édition.

Tableau de bord initial

Ajouter un paramètre de code postal de prise en charge à chaque requête

  1. Dans l’éditeur SQL, ouvrez la requête Analyse prix/distance quotidienne.

  2. Ajoutez la clause WHERE suivante à la requête Analyse prix/distance quotidienne pour filtrer la requête par code postal de prise en charge.

    WHERE
      pickup_zip IN ({{ pickupzip }})
    
  3. Dans la zone de texte pickupzip, entrez 10018 puis cliquez sur Appliquer les modifications pour exécuter la requête avec le paramètre de code postal de prise en charge.

  4. Cliquez sur Enregistrer.

  5. Ouvrez la requête Heure de prise en charge .

  6. Ajoutez la clause suivante WHERE à la requête Heure de prise en charge pour filtrer la requête en fonction du code postal de prise en charge. Ajoutez cette clause avant la clause GROUP BY.

       WHERE
         pickup_zip IN ({{ pickupzip }})
    
  7. Dans la zone de texte pickupzip, entrez 10018 puis cliquez sur Appliquer les modifications pour exécuter la requête avec le filtre de code postal de prise en charge.

  8. Cliquez sur Enregistrer.

Mettre à jour le tableau de bord pour utiliser un paramètre de tableau de bord

  1. Ouvrez le tableau de bord Analyse des trajets en taxi à NYC.

    Chacune des visualisations inclut désormais un paramètre pour le code postal de prise en charge.

    Widget - Paramètres

  2. Cliquez sur le menu kebab Trois points verticaux de ce tableau de bord, puis sur Modifier.

  3. Cliquez sur le menu kebab Trois points verticaux pour la visualisation Tendances tarifaires quotidiennes puis cliquez sur Modifier les paramètres de widget.

  4. Dans la section Paramètres, cliquez sur l’icône crayon Modifier l’icône pour le paramètre de Widget dans le champ Valeur.

    Afficher les paramètres de widget

  5. Dans la fenêtre Modifier la source et la valeur, remplacez la Source par Nouveau paramètre de tableau de bord.

    Remplacer des paramètres de widget par de nouveaux paramètres de tableau de bord

  6. Cliquez sur OK, puis sur Enregistrer.

    Le paramètre de tableau de bord pickupzip s’affiche et le paramètre de widget pour la visualisation Tendances tarifaires quotidiennes n’apparaît plus.

    1. Cliquez sur le menu kebab Trois points verticaux pour la visualisation Distribution de l’heure de prise en charge puis cliquez sur Modifier les paramètres de widget.
  7. Dans la section Paramètres, cliquez sur l’icône crayon Modifier l’icône pour le paramètre de Widget dans le champ Valeur.

  8. Dans la fenêtre Modifier la source et la valeur, remplacez la Source par Nouveau paramètre de tableau de bord.

  9. Vérifiez que pickupzip est sélectionné comme valeur deClé.

  10. Cliquez sur OK, puis sur Enregistrer.

    Le paramètre de widget pour la visualisation Distribution de l’heure de prise en charge n’apparaît plus.

  11. Cliquez sur Fin de l'édition.

  12. Remplacez la valeur du paramètre de tableau de bord pickupzip par 10017, puis cliquez sur Appliquer les modifications.

    Les données de chacune des visualisations affichent désormais les données des prises en charge du code postal 10017.

    Remplacer des paramètres de widget par de nouveaux paramètres de tableau de bord