Databricks SQL でクエリを視覚化してダッシュボードを作成する

このチュートリアルでは、Samples 内のニューヨーク市タクシー データセットを使用します。 ここでは、Databricks SQL の SQL エディターでいくつかのクエリごとに視覚化を作成してからこれらの視覚化を使用してダッシュボードを作成する方法を示します。 また、ダッシュボード内の各視覚化のダッシュボード パラメーターを作成する方法も示します。

SQL エディターで Databricks SQL に接続する

  1. サイドバーでNew Icon[新規] をクリックし、[クエリ] を選択します。

    SQL エディターが開かれます。 Databricks SQL へのアクセス権がない場合は、管理者にアクセス権を要求してください。

  2. ウェアハウスを選択します。

    クエリを初めて作成するときは、使用可能な SQL ウェアハウスの一覧がアルファベット順に表示されます。 次にクエリを作成する場合は、最後に使用したウェアハウスが選択されます。

  3. [サーバーレス スターター ウェアハウス] をクリックします。 このウェアハウスは、すばやく使い始めることができるように自動的に作成されます。 ワークスペースに対してサーバーレスが有効になっていない場合は、[スターター ウェアハウス] を選択します。 SQL ウェアハウスの作成については、「SQL ウェアハウスを作成する」をご覧ください。

乗車時間の分布についてのクエリ

  1. SQL エディターで、新しいクエリ ウィンドウに、1 時間ごとのタクシー乗車の分布を返す次のクエリを貼り付ます。

    SELECT
    date_format(tpep_pickup_datetime, "HH") AS `Pickup Hour`,
    count(*) AS `Number of Rides`
    FROM
    samples.nyctaxi.trips
    GROUP BY 1
    
  2. Ctrl/Cmd + Enter キーを押すか、[Run (1000)] (実行 (1000)) をクリックします。 数秒後に、クエリの結果が結果ペインのクエリの下に表示されます。

    クエリが返す行数が最大で 1,000 行になるように、すべてのクエリでは、既定で [Limit 1000] (制限 1000) がオンになっています。 [Limit 1000] (制限 1000) 設定でクエリを保存した場合、この設定はクエリのすべての実行 (ダッシュボード内を含む) に適用されます。 このクエリのすべての行を返す場合は、[Run (1000)] (実行 (1000)) ドロップダウンをクリックして、[LIMIT 1000] (制限 1000) をオフにすることができます。 行数に対する別の制限を指定する場合は、LIMIT 句を任意の値と共にクエリに追加できます。

    クエリ結果が [結果] タブに表示されます。

  3. [保存] をクリックし、クエリを Pickup hour として保存します。

    Results of your first query nyc taxi query

1 時間ごとのタクシー乗車の分布について視覚化を作成します。

  1. [結果] タブの横にある + をクリックしてから、[視覚化] をクリックします。

    視覚化エディターが表示されます。

  2. [視覚化の種類] ドロップダウンで、[バー] が選ばれていることを確認します。

  3. 視覚化の名前を Bar chart に変更します。

  4. [Y 列] ボックスで Pickup Hour が指定されていることを確認します。

  5. [X 列] ボックスで Number of RidesSum が指定されていることを確認します。

    Pickup hour distribution

  6. [保存] をクリックします。

    保存したグラフが SQL エディターに表示されます。

  1. SQL エディターで、+ をクリックしてから [新しいクエリの作成] をクリックします。

  2. 新しいクエリ ウィンドウで、毎日の乗車料金の傾向を返す次のクエリを貼り付けます。

     SELECT
      T.weekday,
      CASE
        WHEN T.weekday = 1 THEN 'Sunday'
        WHEN T.weekday = 2 THEN 'Monday'
        WHEN T.weekday = 3 THEN 'Tuesday'
        WHEN T.weekday = 4 THEN 'Wednesday'
        WHEN T.weekday = 5 THEN 'Thursday'
        WHEN T.weekday = 6 THEN 'Friday'
        WHEN T.weekday = 7 THEN 'Saturday'
        ELSE 'N/A'
      END AS day_of_week,
      T.fare_amount,
      T.trip_distance
    FROM
      (
        SELECT
          dayofweek(tpep_pickup_datetime) as weekday,
          *
        FROM
          `samples`.`nyctaxi`.`trips`
      ) T
    
  3. [保存] をクリックし、クエリを Daily fare to distance analysis として保存します。

  1. [結果] タブの横にある + をクリックしてから、[視覚化] をクリックします。

    視覚化エディターが表示されます。

  2. [視覚化の種類] ボックスで [散布図] を選択します。

  3. 視覚化の名前を Fare by distance に変更します。

  4. [全般] タブで、[X 列] の値を trip_distance に 設定し、[Y 列] の値を fare_amount に設定します。

  5. [グループ化] ボックスで値を day_of_week に設定します。

  6. [X 軸] タブで、[名前] の値を Trip distance (miles) に設定します。

  7. [Y 軸] タブで、[名前] の値を Fare Amount (USD) に設定します。

  8. [保存]

    保存したグラフが SQL エディターに表示されます。

    Daily fare trend

これらの視覚化を使用してダッシュボードを作成する

  1. サイドバーでNew Icon[新規] をクリックし、[ダッシュボード] を選択します。

  2. ダッシュボード名を NYC taxi trip analysis に設定します。

  3. [保存] をクリックします。

  4. [ウェアハウスの選択] ボックスの一覧で [サーバーレス スターター ウェアハウス] を選択します。 ワークスペースに対してサーバーレスが有効になっていない場合は、[スターター ウェアハウス] を選択します。

  5. [追加] ドロップダウン リストで、[視覚化] をクリックします。

  6. [視覚化ウィジェットの追加] ウィンドウで [Daily fare to distance analysis] クエリを選択します。

  7. [既存の視覚化を選択] ボックスの一覧で [Fare by distance] を選択します。

  8. [タイトル] テキスト ボックスに「Daily fare trends」と入力します。

    Add visualization widget

  9. [ダッシュボードに追加] をクリックします。

    Daily fare trends 視覚化がダッシュボードのデザイン サーフェイスに表示されます。

  10. [追加] ボックスの一覧で 2 つ目のウィジェットをダッシュボードに追加してから、[視覚化] をクリックします。

  11. [視覚化ウィジェットの追加] ウィンドウで [Pickup hour] クエリを選択します。

  12. [既存の視覚化を選択] ボックスの一覧で [Bar chart] を選択します。

  13. [タイトル] テキスト ボックスに「Pickup hour distribution」と入力します。

  14. [ダッシュボードに追加] をクリックします。

  15. ダッシュボード内の最初の視覚化の幅と一致するようにこの視覚化のサイズを変更します。

  16. [編集が完了しました] をクリックします。

Initial dashboard

各クエリに乗車場所郵便番号パラメーターを追加する

  1. SQL エディターで Daily fare to distance analysis クエリを開きます。

  2. 次の WHERE 句を Daily fare to distance analysis クエリに追加して乗車場所郵便番号でクエリをフィルター処理します。

    WHERE
      pickup_zip IN ({{ pickupzip }})
    
  3. [pickupzip] ボックスに 10018 と入力してから、[変更の適用] をクリックして乗車場所郵便番号パラメーターありでクエリを実行します。

  4. [保存] をクリックします。

  5. Pickup hour クエリを開きます。

  6. Pickup hour クエリに次の WHERE 句を追加して乗車場所郵便番号でクエリをフィルター処理します。 この句は GROUP BY 句の前に追加します。

       WHERE
         pickup_zip IN ({{ pickupzip }})
    
  7. [pickupzip] ボックスに 10018 と入力してから、[変更の適用] をクリックして乗車場所郵便番号フィルターありでクエリを実行します。

  8. [保存] をクリックします。

ダッシュボード パラメーターを使用するようにダッシュボードを更新する

  1. NYC taxi trip analysis ダッシュボードを開きます。

    各視覚化に乗車場所郵便番号パラメーターが含まれるようになりました。

    Widget - parameters

  2. このダッシュボードのケバブ メニュー Vertical Ellipsis をクリックしてから [編集] をクリックします。

  3. Daily fare trends 視覚化のケバブ メニュー Vertical Ellipsis をクリックしてから [ウィジェット設定の変更] をクリックします。

  4. [パラメーター] セクションで、[値] フィールドのウィジェット パラメーターの鉛筆アイコン Edit icon をクリックします。

    View widget parameters

  5. [ソースと値の編集] ウィンドウで [ソース][新しいダッシュボード パラメーター] に変更します。

    Change widget parameters to new dashboard parametes

  6. [OK] をクリックしてから [保存] をクリックします。

    pickupzip ダッシュボード パラメーターが表示され、Daily fare trends 視覚化のウィジェット パラメーターが表示されなくなりました。

    1. Pickup hour distribution 視覚化のケバブ メニュー Vertical Ellipsis をクリックしてから [ウィジェット設定の変更] をクリックします。
  7. [パラメーター] セクションで、[値] フィールドのウィジェット パラメーターの鉛筆アイコン Edit icon をクリックします。

  8. [ソースと値の編集] ウィンドウで [ソース][既存のダッシュボード パラメーター] に変更します。

  9. [キー] の値として pickupzip が選択されていることを確認します。

  10. [OK] をクリックしてから [保存] をクリックします。

    Pickup hour distribution 視覚化のウィジェット パラメーターが表示されなくなりました。

  11. [編集の完了] をクリックします。

  12. pickupzip ダッシュボード パラメーターの値を 10017 に変更してから [変更の適用] をクリックします。

    各視覚化で、乗車のデータとして郵便番号 10017 が表示されるようになりました。

    Change widget parameters to new dashboard parameters