クエリを視覚化し、レガシ ダッシュボードを作成する

このチュートリアルでは、Samples 内のニューヨーク市タクシー データセットを使用します。 ここでは、Databricks SQL の SQL エディターでいくつかのクエリごとに視覚化を作成してからこれらの視覚化を使用してダッシュボードを作成する方法を示します。 また、ダッシュボード内の各視覚化のダッシュボード パラメーターを作成する方法も示します。

Note

ダッシュボード (旧称 Lakeview ダッシュボード) が一般公開されました。

ダッシュボードは Azure Government リージョンでは使用できません。 レガシ ダッシュボードを使用してください。

  • Azure Databricks では、最新のツールを使用して新しいダッシュボードを作成することをお勧めします。 「ダッシュボード」を参照してください。
  • 元の Databricks SQL ダッシュボードは、レガシ ダッシュボードと呼ばれるようになりました。 これらは引き続きサポートされ、重要なバグ修正で更新されますが、新機能は制限されます。 作成と使用の両方でレガシ ダッシュボードを引き続き利用できます。
  • 移行ツールまたは REST API を使用して、レガシ ダッシュボードを変換します。 組み込み移行ツールの使用方法については、「レガシ ダッシュボードを Lakeview ダッシュボードにクローンする」を参照してください。 REST API を使用した変換のワークフロー例については、「チュートリアル: Databricks REST API を使用してダッシュボードを管理する」を参照してください。

SQL エディターで Databricks SQL に接続する

  1. サイドバーで新規アイコン[新規] をクリックし、[クエリ] を選択します。

    SQL エディターが開かれます。

  2. ウェアハウスを選択します。

    クエリを初めて作成するときは、使用可能な SQL ウェアハウスの一覧がアルファベット順に表示されます。 次にクエリを作成する場合は、最後に使用したウェアハウスが選択されます。

  3. [サーバーレス スターター ウェアハウス] をクリックします。 このウェアハウスは、すばやく使い始めることができるように自動的に作成されます。 ワークスペースに対してサーバーレスが有効になっていない場合は、[スターター ウェアハウス] を選択します。 SQL ウェアハウスの作成については、「SQL ウェアハウスを作成する」をご覧ください。

乗車時間の分布についてのクエリ

  1. SQL エディターで、新しいクエリ ウィンドウに、1 時間ごとのタクシー乗車の分布を返す次のクエリを貼り付ます。

    SELECT
    date_format(tpep_pickup_datetime, "HH") AS `Pickup Hour`,
    count(*) AS `Number of Rides`
    FROM
    samples.nyctaxi.trips
    GROUP BY 1
    
  2. Ctrl/Cmd + Enter キーを押すか、[Run (1000)] (実行 (1000)) をクリックします。 数秒後に、クエリの結果が結果ペインのクエリの下に表示されます。

    クエリが返す行数が最大で 1,000 行になるように、すべてのクエリでは、既定で [Limit 1000] (制限 1000) がオンになっています。 [Limit 1000] (制限 1000) 設定でクエリを保存した場合、この設定はクエリのすべての実行 (ダッシュボード内を含む) に適用されます。 このクエリのすべての行を返す場合は、[Run (1000)] (実行 (1000)) ドロップダウンをクリックして、[LIMIT 1000] (制限 1000) をオフにすることができます。 行数に対する別の制限を指定する場合は、LIMIT 句を任意の値と共にクエリに追加できます。

    クエリ結果が [結果] タブに表示されます。

  3. [保存] をクリックし、クエリを Pickup hour として保存します。

    最初のクエリであるニューヨーク市タクシー クエリの結果

1 時間ごとのタクシー乗車の分布について視覚化を作成します。

  1. [結果] タブの横にある + をクリックしてから、[視覚化] をクリックします。

    視覚化エディターが表示されます。

  2. [視覚化の種類] ドロップダウンで、[バー] が選ばれていることを確認します。

  3. 視覚化の名前を Bar chart に変更します。

  4. [Y 列] ボックスで Pickup Hour が指定されていることを確認します。

  5. [X 列] ボックスで Number of RidesSum が指定されていることを確認します。

    乗車時間の分布

  6. [保存] をクリックします。

    保存したグラフが SQL エディターに表示されます。

  1. SQL エディターで、+ をクリックしてから [新しいクエリの作成] をクリックします。

  2. 新しいクエリ ウィンドウで、毎日の乗車料金の傾向を返す次のクエリを貼り付けます。

     SELECT
      T.weekday,
      CASE
        WHEN T.weekday = 1 THEN 'Sunday'
        WHEN T.weekday = 2 THEN 'Monday'
        WHEN T.weekday = 3 THEN 'Tuesday'
        WHEN T.weekday = 4 THEN 'Wednesday'
        WHEN T.weekday = 5 THEN 'Thursday'
        WHEN T.weekday = 6 THEN 'Friday'
        WHEN T.weekday = 7 THEN 'Saturday'
        ELSE 'N/A'
      END AS day_of_week,
      T.fare_amount,
      T.trip_distance
    FROM
      (
        SELECT
          dayofweek(tpep_pickup_datetime) as weekday,
          *
        FROM
          `samples`.`nyctaxi`.`trips`
      ) T
    
  3. [保存] をクリックし、クエリを Daily fare to distance analysis として保存します。

  1. [結果] タブの横にある + をクリックしてから、[視覚化] をクリックします。

    視覚化エディターが表示されます。

  2. [視覚化の種類] ボックスで [散布図] を選択します。

  3. 視覚化の名前を Fare by distance に変更します。

  4. [全般] タブで、[X 列] の値を trip_distance に 設定し、[Y 列] の値を fare_amount に設定します。

  5. [グループ化] ボックスで値を day_of_week に設定します。

  6. [X 軸] タブで、[名前] の値を Trip distance (miles) に設定します。

  7. [Y 軸] タブで、[名前] の値を Fare Amount (USD) に設定します。

  8. [保存]

    保存したグラフが SQL エディターに表示されます。

    毎日の乗車料金の傾向

これらの視覚化を使用してダッシュボードを作成する

  1. サイドバーで 新規アイコン[新規] をクリックし、[レガシ ダッシュボード] を選択します。

  2. ダッシュボード名を NYC taxi trip analysis に設定します。

  3. [保存] をクリックします。

  4. [ウェアハウスの選択] ボックスの一覧で [サーバーレス スターター ウェアハウス] を選択します。 ワークスペースに対してサーバーレスが有効になっていない場合は、[スターター ウェアハウス] を選択します。

  5. [追加] ドロップダウン リストで、[視覚化] をクリックします。

  6. [視覚化ウィジェットの追加] ウィンドウで [Daily fare to distance analysis] クエリを選択します。

  7. [既存の視覚化を選択] ボックスの一覧で [Fare by distance] を選択します。

  8. [タイトル] テキスト ボックスに「Daily fare trends」と入力します。

    [視覚化の追加] ウィジェット

  9. [レガシ ダッシュボードに追加] をクリックします。

    Daily fare trends 視覚化がダッシュボードのデザイン サーフェイスに表示されます。

  10. [追加] ボックスの一覧で 2 つ目のウィジェットをダッシュボードに追加してから、[視覚化] をクリックします。

  11. [視覚化ウィジェットの追加] ウィンドウで [Pickup hour] クエリを選択します。

  12. [既存の視覚化を選択] ボックスの一覧で [Bar chart] を選択します。

  13. [タイトル] テキスト ボックスに「Pickup hour distribution」と入力します。

  14. [レガシ ダッシュボードに追加] をクリックします。

  15. ダッシュボード内の最初の視覚化の幅と一致するようにこの視覚化のサイズを変更します。

  16. [編集が完了しました] をクリックします。

最初のダッシュボード

各クエリに乗車場所郵便番号パラメーターを追加する

  1. SQL エディターで Daily fare to distance analysis クエリを開きます。

  2. 次の WHERE 句を Daily fare to distance analysis クエリに追加して乗車場所郵便番号でクエリをフィルター処理します。

    WHERE
      pickup_zip IN ({{ pickupzip }})
    
  3. [pickupzip] ボックスに 10018 と入力してから、[変更の適用] をクリックして乗車場所郵便番号パラメーターありでクエリを実行します。

  4. [保存] をクリックします。

  5. Pickup hour クエリを開きます。

  6. Pickup hour クエリに次の WHERE 句を追加して乗車場所郵便番号でクエリをフィルター処理します。 この句は GROUP BY 句の前に追加します。

       WHERE
         pickup_zip IN ({{ pickupzip }})
    
  7. [pickupzip] ボックスに 10018 と入力してから、[変更の適用] をクリックして乗車場所郵便番号フィルターありでクエリを実行します。

  8. [保存] をクリックします。

ダッシュボード パラメーターを使用するようにダッシュボードを更新する

  1. NYC taxi trip analysis ダッシュボードを開きます。

    各視覚化に乗車場所郵便番号パラメーターが含まれるようになりました。

    ウィジェット - パラメーター

  2. このダッシュボードのケバブ メニュー 縦方向の省略記号 をクリックしてから [編集] をクリックします。

  3. Daily fare trends 視覚化のケバブ メニュー 縦方向の省略記号 をクリックしてから [ウィジェット設定の変更] をクリックします。

  4. [パラメーター] セクションで、[値] フィールドのウィジェット パラメーターの鉛筆アイコン 編集アイコン をクリックします。

    ウィジェット パラメーターを表示する

  5. [ソースと値の編集] ウィンドウで [ソース][新しいダッシュボード パラメーター] に変更します。

    ウィジェット パラメーターを新しいダッシュボード パラメーターに変更する

  6. [OK] をクリックしてから [保存] をクリックします。

    pickupzip ダッシュボード パラメーターが表示され、Daily fare trends 視覚化のウィジェット パラメーターが表示されなくなりました。

    1. Pickup hour distribution 視覚化のケバブ メニュー 縦方向の省略記号 をクリックしてから [ウィジェット設定の変更] をクリックします。
  7. [パラメーター] セクションで、[値] フィールドのウィジェット パラメーターの鉛筆アイコン 編集アイコン をクリックします。

  8. [ソースと値の編集] ウィンドウで [ソース][既存のダッシュボード パラメーター] に変更します。

  9. [キー] の値として pickupzip が選択されていることを確認します。

  10. [OK] をクリックしてから [保存] をクリックします。

    Pickup hour distribution 視覚化のウィジェット パラメーターが表示されなくなりました。

  11. [編集の完了] をクリックします。

  12. pickupzip ダッシュボード パラメーターの値を 10017 に変更してから [変更の適用] をクリックします。

    各視覚化で、乗車のデータとして郵便番号 10017 が表示されるようになりました。

    ウィジェット パラメーターを新しいダッシュボード パラメーターに変更する