開始使用:從筆記本查詢數據並將其可視化

本入門文章會逐步引導您使用 Azure Databricks Notebook 來查詢使用 SQL、Python、Scala 和 R 儲存在 Unity 目錄中的範例數據,然後將筆記本中的查詢結果可視化。

需求

若要完成下列文章,您必須符合下列需求:

步驟 1:建立新的筆記本

若要在工作區中建立筆記本:

  1. 按兩下 新增圖示提要欄位中的 [新增 ],然後按兩下 [ 筆記本]。
  2. 在 [建立筆記本] 頁面上:
    • 指定筆記本的唯一名稱。
    • 設定筆記本的默認語言,然後按兩下 [確認], 如果出現提示。
    • 使用 [連線] 下拉功能表來選取計算資源。 若要建立新的計算資源,請參閱 使用計算

若要深入瞭解如何建立和管理筆記本,請參閱 管理筆記本

步驟 2:查詢數據表

samples.nyctaxi.trips使用您選擇的語言查詢 Unity 目錄中的數據表。

SQL

  1. 將下列程式代碼複製並貼到新的空白筆記本數據格中。 此程式代碼會顯示查詢 samples.nyctaxi.trips Unity 目錄中資料表的結果。
SELECT * FROM samples.nyctaxi.trips

Python

  1. 將下列程式代碼複製並貼到新的空白筆記本數據格中。 此程式代碼會顯示查詢 samples.nyctaxi.trips Unity 目錄中資料表的結果。
display(spark.read.table("samples.nyctaxi.trips"))

Scala

  1. 將下列程式代碼複製並貼到新的空白筆記本數據格中。 此程式代碼會顯示查詢 samples.nyctaxi.trips Unity 目錄中資料表的結果。
display(spark.read.table("samples.nyctaxi.trips"))

R

  1. 將下列程式代碼複製並貼到新的空白筆記本數據格中。 此程式代碼會顯示查詢 samples.nyctaxi.trips Unity 目錄中資料表的結果。
library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))
  1. Shift+Enter 以執行儲存格,然後移至下一個儲存格。

    查詢結果會出現在筆記本中。

步驟 3:顯示數據

依車程距離顯示平均票價金額,並依取貨郵遞區編碼分組。

  1. 在 [ 數據表] 索引標籤旁,按兩下 + ,然後按兩下 [ 視覺效果]。

    視覺效果編輯器隨即顯示。

  2. 在 [ 視覺效果類型 ] 下拉式清單中,確認已 選取 [直方圖 ]。

  3. 選取 fare_amount X 資料行

  4. 選取 trip_distanceY 資料行

  5. 選取 Average 作為匯總類型。

  6. 選取 pickup_zip 為 [ 依群組] 數據行。

    橫條圖

  7. 按一下 [檔案] 。

下一步