開始使用:從筆記本查詢數據並將其可視化
本入門文章會逐步引導您使用 Azure Databricks Notebook 來查詢使用 SQL、Python、Scala 和 R 儲存在 Unity 目錄中的範例數據,然後將筆記本中的查詢結果可視化。
需求
若要完成本文中的工作,您必須符合下列需求:
- 您的工作區必須 已啟用 Unity 目錄 。 如需開始使用 Unity 目錄的資訊,請參閱 設定和管理 Unity 目錄。
- 您必須擁有使用現有計算資源或建立新計算資源的許可權。 請參閱 開始使用:帳戶和工作區設定 ,或查看您的 Databricks 系統管理員。
步驟 1:建立新的筆記本
若要在工作區中建立筆記本,請按兩下提要字段中的 [新增],然後按兩下 [筆記本]。 空白筆記本會在工作區中開啟。
若要深入瞭解如何建立和管理筆記本,請參閱 管理筆記本。
步驟 2:查詢數據表
samples.nyctaxi.trips
使用您選擇的語言查詢 Unity 目錄中的數據表。
將下列程式代碼複製並貼到新的空白筆記本數據格中。 此程式代碼會顯示查詢
samples.nyctaxi.trips
Unity 目錄中資料表的結果。SQL
SELECT * FROM samples.nyctaxi.trips
Python
display(spark.read.table("samples.nyctaxi.trips"))
Scala
display(spark.read.table("samples.nyctaxi.trips"))
R
library(SparkR) display(sql("SELECT * FROM samples.nyctaxi.trips"))
按
Shift+Enter
以執行儲存格,然後移至下一個儲存格。查詢結果會出現在筆記本中。
步驟 3:顯示數據
依車程距離顯示平均票價金額,並依取貨郵遞區編碼分組。
在 [ 數據表] 索引標籤旁,按兩下 + ,然後按兩下 [ 視覺效果]。
視覺效果編輯器隨即顯示。
在 [ 視覺效果類型 ] 下拉式清單中,確認已 選取 [直方圖 ]。
選取
fare_amount
X 資料行。選取
trip_distance
Y 資料行。選取
Average
作為匯總類型。選取
pickup_zip
為 [ 依群組] 數據行。按一下 [檔案] 。
下一步
- 若要瞭解如何將數據從 CSV 檔案新增至 Unity 目錄並可視化數據,請參閱 開始使用:從筆記本匯入和可視化 CSV 數據。
- 若要瞭解如何使用 Apache Spark 將數據載入 Databricks,請參閱 教學課程:使用 Apache Spark DataFrame 載入和轉換數據。
- 若要深入瞭解將數據內嵌至 Databricks,請參閱 將數據內嵌至 Databricks Lakehouse。
- 若要深入瞭解如何使用 Databricks 查詢數據,請參閱 查詢數據。
- 若要深入了解視覺效果,請參閱 Databricks 筆記本中的視覺效果。