開始使用:從筆記本查詢數據並將其可視化
本入門文章會逐步引導您使用 Azure Databricks Notebook 來查詢使用 SQL、Python、Scala 和 R 儲存在 Unity 目錄中的範例數據,然後將筆記本中的查詢結果可視化。
需求
若要完成下列文章,您必須符合下列需求:
- 您的工作區必須 已啟用 Unity 目錄 。 如需開始使用 Unity 目錄的資訊,請參閱 設定和管理 Unity 目錄。
- 您必須擁有使用現有計算資源或建立新計算資源的許可權。 請參閱 開始使用:帳戶和工作區設定 ,或查看您的 Databricks 系統管理員。
步驟 1:建立新的筆記本
若要在工作區中建立筆記本:
- 按兩下 提要欄位中的 [新增 ],然後按兩下 [ 筆記本]。
- 在 [建立筆記本] 頁面上:
- 指定筆記本的唯一名稱。
- 設定筆記本的默認語言,然後按兩下 [確認], 如果出現提示。
- 使用 [連線] 下拉功能表來選取計算資源。 若要建立新的計算資源,請參閱 使用計算。
若要深入瞭解如何建立和管理筆記本,請參閱 管理筆記本。
步驟 2:查詢數據表
samples.nyctaxi.trips
使用您選擇的語言查詢 Unity 目錄中的數據表。
SQL
- 將下列程式代碼複製並貼到新的空白筆記本數據格中。 此程式代碼會顯示查詢
samples.nyctaxi.trips
Unity 目錄中資料表的結果。
SELECT * FROM samples.nyctaxi.trips
Python
- 將下列程式代碼複製並貼到新的空白筆記本數據格中。 此程式代碼會顯示查詢
samples.nyctaxi.trips
Unity 目錄中資料表的結果。
display(spark.read.table("samples.nyctaxi.trips"))
Scala
- 將下列程式代碼複製並貼到新的空白筆記本數據格中。 此程式代碼會顯示查詢
samples.nyctaxi.trips
Unity 目錄中資料表的結果。
display(spark.read.table("samples.nyctaxi.trips"))
R
- 將下列程式代碼複製並貼到新的空白筆記本數據格中。 此程式代碼會顯示查詢
samples.nyctaxi.trips
Unity 目錄中資料表的結果。
library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))
按
Shift+Enter
以執行儲存格,然後移至下一個儲存格。查詢結果會出現在筆記本中。
步驟 3:顯示數據
依車程距離顯示平均票價金額,並依取貨郵遞區編碼分組。
在 [ 數據表] 索引標籤旁,按兩下 + ,然後按兩下 [ 視覺效果]。
視覺效果編輯器隨即顯示。
在 [ 視覺效果類型 ] 下拉式清單中,確認已 選取 [直方圖 ]。
選取
fare_amount
X 資料行。選取
trip_distance
Y 資料行。選取
Average
作為匯總類型。選取
pickup_zip
為 [ 依群組] 數據行。按一下 [檔案] 。
下一步
- 若要瞭解如何使用 Apache Spark 將數據載入 Databricks,請參閱 教學課程:使用 Apache Spark DataFrame 載入和轉換數據。
- 若要深入瞭解將數據內嵌至 Databricks,請參閱 將數據內嵌至 Databricks Lakehouse。
- 若要深入瞭解如何使用 Databricks 查詢數據,請參閱 查詢數據。
- 若要深入了解視覺效果,請參閱 Databricks 筆記本中的視覺效果。