在筆記本中使用 Spark

已完成

您可以在 Spark 上執行許多不同類型的應用程式,包括 Python 或 Scala 指令碼中的程式碼、編譯為 JAVA 封存 (JAR) 的 JAVA 程式碼,以及其他程式碼。 Spark 通常用於兩種工作負載:

  • 批次或串流處理作業以內嵌、清除和轉換資料 - 通常是在自動化管線中執行。
  • 互動式分析工作階段,以探索、分析資料,以及將其視覺化。

在筆記本中執行 Spark 程式碼

Azure Databricks 中包含使用 Spark 的整合式筆記本介面。 筆記本提供直覺的方式,可將程式碼與 Markdown 附註結合,通常供資料科學家和資料分析師使用。 Azure Databricks 整合式筆記本體驗的外觀與風格,和熱門的開放原始碼筆記本平台 Jupyter 筆記本相似。

Azure Databricks 中的筆記本螢幕擷取畫面。

筆記本包含一或多個「儲存格」,每個儲存格都包含程式碼或 Markdown。 筆記本中的程式碼儲存格有一些功能可協助您提高生產力,包括:

  • 語法醒目提示和錯誤支援。
  • 自動完成程式碼。
  • 互動式資料視覺效果。
  • 匯出結果的能力。

提示

若要深入了解如何在 Azure Databricks 中使用筆記本,請參閱 Azure Databricks 文件中的筆記本一文。