識別 Azure Databricks 工作負載

已完成

Azure Databricks 是一個全方位平台,可提供許多資料處理功能。 雖然您可以使用服務來支援任何需要可調整資料處理的工作負載,但 Azure Databricks 特別支援下列類型的資料工作負載:

  • 資料科學與工程
  • Machine Learning
  • SQL*

*SQL 工作負載僅適用於進階層工作區。

資料科學與工程

Azure Databricks 可對資料湖存放庫的大量資料進行 Apache Spark 型擷取、處理和分析。 資料工程師、資料科學家和資料分析師可以使用互動式筆記本,在 Python、Scala、SparkSQL 或其他語言中執行程式碼,以清理、轉換、彙總和分析資料。

Azure Databricks 入口網站的資料科學與工程螢幕擷取畫面。

Machine Learning

Azure Databricks 支援機器學習工作負載,包括資料探索和準備、定型和評估機器學習模型,以及提供模型來產生應用程式和分析的預測。 資料科學家和 ML 工程師可以使用 AutoML 來快速定型預測模型,或應用常見的機器學習架構技能,例如 SparkML、Scikit-Learn、PyTorch 和 Tensorflow。 他們也可以使用 MLFlow 管理端對端機器學習生命週期。

Azure Databricks 入口網站的機器學習螢幕擷取畫面。

資料倉儲

Azure Databricks 支援對儲存在 SQL 倉儲資料表中的資料進行 SQL 型查詢。 這項功能可讓資料分析師使用熟悉的 SQL 語法和各種 SQL 型資料分析和視覺化工具,來查詢、彙總、摘要和視覺化資料。

Azure Databricks 入口網站的 SQL 螢幕擷取畫面。

注意

SQL 倉儲僅適用於「進階」Azure Databricks 工作區。