識別 Azure Databricks 工作負載
Azure Databricks 是一個全方位平台,可提供許多資料處理功能。 雖然您可以使用服務來支援任何需要可調整資料處理的工作負載,但 Azure Databricks 特別支援下列類型的資料工作負載:
- 資料科學與工程
- Machine Learning
- SQL*
*SQL 工作負載僅適用於進階層工作區。
資料科學與工程
Azure Databricks 可對資料湖存放庫的大量資料進行 Apache Spark 型擷取、處理和分析。 資料工程師、資料科學家和資料分析師可以使用互動式筆記本,在 Python、Scala、SparkSQL 或其他語言中執行程式碼,以清理、轉換、彙總和分析資料。
Machine Learning
Azure Databricks 支援機器學習工作負載,包括資料探索和準備、定型和評估機器學習模型,以及提供模型來產生應用程式和分析的預測。 資料科學家和 ML 工程師可以使用 AutoML 來快速定型預測模型,或應用常見的機器學習架構技能,例如 SparkML、Scikit-Learn、PyTorch 和 Tensorflow。 他們也可以使用 MLFlow 管理端對端機器學習生命週期。
資料倉儲
Azure Databricks 支援對儲存在 SQL 倉儲資料表中的資料進行 SQL 型查詢。 這項功能可讓資料分析師使用熟悉的 SQL 語法和各種 SQL 型資料分析和視覺化工具,來查詢、彙總、摘要和視覺化資料。
注意
SQL 倉儲僅適用於「進階」Azure Databricks 工作區。