識別 Azure Databricks 工作負載

已完成

Azure Databricks 提供各種工作負載的功能,包括 機器學習 和大型語言模型(LLM)、資料科學、資料工程師、BI 和 資料倉儲,以及串流處理。

資料科學與工程

此工作負載是專為需要共同作業複雜數據處理工作的數據科學家和工程師所設計。 它提供 Apache Spark 的整合式環境,以在 Data Lakehouse 中處理巨量數據處理,並支援多種語言,包括 Python、R、Scala 和 SQL。 平臺可協助數據探索、視覺效果及數據管線的開發。

Databricks 數據擷取和數據源畫面的圖表。

Machine Learning

Azure Databricks 上的 機器學習 工作負載已針對大規模建置、定型和部署機器學習模型進行優化。 其中包含 MLflow,這是一個開放原始碼平臺,可管理 ML 生命週期,包括實驗、重現性和部署。 它也支持各種 ML 架構,例如 TensorFlow、PyTorch 和 Scikit-learn,使其適用於不同的 ML 工作。

Databricks 機器學習 畫面的圖表。

SQL

SQL 工作負載適用於主要透過 SQL 與數據互動的數據分析師。 它提供熟悉的 SQL 編輯器、儀錶板和自動視覺效果工具,以直接在 Azure Databricks 內分析和可視化數據。 此工作負載很適合用來執行快速臨機操作查詢,以及從大型數據集建立報表。

DatabricksSQL 編輯器畫面的圖表。