Databricks 數據工程

Databricks 數據工程功能是數據科學家、數據工程師和數據分析師之間共同作業的強大環境。 數據工程工作也是 Databricks 機器學習解決方案的骨幹。

注意

如果您是主要使用 SQL 查詢和 BI 工具的數據分析師,您可能會偏好 使用 Databricks SQL

名稱 當您要...
Delta Live Tables 瞭解如何使用 Databricks Delta 實時數據表建置數據管線來擷取和轉換。
結構化串流 瞭解 Databricks 上結構化串流所提供的串流、增量和即時工作負載。
Apache Spark 瞭解 Apache Spark 如何在 Databricks 和 Databricks 平台上運作。
計算 瞭解 Databricks 叢集,以及如何建立和管理它們。
Notebooks 瞭解 Databricks 筆記本是什麼,以及如何使用和管理筆記本來處理、分析及可視化您的數據。
工作流程 瞭解如何在 Databricks 平臺上協調數據處理、機器學習和數據分析工作流程。
Libraries 瞭解如何使用連結庫在 Databricks 中提供第三方或自定義程式代碼。 瞭解在 Databricks 上安裝連結庫的不同模式。
Git 資料夾 瞭解如何使用 Git 來版本控制筆記本和其他檔案,以在 Databricks 中開發。
DBFS 瞭解 Databricks 文件系統 (DBFS),掛接至 Databricks 工作區的分散式文件系統,並在 Databricks 叢集上取得
檔案 瞭解在 Databricks 上使用檔案的選項。
移轉 瞭解如何將 ETL 作業、企業數據倉儲、ML、數據科學和分析等數據應用程式遷移至 Databricks。
優化與效能 瞭解 Databricks 的優化和效能建議。