在 Azure Databricks 上的機器學習

在 Azure Databricks 上建置、部署並管理機器學習應用程式。這個整合平台統一了從資料準備到生產監控的整個機器學習生命週期。

開始

試試快速入門，用 vibe code 做模型，然後用筆記本。

Guide	Description
開始：在 Databricks 上建立你的第一個機器學習模型	用 scikit-learn 建立並部署一個簡單的分類模型。
使用 Genie Code 進行資料科學	使用代理來探索資料、建立模型並反覆迭代。
Databricks 工作簿	協作開發環境，支援 Python、R、Scala 及 SQL。
概念：Azure Databricks 上的資料科學與機器學習	在 Azure Databricks 上學習資料科學與機器學習的核心概念。

設計特徵、建立機器學習模型，並追蹤實驗。

Feature	Description
功能商店	做特徵工程、管理 Unity Catalog 的功能，以及在生產環境中提供功能。
模型訓練範例	探索使用熱門函式庫訓練經典機器學習模型的端對端範例。
適用於 ML 的 Databricks Runtime	預先設定叢集，包含 scikit-learn、XGBoost、MLflow 及其他機器學習函式庫，並支援深度學習框架。
MLflow 追蹤	追蹤實驗、比較模型效能，以及管理完整的模型開發生命週期。

使用託管運算與內建框架來開發深度學習模型。

Feature	Description
AI 執行時間	使用無伺服器 GPU 運算來進行自訂的深度學習訓練與推論工作負載。
分散式訓練範例	探索使用 Ray、TorchDistributor 和 DeepSpeed 的分散式深度學習範例。
DL 最佳實務	學習框架選擇、資料載入、分散式擴展，以及深度學習模型生命週期管理。
Databricks 上的Ray	使用分散式運算調整 ML 工作負載，以進行大規模模型定型和推斷。

將模型部署到生產環境，並配備可擴展的端點，以支援即時、串流或批次推論。

Feature	Description
模特兒服務	部署自訂模型與大型語言模型作為 REST 端點，具備自動擴展與 GPU 支援。
人工智慧網關	管理並監控 Azure Databricks 上所提供的模型存取權限，並具備使用追蹤、有效載荷記錄及安全控管功能。
批次推論	部署用於大量資料集的批次與串流推論與預測模型。
基礎模型 API	存取並查詢由 Databricks 所託管的最先進 AI 模型。

確保模型品質、數據完整性和合規性，以及完整的監視和治理工具。

Feature	Description
Unity 目錄	使用統一訪問控制、譜系追蹤和探索來管理數據、特徵、模型和函式。
MLflow 用於模型	管理整個機器學習生命週期，從實驗與模型到評估與部署。
異常偵測	在目錄層級監視資料新鮮度和完整性。
資料分析	使用自動化警示和根本原因分析來監視數據品質、模型效能和預測漂移。

使用自動化工作流程、CI/CD 整合和準備投入生產的管線來擴展機器學習作業規模。

Feature	Description
Unity 目錄中的模型	使用 Unity 目錄中的模型登錄進行集中式治理，以及管理模型生命週期，包括部署。
Lakeflow 職位	為機器學習管道建立自動化工作流程。
宣告式自動化套件	以程式碼管理 Azure Databricks 基礎設施，用於 CI/CD，包括機器學習訓練與部署。
MLOps 工作流程	了解端對端MLOp，具備自動化訓練、測試與部署流程。

此頁面對您有幫助嗎？