在 Azure Databricks 上使用 scikit-learn

此頁面提供如何使用 scikit-learn 套件在 Azure Databricks 中定型機器學習模型的範例。 scikit-learn 是適用於單一節點機器學習的最常用 Python 連結庫之一,並包含在 Databricks Runtime 和 Databricks Runtime ML 中。 如需叢集運行時間隨附的 scikit-learn 連結庫版本資訊,請參閱 Databricks Runtime 版本資訊

您可以 匯入這些筆記本, 並在 Azure Databricks 工作區中執行這些筆記本。

如需在 Azure Databricks 上快速開始使用的其他範例筆記本,請參閱 教學課程:開始使用 ML

使用 scikit-learn 的基本範例

此筆記本提供 Azure Databricks 上機器學習模型定型的快速概觀。 它會使用 scikit-learn 套件來定型簡單的分類模型。 它也說明如何使用 MLflow 來追蹤模型開發程式,以及 使用 Hyperopt 來自動化超參數微調。

scikit-learn 分類筆記本

取得筆記本

在 Azure Databricks 上使用 scikit-learn 的端對端範例

此筆記本使用 scikit-learn 來說明載入數據、模型定型、分散式超參數微調和模型推斷的完整端對端範例。 它也說明使用 MLflow 模型登錄來記錄和註冊您的模型生命週期管理。

如果您的工作區已啟用 Unity 目錄,請使用此版本的筆記本:

在 Databricks 上使用 scikit-learn 與 MLflow 整合 (Unity 目錄)

取得筆記本

如果您的工作區未針對 Unity 目錄啟用,請使用此版本的筆記本:

在 Databricks 上使用 scikit-learn 與 MLflow 整合

取得筆記本