模型定型範例
本節包含範例,示範如何使用許多熱門的開放原始碼連結庫,在 Azure Databricks 上定型機器學習模型。
您也可以使用 AutoML 來自動準備數據集以進行模型定型、使用 scikit-learn 和 XGBoost 等開放原始碼連結庫執行一組試用版,以及為每個試用版執行建立具有原始程式碼的 Python 筆記本,以便檢閱、重現和修改程式代碼。
如需示範如何定型使用 Unity 目錄中數據的機器學習模型,並將預測寫回 Unity 目錄的範例筆記本,請參閱 使用 Unity 目錄定型和註冊機器學習模型。
機器學習範例
套件 | 筆記本(秒) | 功能 |
---|---|---|
scikit-learn | 機器學習教學課程 | 使用 Hyperopt 和 MLflow 進行分類模型、MLflow、自動化超參數微調 |
scikit-learn | 端對端範例 | 分類模型、MLflow、使用 Hyperopt 和 MLflow 進行自動化超參數微調、XGBoost、模型登錄、模型服務 |
MLlib | MLlib 範例 | 二元分類, 判定樹, GBT 回歸, 結構化串流, 自定義轉換器 |
xgboost | XGBoost 範例 | Python、PySpark 和 Scala、單一節點工作負載和分散式定型 |
超參數微調範例
如需 Azure Databricks 中超參數微調的一般資訊,請參閱 超參數微調。
套件 | Notebook | 功能 |
---|---|---|
Hyperopt | 分散式 Hyperopt | 分散式 Hyperopt、scikit-learn、MLflow |
Hyperopt | 比較模型 | 使用分散式超參數同時搜尋不同模型類型的超參數空間 |
Hyperopt | 分散式定型演算法和 Hyperopt | Hyperopt、MLlib |
Hyperopt | Hyperopt 最佳做法 | 不同大小的數據集最佳做法 |