分享方式:


在 Azure Databricks 上使用 Apache Spark MLlib

此頁面提供範例 Notebook,示範如何在 Azure Databricks 上使用 MLlib。

Apache Spark MLlib 是 Apache Spark 機器學習程式庫,包含常見的學習演算法和公用程式 (包括分類、迴歸、叢集、協同篩選、維度縮減,以及基礎最佳化基本項目)。 如需 MLlib 功能的參考資訊,Azure Databricks 建議下列 Apache Spark API 參考資料:

如需從 R 使用 Apache Spark MLlib 的詳細資訊,請參閱 R 機器學習文件。

二元分類範例 Notebook

此 Notebook 會示範如何使用 Apache Spark MLlib 管線 API 組建二元分類應用程式。

二元分類 Notebook

取得筆記本

決策樹範例 Notebook

這些範例示範各種使用 Apache Spark MLlib 管線 API 的決策樹應用程式。

決策樹

這些 Notebook 會示範如何使用判定樹執行分類。

數位辨識 Notebook 的決策樹

取得筆記本

SFO 問卷 Notebook 的決策樹

取得筆記本

使用 MLlib 管線的 GBT 迴歸

此 Notebook 會示範如何使用 MLlib 管線,以使用梯度提升的樹狀結構執行迴歸,從一週的一天、天氣、季節等資訊預測自行車出租計數 (每小時)。

自行車共用迴歸 Notebook

取得筆記本

進階 Apache Spark MLlib Notebook 範例

此 Notebook 說明如何建立自訂轉換器。

自訂轉換器 Notebook

取得筆記本