共用方式為


Azure 資料科學虛擬機器上的機器學習和資料科學工具

Azure 資料科學虛擬機器 (DSVM) 有一組豐富的工具和連結庫可供機器學習使用。 這些資源適用於熱門語言,例如 Python、R 和 Julia。

DSVM 支援下列機器學習工具和連結庫:

適用於 Python 的 Azure Machine Learning SDK

如需完整參考,請瀏覽適用於 Python 的 Azure 機器學習 SDK。

類別
這是什麼? 您可以使用 Azure 機器學習 雲端服務來開發和部署機器學習模型。 您可以在建置、定型、調整及管理模型時,使用 Python SDK 來追蹤模型。 將模型部署為容器,並在雲端、內部部署或 Azure IoT Edge 上執行它們。
支援的版本 Windows (Conda 環境:AzureML)、Linux (Conda 環境:py36)
一般用法 一般機器學習平台
如何設定或安裝它? 搭配 GPU 支援安裝
如何使用或執行它 作為 Python SDK 並安裝於 Azure CLI 中。 在 Windows 版本上啟用 conda 環境AzureML,或在 Linux 版本上啟動至 py36
範例的連結 在目錄中的 AzureML Notebook 下尋找範例 Jupyter Notebook。

H2O

類別
這是什麼? 開放原始碼 AI 平臺,支援分散式、快速、記憶體內部、可調整的機器學習服務。
支援的版本 Linux
一般用法 一般用途的分散式、可調式機器學習
如何設定或安裝它? H2O 是安裝在 /dsvm/tools/h2o 中。
如何使用或執行它 連線 X2Go 的 VM。 啟動新的終端機,然後執行 java -jar /dsvm/tools/h2o/current/h2o.jar。 然後,啟動網頁瀏覽器並連線至 http://localhost:54321
範例的連結 在目錄中 Jupyter h2o 的 VM 上尋找範例。

DSVM 上有數個其他機器學習連結庫,例如 DSVM scikit-learn 的 Anaconda Python 散發套件。 如需 Python、R 和 Julia 中可用的套件清單,請執行個別的套件管理員。

LightGBM

類別
這是什麼? 這是一種以決策樹演算法為基礎的快速、分散式、高效能漸層提升 (GBDT、GBRT、GBM 或 MART) 架構。 機器學習工作 - 排名、分類等 - 使用它。
支援的版本 Windows、Linux
一般用法 一般用途的漸層提升架構
如何設定或安裝它? LightGBM 會安裝為 Windows 上的 Python 套件。 在 Linux 上,命令列可執行檔案位於 /opt/LightGBM/lightgbm。 已安裝 R 套件,並已安裝 Python 套件。
範例的連結 LightGBM 指南 \(英文\)

Rattle

類別
這是什麼? 使用 R 之數據採礦的圖形用戶介面。
支援的版本 Windows、Linux
一般用法 適用於 R 的一般 UI 資料採礦工具
如何使用或執行它 作為 UI 工具。 在 Windows 上,啟動命令提示字元、執行 R,然後在 R 內執行 rattle()。 在 Linux 上,使用 X2Go 進行連線、啟動終端機、執行 R,然後在 R 內執行 rattle()
範例的連結 Rattle \(英文\)

Vowpal Wabbit

類別
這是什麼? 快速、開放原始碼的跨核心學習系統程式庫
支援的版本 Windows、Linux
一般用法 一般機器學習程式庫
如何設定或安裝它? Windows:msi 安裝程式
Linux:apt-get
如何使用或執行它 作為路徑上命令列工具 (C:\Program Files\VowpalWabbit\vw.exe (在 Windows 上)、/usr/bin/vw (在 Linux 上))
範例的連結 VowPal Wabbit 範例 \(英文\)

Weka

類別
這是什麼? 這是一個資料採礦工作的機器學習演算法集合。 您可以直接套用演算法,或從自己的 Java 程式代碼呼叫演算法。 Weka 包含資料前置處理、分類、迴歸、群集、關聯規則和視覺效果的工具。
支援的版本 Windows、Linux
一般用法 一般機器學習程式庫
如何使用或執行它 在 Windows 上,於 [開始] 功能表中搜尋 Weka。 在 Linux 上,使用 X2Go 進行登入,然後移至 [應用程式]>[開發]>[Weka]
範例的連結 Weka 範例 \(英文\)

XGBoost

類別
這是什麼? 快速、可攜且分散式的漸層提升 (GBDT、GBRT 或 GBM) 程式庫,適用於 Python、R、JAVA、Scala、C++ 等。 它可在單一機器、Apache Hadoop 及 Spark 上執行。
支援的版本 Windows、Linux
一般用法 一般機器學習程式庫
如何設定或安裝它? 搭配 GPU 支援安裝
如何使用或執行它 作為 Python 程式庫 (2.7 和 3.6+)、R 套件及路徑上命令列工具 (C:\dsvm\tools\xgboost\bin\xgboost.exe 適用於 Windows、/dsvm/tools/xgboost/xgboost 適用於 Linux)
範例的連結 範例包含在 VM 的 /dsvm/tools/xgboost/demo(適用於 Linux) 中,以及 C:\dsvm\tools\xgboost\demo (適用於 Windows) 中。