microsoftml (SQL Server 機器學習服務中的 Python 套件)

適用於:SQL Server 2017 (14.x) 和更新版本

microsoftml 為 Microsoft 的 Python 套件,提供高效能的機器學習演算法。 它包含用於定型與轉換、評分、文字與影像分析的函式,以及用於從現有資料衍生值的特徵擷取。 該套件包含在 SQL Server 機器學習服務中,並支援高效能巨量資料,同時使用多核心處理,以及快速的資料串流。

套件詳細資料 資訊
目前的版本: 9.4
建置於: Python 3.7.1Anaconda 4.2 發行版本
套件發行版本: SQL Server 機器學習服務 2017 或 2019 版。

如何使用 microsoftml

當您將 Python 新增至安裝時,microsoftml 模組會安裝為 SQL Server 機器學習服務的一部分。 您會取得一套完整的專屬套件,以及具有其模組與解譯器的 Python 發行版本。 您可以使用任何 Python IDE 在 microsoftml 中撰寫 Python 指令碼呼叫函式,但指令碼必須在同時具有 SQL Server 機器學習服務和 Python 的電腦上執行。

Microsoftmlrevoscalepy 緊密結合;在 microsoftml 中使用的資料來源會定義為 revoscalepy 物件。 revoscalepy 中的計算內容限制會轉移至 microsoftml。 也就是說,所有功能都可供本機作業使用,但要切換到遠端計算內容則需要 RxSparkRxInSQLServer

版本與平台

只有在安裝了下列其中一個Microsoft 產品或下載項目時,才有 microsoftml 模組可供使用:

注意

在 SQL Server 2017 中,完整產品發行版本僅適用於 Windows。 在 SQL Server 2019 中,microsoftml 則同時支援 Windows 和 Linux。

套件相依性

microsoftml 中的演算法在下列方面倚賴 revoscalepy

  • 資料來源物件 - microsoftml 函式所取用的資料是使用 revoscalepy 函式建立的。
  • 遠端運算(將函式執行移轉至遠端 SQL Server 實例) - revoscalepy 套件會提供函式來建立和啟用 SQL Server 的遠端計算內容。

在大多數情況下,您會在每次使用 microsoftml 時一起載入套件。

依類別區分的函式

本節依類別列出函式,讓您了解每個函式的使用方式。 您也可以使用目錄來依字母順序尋找函式。

1-定型函式

函式 描述
microsoftml.rx_ensemble 將一整團模型定型。
microsoftml.rx_fast_forest 隨機樹系。
microsoftml.rx_fast_linear 線性模型。 具有推測雙座標堆疊。
microsoftml.rx_fast_trees 強化樹。
microsoftml.rx_logistic_regression 羅吉斯迴歸。
microsoftml.rx_neural_network 類神經網路。
microsoftml.rx_oneclass_svm 異常偵測。

2-轉換函式

類別目錄變數處理

函式 描述
microsoftml.categorical 將文字資料行轉換成類別。
microsoftml.categorical_hash 將文字資料行雜湊並轉換成類別。

結構描述操作

函式 描述
microsoftml.concat 將多個資料行串連成單一向量。
microsoftml.drop_columns 置放來自資料集的資料行。
microsoftml.select_columns 保留資料集的資料行。

變數選取

函式 描述
microsoftml.count_select 以計數為基礎的特徵選取。
microsoftml.mutualinformation_select 以相互資訊為基礎的特徵選取。

文字分析

函式 描述
microsoftml.featurize_text 將文字資料行轉換成數值特徵。
microsoftml.get_sentiment 情感分析。

影像分析

函式 描述
microsoftml.load_image 載入影像。
microsoftml.resize_image 調整影像的大小。
microsoftml.extract_pixels 從影像中擷取像素。
microsoftml.featurize_image 將影像轉換成特徵。

特徵化函式

函式 描述
microsoftml.rx_featurize 資料來源的資料轉換

評分函式

函式 描述
microsoftml.rx_predict 使用 Microsoft 機器學習模型進行評分

如何呼叫 microsoftml

封裝在預存程序中的 Python 程式碼可呼叫 microsoftml 中的函式。 大多數開發人員會在本機建置 microsoftml 解決方案,然後將完成的 Python 程式碼移轉至預存程序作為部署練習。

適用於 Python 的 microsoftml 套件是預設的安裝項目,但與 revoscalepy 不同,當您使用與 SQL Server 一起安裝的 Python 可執行檔來啟動 Python 工作階段時,預設並不會載入此套件。

作為第一步,請載入 microsoftml 套件,然後如果您需要使用遠端計算內容、相關連線能力或資料來源物件,則載入 revoscalepy。 接著,參考您需要的個別函式。

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

另請參閱