microsoftml (SQL Server Machine Learning Services の Python パッケージ)
適用対象: SQL Server 2017 (14.x) 以降
microsoftml は、Microsoft が提供する Python パッケージであり、ハイパフォーマンスの機械学習アルゴリズムを備えています。 トレーニング、変換、スコアリング、テキストと画像の分析、既存のデータから値を派生させるための特徴抽出を行うための関数が含まれています。 このパッケージは、SQL Server Machine Learning Services に含まれており、マルチコア処理を使用したビッグ データでのハイパフォーマンス、および高速データ ストリーミングをサポートしています。
パッケージの詳細 | 情報 |
---|---|
現在のバージョン: | 9.4 |
基礎となるプログラミング言語: | Python 3.7.1 の Anaconda 4.2 ディストリビューション |
パッケージ ディストリビューション: | SQL Server Machine Learning Services バージョン 2017 または 2019。 |
microsoftml の使用方法
インストールに Python を追加すると、SQL Server Machine Learning サービスの一部として、microsoftml モジュールがインストールされます。 独占パッケージの完全コレクションに加え、Python ディストリビューション、そのモジュールとインタープリターを取得できます。 Python IDE を使用し、microsoftml で Python スクリプトを呼び出す関数を作成できますが、そのスクリプトは、Python と SQL Server Machine Learning サービスがインストールされたコンピューター上で実行する必要があります。
microsoftml と revoscalepy は密結合されています。microsoftml で使用されるデータ ソースは、revoscalepy オブジェクトとして定義されています。 revoscalepy でコンピューティング コンテキストの制限は microsoftml に転送されます。 つまり、ローカル操作ではすべての機能を使用できますが、リモート コンピューティング コンテキストに切り替えるには RxSpark または RxInSQLServer が必要です。
バージョンとプラットフォーム
microsoftml モジュールは次のいずれかの Microsoft 製品またはダウンロードをインストールした場合にのみ利用できます。
Note
完全な製品リリース バージョンは、SQL Server 2017 では Windows のみです。 SQL Server 2019 の microsoftml では、Windows と Linux の両方がサポートされています。
パッケージの依存関係
microsoftml のアルゴリズムは、次に関して revoscalepy に依存します。
- データ ソース オブジェクト - microsoftml 関数によって使用されるデータは、revoscalepy 関数を使用して作成されます。
- リモート コンピューティング (関数の実行をリモート SQL Server インスタンスにシフトする) - revoscalepy パッケージには、SQL Serverのリモート計算コンテキストを作成してアクティブ化するための関数があります。
ほとんどの場合、microsoftml を使用しているときは常に、パッケージをまとめて読み込みます。
カテゴリ別の関数
このセクションでは、関数をカテゴリ別に一覧表示し、それぞれの使用方法について説明します。 目次を使用して関数をアルファベット順に検索することもできます。
1 - トレーニング関数
機能 | 説明 |
---|---|
microsoftml.rx_ensemble | モデルのアンサンブルをトレーニングします。 |
microsoftml.rx_fast_forest | ランダム フォレスト。 |
microsoftml.rx_fast_linear | 線形モデル。 確率的双対座標上昇法による。 |
microsoftml.rx_fast_trees | ブーストされたツリー。 |
microsoftml.rx_logistic_regression | ロジスティック回帰。 |
microsoftml.rx_neural_network | ニューラル ネットワーク。 |
microsoftml.rx_oneclass_svm | 異常検出。 |
2 - 変換関数
カテゴリ変数の処理
機能 | 説明 |
---|---|
microsoftml.categorical | テキスト列をカテゴリに変換します。 |
microsoftml.categorical_hash | テキスト列をハッシュし、カテゴリに変換します。 |
スキーマ操作
機能 | 説明 |
---|---|
microsoftml.concat | 複数の列を連結して 1 つのベクトルにします。 |
microsoftml.drop_columns | データセットから列を削除します。 |
microsoftml.select_columns | データセットの列を保持します。 |
選択、変数
機能 | 説明 |
---|---|
microsoftml.count_select | カウントに基づく特徴の選択。 |
microsoftml.mutualinformation_select | 相互情報に基づく特徴の選択。 |
テキスト分析
機能 | 説明 |
---|---|
microsoftml.featurize_text | テキスト列を数的特徴に変換します。 |
microsoftml.get_sentiment | 感情分析。 |
画像分析
機能 | 説明 |
---|---|
microsoftml.load_image | 画像を読み込みます。 |
microsoftml.resize_image | 画像サイズを変更します。 |
microsoftml.extract_pixels | 画像からピクセルを抽出します。 |
microsoftml.featurize_image | 画像を特徴に変換します。 |
特徴付け関数
機能 | 説明 |
---|---|
microsoftml.rx_featurize | データ ソースのデータ変換 |
スコア付け関数
関数 | 説明 |
---|---|
microsoftml.rx_predict | Microsoft 機械学習アルゴリズムを使用してスコアを付けます。 |
microsoftml を呼び出す方法
microsoftml 内の関数は、ストアド プロシージャにカプセル化された Python コードで呼び出すことができます。 ほとんどの開発者は、microsoftml ソリューションをローカルでビルドし、完成した Python コードを展開の練習としてストアド プロシージャに移行します。
Python の microsoftml パッケージは既定でインストールされますが、revoscalepy とは異なり、SQL Server でインストールされる Python 実行ファイルで Python を起動したとき、既定では読み込まれません。
最初の手順として、microsoftml パッケージをインポートし、リモート計算コンテキスト、関連する接続またはデータ ソース オブジェクトを使用する必要がある場合は、次に revoscalepy をインポートします。 その後、必要な個々の関数を参照します。
from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource