SQL Server 2019 のビッグデータクラスターで Machine Learning Services を使用して Python と R のスクリプトを実行する

適用対象: SQL Server 2019 (15.x)

Important

Microsoft SQL Server 2019 ビッグデータクラスターは廃止されました。 SQL Server 2019 ビッグデータクラスターのサポートは、2025 年 2 月 28 日の時点で終了しました。詳細については、Microsoft SQL Server プラットフォームの発表ブログ投稿とビッグデータオプションを参照してください。

Machine Learning Services を使用して SQL Server ビッグデータクラスターのマスターインスタンスで Python や R のスクリプトを実行できます。

Note

また、Java 言語拡張機能を使用して、SQL Server ビッグデータクラスターのマスターインスタンスで Java コードを実行することもできます。以下の手順に従うと、SQL Server言語拡張機能も有効になります。

Machine Learning Services を有効にする

Machine Learning Services は、SQL Server 2019 のビッグデータクラスターに既定でインストールされるため、個別にインストールする必要はありません。

Machine Learning Services を有効にするには、マスターインスタンスで次のステートメントを実行します。

EXEC sp_configure 'external scripts enabled', 1
RECONFIGURE WITH OVERRIDE
GO

ビッグデータクラスターのマスターインスタンスで、Python および R のスクリプトを実行する準備ができました。初めてスクリプトを実行する場合は、「次のステップ」の下のクイックスタートを参照してください。

Note

可用性グループリスナー接続で構成設定を設定することはできません。ビッグデータクラスターが高可用性で展開されている場合は、レプリカごとに external scripts enabled を設定します。「クラスターで高可用性を有効にする」を参照してください。

クラスターで高可用性を有効にする

高可用性で SQL Server ビッグデータクラスターを展開すると、その展開によってマスターインスタンスの可用性グループが作成されます。 Machine Learning Services を有効にするには、可用性グループの各インスタンスに external scripts enabled を設定します。ビッグデータクラスターの場合は、SQL Server マスターインスタンスの各レプリカで sp_configure を実行する必要があります。

次のセクションでは、各インスタンスで外部スクリプトを有効にする方法について説明します。

各インスタンスに対して外部ロードバランサーを作成する

可用性グループの各レプリカに対して、インスタンスへの接続を許可するロードバランサーを作成します。

kubectl expose pod <pod-name> --port=<connection port number> --name=<load-balancer-name> --type=LoadBalancer -n <kubernetes namespace>

この記事の例では、次の値を使用します。

<pod-name>: master-#
<connection port number>: 1533
<load-balancer-name>: mymaster-#
<kubernetes namespace>: mssql-cluster

ご利用の環境に合わせて次のスクリプトを更新して、コマンドを実行します。

kubectl expose pod master-0 --port=1533 --name=mymaster-0 --type=LoadBalancer -n mssql-cluster
kubectl expose pod master-1 --port=1533 --name=mymaster-1 --type=LoadBalancer -n mssql-cluster
kubectl expose pod master-2 --port=1533 --name=mymaster-2 --type=LoadBalancer -n mssql-cluster

kubectl によって次の出力が返されます。

service/mymaster-0 exposed
service/mymaster-1 exposed
service/mymaster-2 exposed

各ロードバランサーは、マスターレプリカのエンドポイントです。

各レプリカでスクリプトの実行を有効にする

マスターレプリカエンドポイントの IP アドレスを取得します。

次のコマンドは、レプリカエンドポイントの外部 IP アドレスを返します。

kubectl get services <load-balancer-name> -n <kubernetes namespace>

このシナリオで各レプリカの外部 IP アドレスを取得するには、次のコマンドを実行します。
```
kubectl get services mymaster-0 -n mssql-cluster
kubectl get services mymaster-1 -n mssql-cluster
kubectl get services mymaster-2 -n mssql-cluster
```
Note

外部 IP アドレスが使用可能になるまでに少し時間がかかることがあります。各エンドポイントが外部 IP アドレスを返すまで、上記のスクリプトを定期的に実行します。
マスターレプリカエンドポイントに接続し、スクリプトの実行を有効にします。

次のステートメントを実行します。
```
EXEC sp_configure 'external scripts enabled', 1
RECONFIGURE WITH OVERRIDE
GO
```
たとえば、sqlcmd を使用して上記のコマンドを実行できます。次の例では、マスターレプリカエンドポイントに接続し、スクリプトの実行を有効にします。スクリプトの値を実際の環境に合わせて更新します。
```
sqlcmd -S <IP address>,1533 -U <user name> -P <password> -Q "EXEC sp_configure 'external scripts enabled', 1; RECONFIGURE WITH OVERRIDE;"
```
レプリカごとにこのステップを繰り返します。

Demonstration

次の図は、このプロセスを示しています。

マスターレプリカエンドポイントを削除する

Kubernetes クラスターで、各レプリカのエンドポイントを削除します。エンドポイントは、負荷分散サービスとして Kubernetes で公開されます。

次のコマンドを実行すると、負荷分散サービスが削除されます。

kubectl delete svc <load-balancer-name> -n mssql-cluster

この記事の例では、次のコマンドを実行します。

kubectl delete svc mymaster-0 -n mssql-cluster
kubectl delete svc mymaster-1 -n mssql-cluster
kubectl delete svc mymaster-2 -n mssql-cluster

SQL Server 2019 のビッグ データ クラスターで Machine Learning Services を使用して Python と R のスクリプトを実行する

Machine Learning Services を有効にする

クラスターで高可用性を有効にする

各インスタンスに対して外部ロード バランサーを作成する

各レプリカでスクリプトの実行を有効にする

Demonstration

マスター レプリカ エンドポイントを削除する

SQL Server のビッグ データ クラスターでの機械学習のクイックスタート

Python quickstarts

R quickstarts

SQL Server のビッグ データ クラスターでの機械学習のチュートリアル

Python tutorial

スキー レンタル (線形回帰)

顧客を分類する (K-Means クラスタリング)

NYC タクシーのヒント (分類)

R tutorials

スキー レンタル (デシジョン ツリー)

顧客を分類する (K-Means クラスタリング)

NYC タクシーのヒント (分類)

SQL Server のビッグ データ クラスターでの機械学習の攻略ガイド

データ探索とモデリング

データ型の変換

Deploy

Predictions

Package management

新しい Python パッケージのインストール

新しい R パッケージのインストール

Monitor

セキュリティ

スパーク機械学習

Next steps

その他のリソース

SQL Server 2019 のビッグデータクラスターで Machine Learning Services を使用して Python と R のスクリプトを実行する

各インスタンスに対して外部ロードバランサーを作成する

マスターレプリカエンドポイントを削除する

SQL Server のビッグデータクラスターでの機械学習のクイックスタート

SQL Server のビッグデータクラスターでの機械学習のチュートリアル

スキーレンタル (線形回帰)

スキーレンタル (デシジョンツリー)

SQL Server のビッグデータクラスターでの機械学習の攻略ガイド