チュートリアル:SQL Server ビッグデータクラスターにサンプルデータを読み込む

[アーティクル]
03/21/2023

適用対象: SQL Server 2019 (15.x)

重要

Microsoft SQL Server 2019 ビッグデータクラスターのアドオンは廃止されます。 SQL Server 2019 ビッグデータクラスターのサポートは、2025 年 2 月 28 日に終了します。ソフトウェアアシュアランス付きの SQL Server 2019 を使用する既存の全ユーザーはプラットフォームで完全にサポートされ、ソフトウェアはその時点まで SQL Server の累積更新プログラムによって引き続きメンテナンスされます。詳細については、お知らせのブログ記事と「Microsoft SQL Server プラットフォームのビッグデータオプション」を参照してください。

このチュートリアルでは、スクリプトを使用して SQL Server 2019 ビッグデータクラスターにサンプルデータを読み込む方法について説明します。ドキュメントに記載されている他のチュートリアルの多くで、このサンプルデータが使用されています。

ヒント

SQL Server 2019 ビッグデータクラスターの追加のサンプルは、sql-server-samples GitHub リポジトリにあります。それらは、パス sql-server-samples/samples/features/sql-big-data-cluster/ に置かれています。

前提条件

展開済みのビッグデータクラスター
ビッグデータツール
- azdata
- kubectl
- sqlcmd
- curl

サンプルデータを読み込む

次の手順では、ブートストラップスクリプトを使用して SQL Server データベースのバックアップをダウンロードし、ご利用のビッグデータクラスターにそのデータを読み込みます。使いやすいように、これらの手順は「Windows」セクションと「Linux」セクションに分けられています。認証メカニズムとして基本的なユーザー名とパスワードを使用する場合は、スクリプトを実行する前に AZDATA_USERNAME と AZDATA_PASSWORD の環境変数を設定します。それ以外の場合、スクリプトでは SQL Server マスターインスタンスと Knox ゲートウェイへの接続に統合認証が使用されます。また、統合認証を使用するには、エンドポイントに対して DNS 名を指定する必要があります。

Windows

次の手順では、Windows クライアントを使用して、ご利用のビッグデータクラスターにサンプルデータを読み込む方法について説明します。

新しい Windows コマンドプロンプトを開きます。

重要

これらの手順には、Windows PowerShell を使用しないでください。 Powershell では、PowerShell バージョンの curl が使用されるため、スクリプトは失敗します。

curl を使用して、サンプルデータ用のブートストラップスクリプトをダウンロードします。

curl -o bootstrap-sample-db.cmd "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.cmd"

bootstrap-sample-db.sql Transact-SQL スクリプトがダウンロードされます。このスクリプトは、ブートストラップスクリプトによって呼び出されます。
```
curl -o bootstrap-sample-db.sql "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sql"
```

ブートストラップスクリプトでは、ご利用のビッグデータクラスターに関する次の位置指定パラメーターが必要です。

パラメーター	説明
<CLUSTER_NAMESPACE>	ビッグデータクラスターに付ける名前。
<SQL_MASTER_ENDPOINT>	マスターインスタンスの DNS 名または IP アドレス。
<KNOX_ENDPOINT>	HDFS および Spark ゲートウェイの DNS 名または IP アドレス。

ヒント

kubectl を使用して、SQL Server マスターインスタンスと Knox の IP アドレスを検索します。 kubectl get svc -n <your-big-data-cluster-name> を実行して、マスターインスタンスの EXTERNAL-IP アドレス (master-svc-external) と Knox (gateway-svc-external) を確認します。クラスターの既定の名前は mssql-cluster です。

ブートストラップスクリプトを実行します。

.\bootstrap-sample-db.cmd <CLUSTER_NAMESPACE> <SQL_MASTER_ENDPOINT> <KNOX_ENDPOINT>

Linux

次の手順では、Linux クライアントを使用して、ご利用のビッグデータクラスターにサンプルデータを読み込む方法について説明します。

ブートストラップスクリプトをダウンロードし、実行可能ファイルのアクセス許可を割り当てます。

curl -o bootstrap-sample-db.sh "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sh"
chmod +x bootstrap-sample-db.sh

bootstrap-sample-db.sql Transact-SQL スクリプトがダウンロードされます。このスクリプトは、ブートストラップスクリプトによって呼び出されます。
```
curl -o bootstrap-sample-db.sql "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sql"
```

ブートストラップスクリプトでは、ご利用のビッグデータクラスターに関する次の位置指定パラメーターが必要です。

パラメーター	説明
<CLUSTER_NAMESPACE>	ビッグデータクラスターに付ける名前。
<SQL_MASTER_ENDPOINT>	マスターインスタンスの DNS 名または IP アドレス。
<KNOX_ENDPOINT>	HDFS および Spark ゲートウェイの DNS 名または IP アドレス。

ヒント

ブートストラップスクリプトを実行します。

./bootstrap-sample-db.sh <CLUSTER_NAMESPACE> <SQL_MASTER_ENDPOINT> <KNOX_ENDPOINT>

次のステップ

ブートストラップスクリプトが実行されると、ご利用のビッグデータクラスターにはサンプルデータベースと HDFS データが取り込まれます。次のチュートリアルでは、サンプルデータを使用してビッグデータクラスターの機能を実演します。

データの仮想化:

データインジェスト:

Notebooks:

チュートリアル: SQL Server 2019 ビッグデータクラスターでサンプルのノートブックを実行する

次の方法で共有

チュートリアル:SQL Server ビッグデータクラスターにサンプルデータを読み込む

前提条件

サンプルデータを読み込む

Windows

Linux

次のステップ

フィードバック

その他のリソース

次の方法で共有

チュートリアル:SQL Server ビッグ データ クラスターにサンプル データを読み込む

前提条件

サンプル データを読み込む

Windows

Linux

次のステップ

フィードバック

その他のリソース

チュートリアル:SQL Server ビッグデータクラスターにサンプルデータを読み込む

サンプルデータを読み込む