教學課程：將範例數據載入 SQL Server 巨量數據叢集

適用於：SQL Server 2019 (15.x)

Important

MICROSOFT SQL Server 2019 巨量數據叢集已淘汰。 SQL Server 2019 巨量數據叢集的支援已於 2025 年 2 月 28 日結束。如需詳細資訊，請參閱 Microsoft SQL Server 平臺上的公告部落格文章和巨量數據選項。

本教學課程說明如何使用腳本將範例數據載入 SQL Server 2019 巨量數據叢集。許多文件中的其他教學課程都使用此範例數據。

Tip

您可以在 sql-server-samples GitHub 存放庫中找到 SQL Server 2019 巨量數據叢集的其他範例。它們位於 sql-server-samples/samples/features/sql-big-data-cluster/ path 中。

Prerequisites

已部署的巨量數據叢集
巨量資料工具
- azdata
- kubectl
- sqlcmd
- curl

載入範例數據

下列步驟會使用啟動程式腳本來下載 SQL Server 資料庫備份，並將數據載入巨量數據叢集。為了方便使用，這些步驟已分成 Windows 和 Linux 區段。如果您想要使用基本使用者名稱/密碼作為驗證機制，請在執行腳本之前，先設定AZDATA_USERNAME和AZDATA_PASSWORD環境變數。否則，腳本會使用整合式驗證來連線到 SQL Server 主要實例和 Knox 閘道。此外，應該為端點指定 DNS 名稱，才能使用整合式驗證。

Windows

下列步驟說明如何使用 Windows 用戶端，將範例數據載入巨量數據叢集中。

開啟新的 Windows 命令提示字元。

Important

請勿針對這些步驟使用 Windows PowerShell。在 PowerShell 中，腳本將會失敗，因為它會使用 PowerShell 版本的 curl。

使用 curl 下載引導腳本以取得範例數據。

curl -o bootstrap-sample-db.cmd "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.cmd"

下載 bootstrap-sample-db.sql Transact-SQL 腳本。此腳本是由引導程式呼叫。

curl -o bootstrap-sample-db.sql "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sql"

啟動腳本需要為大數據叢集提供以下位置參數：

Parameter	Description
<CLUSTER_NAMESPACE（叢集命名空間）>	您為巨量資料叢集指定的名稱。
<SQL_MASTER_ENDPOINT>	主要實例的 DNS 名稱或 IP 位址。
<KNOX_ENDPOINT>	HDFS/Spark 閘道的 DNS 名稱或IP位址。

Tip

使用 kubectl 尋找 SQL Server 主要實例和 Knox 的 IP 位址。執行kubectl get svc -n <your-big-data-cluster-name>，然後查看主要實例（master-svc-external）和 Knox 網關（gateway-svc-external）的 EXTERNAL-IP 位址。叢集的預設名稱是 mssql-cluster。

執行啟動程式腳本。

.\bootstrap-sample-db.cmd <CLUSTER_NAMESPACE> <SQL_MASTER_ENDPOINT> <KNOX_ENDPOINT>

Linux

下列步驟說明如何使用 Linux 用戶端，將範例數據載入至巨量數據叢集。

下載引導程式腳本，並指派可執行許可權給它。

curl -o bootstrap-sample-db.sh "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sh"
chmod +x bootstrap-sample-db.sh

下載 bootstrap-sample-db.sql Transact-SQL 腳本。此腳本是由引導程式呼叫。

curl -o bootstrap-sample-db.sql "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sql"

啟動腳本需要為大數據叢集提供以下位置參數：

Parameter	Description
<CLUSTER_NAMESPACE（叢集命名空間）>	您為巨量資料叢集指定的名稱。
<SQL_MASTER_ENDPOINT>	主要實例的 DNS 名稱或 IP 位址。
<KNOX_ENDPOINT>	HDFS/Spark 閘道的 DNS 名稱或IP位址。

Tip

執行啟動程式腳本。

./bootstrap-sample-db.sh <CLUSTER_NAMESPACE> <SQL_MASTER_ENDPOINT> <KNOX_ENDPOINT>

Next steps

在啟動程式腳本執行之後，您的巨量數據叢集具有範例資料庫和 HDFS 數據。下列教學課程會使用範例數據來示範巨量數據叢集功能：

Data Virtualization:

Data ingestion:

Notebooks:

教學課程：在 SQL Server 2019 巨量數據叢集上執行範例筆記本

Last updated on 2019-08-21