適用於:SQL Server 2019 (15.x)
這很重要
Microsoft SQL Server 2019 巨量資料叢集附加元件將會淘汰。 SQL Server 2019 巨量資料叢集的支援將於 2025 年 2 月 28 日結束。 平台上將完全支援含軟體保證 SQL Server 2019 的所有現有使用者,而且軟體將會持續透過 SQL Server 累積更新來維護,直到該時間為止。 如需詳細資訊,請參閱公告部落格文章與 Microsoft SQL Server 平台上的巨量資料選項。
本教學課程說明如何使用腳本將範例數據載入 SQL Server 2019 巨量數據叢集。 許多文件中的其他教學課程都使用此範例數據。
小提示
您可以在 sql-server-samples GitHub 存放庫中找到 SQL Server 2019 巨量數據叢集的其他範例。 它們位於 sql-server-samples/samples/features/sql-big-data-cluster/ path 中。
先決條件
- 已部署的巨量數據叢集
-
巨量資料工具
- azdata
- kubectl
- sqlcmd
- 捲曲
載入範例數據
下列步驟會使用啟動程式腳本來下載 SQL Server 資料庫備份,並將數據載入巨量數據叢集。 為了方便使用,這些步驟已分成 Windows 和 Linux 區段。 如果您想要使用基本使用者名稱/密碼作為驗證機制,請在執行腳本之前,先設定AZDATA_USERNAME和AZDATA_PASSWORD環境變數。 否則,腳本會使用整合式驗證來連線到 SQL Server 主要實例和 Knox 閘道。 此外,應該為端點指定 DNS 名稱,才能使用整合式驗證。
窗戶
下列步驟說明如何使用 Windows 用戶端,將範例數據載入巨量數據叢集中。
開啟新的 Windows 命令提示字元。
這很重要
請勿針對這些步驟使用 Windows PowerShell。 在 PowerShell 中,腳本將會失敗,因為它會使用 PowerShell 版本的 curl。
使用 curl 下載引導腳本以取得範例數據。
curl -o bootstrap-sample-db.cmd "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.cmd"
下載 bootstrap-sample-db.sql Transact-SQL 腳本。 此腳本是由引導程式呼叫。
curl -o bootstrap-sample-db.sql "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sql"
啟動腳本需要為大數據叢集提供以下位置參數:
參數 說明 <CLUSTER_NAMESPACE(叢集命名空間)> 您為巨量資料叢集指定的名稱。 <SQL_MASTER_ENDPOINT> 主要實例的 DNS 名稱或 IP 位址。 <KNOX_ENDPOINT> HDFS/Spark 閘道的 DNS 名稱或IP位址。 小提示
使用 kubectl 尋找 SQL Server 主要實例和 Knox 的 IP 位址。 執行
kubectl get svc -n <your-big-data-cluster-name>
,然後查看主要實例(master-svc-external)和 Knox 網關(gateway-svc-external)的 EXTERNAL-IP 位址。 叢集的預設名稱是 mssql-cluster。執行啟動程式腳本。
.\bootstrap-sample-db.cmd <CLUSTER_NAMESPACE> <SQL_MASTER_ENDPOINT> <KNOX_ENDPOINT>
Linux
下列步驟說明如何使用 Linux 用戶端,將範例數據載入至巨量數據叢集。
下載引導程式腳本,並指派可執行許可權給它。
curl -o bootstrap-sample-db.sh "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sh" chmod +x bootstrap-sample-db.sh
下載 bootstrap-sample-db.sql Transact-SQL 腳本。 此腳本是由引導程式呼叫。
curl -o bootstrap-sample-db.sql "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sql"
啟動腳本需要為大數據叢集提供以下位置參數:
參數 說明 <CLUSTER_NAMESPACE> 您為巨量資料叢集指定的名稱。 <SQL_MASTER_ENDPOINT> 主要實例的 DNS 名稱或 IP 位址。 <KNOX_ENDPOINT> HDFS/Spark 閘道的 DNS 名稱或IP位址。 小提示
使用 kubectl 尋找 SQL Server 主要實例和 Knox 的 IP 位址。 執行
kubectl get svc -n <your-big-data-cluster-name>
,然後查看主要實例(master-svc-external)和 Knox 網關(gateway-svc-external)的 EXTERNAL-IP 位址。 叢集的預設名稱是 mssql-cluster。執行啟動程式腳本。
./bootstrap-sample-db.sh <CLUSTER_NAMESPACE> <SQL_MASTER_ENDPOINT> <KNOX_ENDPOINT>
後續步驟
在啟動程式腳本執行之後,您的巨量數據叢集具有範例資料庫和 HDFS 數據。 下列教學課程會使用範例數據來示範巨量數據叢集功能:
資料虛擬化:
資料擷取:
筆記本: