共用方式為


教學課程:將範例數據載入 SQL Server 巨量數據叢集

適用於:SQL Server 2019 (15.x)

這很重要

Microsoft SQL Server 2019 巨量資料叢集附加元件將會淘汰。 SQL Server 2019 巨量資料叢集的支援將於 2025 年 2 月 28 日結束。 平台上將完全支援含軟體保證 SQL Server 2019 的所有現有使用者,而且軟體將會持續透過 SQL Server 累積更新來維護,直到該時間為止。 如需詳細資訊,請參閱公告部落格文章Microsoft SQL Server 平台上的巨量資料選項

本教學課程說明如何使用腳本將範例數據載入 SQL Server 2019 巨量數據叢集。 許多文件中的其他教學課程都使用此範例數據。

小提示

您可以在 sql-server-samples GitHub 存放庫中找到 SQL Server 2019 巨量數據叢集的其他範例。 它們位於 sql-server-samples/samples/features/sql-big-data-cluster/ path 中。

先決條件

載入範例數據

下列步驟會使用啟動程式腳本來下載 SQL Server 資料庫備份,並將數據載入巨量數據叢集。 為了方便使用,這些步驟已分成 WindowsLinux 區段。 如果您想要使用基本使用者名稱/密碼作為驗證機制,請在執行腳本之前,先設定AZDATA_USERNAME和AZDATA_PASSWORD環境變數。 否則,腳本會使用整合式驗證來連線到 SQL Server 主要實例和 Knox 閘道。 此外,應該為端點指定 DNS 名稱,才能使用整合式驗證。

窗戶

下列步驟說明如何使用 Windows 用戶端,將範例數據載入巨量數據叢集中。

  1. 開啟新的 Windows 命令提示字元。

    這很重要

    請勿針對這些步驟使用 Windows PowerShell。 在 PowerShell 中,腳本將會失敗,因為它會使用 PowerShell 版本的 curl

  2. 使用 curl 下載引導腳本以取得範例數據。

    curl -o bootstrap-sample-db.cmd "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.cmd"
    
  3. 下載 bootstrap-sample-db.sql Transact-SQL 腳本。 此腳本是由引導程式呼叫。

    curl -o bootstrap-sample-db.sql "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sql"
    
  4. 啟動腳本需要為大數據叢集提供以下位置參數:

    參數 說明
    <CLUSTER_NAMESPACE(叢集命名空間)> 您為巨量資料叢集指定的名稱。
    <SQL_MASTER_ENDPOINT> 主要實例的 DNS 名稱或 IP 位址。
    <KNOX_ENDPOINT> HDFS/Spark 閘道的 DNS 名稱或IP位址。

    小提示

    使用 kubectl 尋找 SQL Server 主要實例和 Knox 的 IP 位址。 執行kubectl get svc -n <your-big-data-cluster-name>,然後查看主要實例(master-svc-external)和 Knox 網關(gateway-svc-external)的 EXTERNAL-IP 位址。 叢集的預設名稱是 mssql-cluster

  5. 執行啟動程式腳本。

    .\bootstrap-sample-db.cmd <CLUSTER_NAMESPACE> <SQL_MASTER_ENDPOINT> <KNOX_ENDPOINT>
    

Linux

下列步驟說明如何使用 Linux 用戶端,將範例數據載入至巨量數據叢集。

  1. 下載引導程式腳本,並指派可執行許可權給它。

    curl -o bootstrap-sample-db.sh "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sh"
    chmod +x bootstrap-sample-db.sh
    
  2. 下載 bootstrap-sample-db.sql Transact-SQL 腳本。 此腳本是由引導程式呼叫。

    curl -o bootstrap-sample-db.sql "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/bootstrap-sample-db.sql"
    
  3. 啟動腳本需要為大數據叢集提供以下位置參數:

    參數 說明
    <CLUSTER_NAMESPACE> 您為巨量資料叢集指定的名稱。
    <SQL_MASTER_ENDPOINT> 主要實例的 DNS 名稱或 IP 位址。
    <KNOX_ENDPOINT> HDFS/Spark 閘道的 DNS 名稱或IP位址。

    小提示

    使用 kubectl 尋找 SQL Server 主要實例和 Knox 的 IP 位址。 執行kubectl get svc -n <your-big-data-cluster-name>,然後查看主要實例(master-svc-external)和 Knox 網關(gateway-svc-external)的 EXTERNAL-IP 位址。 叢集的預設名稱是 mssql-cluster

  4. 執行啟動程式腳本。

    ./bootstrap-sample-db.sh <CLUSTER_NAMESPACE> <SQL_MASTER_ENDPOINT> <KNOX_ENDPOINT>
    

後續步驟

在啟動程式腳本執行之後,您的巨量數據叢集具有範例資料庫和 HDFS 數據。 下列教學課程會使用範例數據來示範巨量數據叢集功能:

資料虛擬化:

資料擷取:

筆記本: