教學課程:在 Azure 中為 RHEL 虛擬機器上的 SQL Server 設定可用性群組

適用於:Azure VM 上的 SQL Server

注意

在本教學課程中使用 SQL Server 2017 (14.x) 與 RHEL 7.6,但可以使用 RHEL 7 或 RHEL 8 中的 SQL Server 2019 (15.x) 來設定高可用性。 設定 Pacemaker 叢集和可用性群組資源的命令已在 RHEL 8 中變更,而您想要查看建立可用性群組資源和 RHEL 8 資源一文,以取得正確命令的詳細資訊。

在本教學課程中,您會了解如何:

  • 建立新的資源群組、可用性設定組及 Azure Linux 虛擬機器 (VM)
  • 啟用高可用性 (HA)
  • 建立 Pacemaker 叢集
  • 藉由建立 STONITH 裝置來設定隔離代理程式
  • 在 RHEL 上安裝 SQL Server 和 mssql-tools
  • 設定 SQL Server Always On 可用性群組
  • 在 Pacemaker 叢集中設定可用性群組 (AG) 資源
  • 測試容錯移轉和隔離代理程式

本教學課程使用 Azure CLI 在 Azure 中部署資源。

如果您沒有 Azure 訂用帳戶,請在開始前建立免費帳戶

必要條件

  • 本文需要 2.0.30 版或更新版本的 Azure CLI。 如果您是使用 Azure Cloud Shell,就已安裝最新版本。

建立資源群組

如果您有多個訂用帳戶,請設定要部署這些資源的訂用帳戶

使用下列命令,在區域中建立資源群組 <resourceGroupName>。 請將 <resourceGroupName> 取代為您選擇的名稱。 在本教學課程中,我們將使用 East US 2。 如需詳細資訊,請參閱下列快速入門

az group create --name <resourceGroupName> --location eastus2

建立可用性設定組

接下來要建立可用性設定組。 請在 Azure Cloud Shell 中執行下列命令,並以您的資源群組名稱取代 <resourceGroupName>。 選擇 <availabilitySetName> 的名稱。

az vm availability-set create \
    --resource-group <resourceGroupName> \
    --name <availabilitySetName> \
    --platform-fault-domain-count 2 \
    --platform-update-domain-count 2

命令完成後,您應該會得到下列結果:

{
  "id": "/subscriptions/<subscriptionId>/resourceGroups/<resourceGroupName>/providers/Microsoft.Compute/availabilitySets/<availabilitySetName>",
  "location": "eastus2",
  "name": "<availabilitySetName>",
  "platformFaultDomainCount": 2,
  "platformUpdateDomainCount": 2,
  "proximityPlacementGroup": null,
  "resourceGroup": "<resourceGroupName>",
  "sku": {
    "capacity": null,
    "name": "Aligned",
    "tier": null
  },
  "statuses": null,
  "tags": {},
  "type": "Microsoft.Compute/availabilitySets",
  "virtualMachines": []
}

在可用性設定組中建立 RHEL VM

警告

如果您選擇隨用隨付 (PAYG) RHEL 映射,並設定高可用性 (HA),您可能需要註冊您的訂用帳戶。 這可能會導致您為訂用帳戶支付兩次費用,因為您將需支付 VM 的 Microsoft Azure RHEL 訂用帳戶,以及 Red Hat 的訂用帳戶。 如需詳細資訊,請參閱 https://access.redhat.com/solutions/2458541

若要避免「重複計費」,在建立 Azure VM 時請使用 RHEL HA 映像。 以 RHEL-HA 映像的形式提供的映像,也是已預先啟用 HA 存放庫的 PAYG 映像。

  1. 取得提供含 A 之 RHEL 的虛擬機器映像清單:

    az vm image list --all --offer "RHEL-HA"
    

    您應該會看見下列結果:

    [
      {
    "offer": "RHEL-HA",
    "publisher": "RedHat",
    "sku": "7.4",
    "urn": "RedHat:RHEL-HA:7.4:7.4.2019062021",
    "version": "7.4.2019062021"
       },
       {
    "offer": "RHEL-HA",
    "publisher": "RedHat",
    "sku": "7.5",
    "urn": "RedHat:RHEL-HA:7.5:7.5.2019062021",
    "version": "7.5.2019062021"
        },
        {
    "offer": "RHEL-HA",
    "publisher": "RedHat",
    "sku": "7.6",
    "urn": "RedHat:RHEL-HA:7.6:7.6.2019062019",
    "version": "7.6.2019062019"
         },
         {
    "offer": "RHEL-HA",
    "publisher": "RedHat",
    "sku": "8.0",
    "urn": "RedHat:RHEL-HA:8.0:8.0.2020021914",
    "version": "8.0.2020021914"
         },
         {
    "offer": "RHEL-HA",
    "publisher": "RedHat",
    "sku": "8.1",
    "urn": "RedHat:RHEL-HA:8.1:8.1.2020021914",
    "version": "8.1.2020021914"
          },
          {
    "offer": "RHEL-HA",
    "publisher": "RedHat",
    "sku": "80-gen2",
    "urn": "RedHat:RHEL-HA:80-gen2:8.0.2020021915",
    "version": "8.0.2020021915"
           },
           {
    "offer": "RHEL-HA",
    "publisher": "RedHat",
    "sku": "81_gen2",
    "urn": "RedHat:RHEL-HA:81_gen2:8.1.2020021915",
    "version": "8.1.2020021915"
           }
    ]
    

    在本教學課程中,我們會選擇 映像 RedHat:RHEL-HA:7.6:7.6.2019062019 作為 RHEL 7 的範例,然後選擇 RedHat:RHEL-HA:8.1:8.1.2020021914 作為 RHEL 8 的範例。

    您也可以選擇預安裝在 RHEL8-HA 映像上的 SQL Server 2019 (15.x)。 若要取得這些映像的清單,請執行下列命令:

    az vm image list --all --offer "sql2019-rhel8"
    

    您應該會看見下列結果:

    [
       {
          "offer": "sql2019-rhel8",
          "publisher": "MicrosoftSQLServer",
          "sku": "enterprise",
          "urn": "MicrosoftSQLServer:sql2019-rhel8:enterprise:15.0.200317",
          "version": "15.0.200317"
       },
       {
          "offer": "sql2019-rhel8",
          "publisher": "MicrosoftSQLServer",
          "sku": "enterprise",
          "urn": "MicrosoftSQLServer:sql2019-rhel8:enterprise:15.0.200512",
          "version": "15.0.200512"
       },
       {
          "offer": "sql2019-rhel8",
          "publisher": "MicrosoftSQLServer",
          "sku": "sqldev",
          "urn": "MicrosoftSQLServer:sql2019-rhel8:sqldev:15.0.200317",
          "version": "15.0.200317"
       },
       {
          "offer": "sql2019-rhel8",
          "publisher": "MicrosoftSQLServer",
          "sku": "sqldev",
          "urn": "MicrosoftSQLServer:sql2019-rhel8:sqldev:15.0.200512",
          "version": "15.0.200512"
       },
       {
          "offer": "sql2019-rhel8",
          "publisher": "MicrosoftSQLServer",
          "sku": "standard",
          "urn": "MicrosoftSQLServer:sql2019-rhel8:standard:15.0.200317",
          "version": "15.0.200317"
       },
       {
          "offer": "sql2019-rhel8",
          "publisher": "MicrosoftSQLServer",
          "sku": "standard",
          "urn": "MicrosoftSQLServer:sql2019-rhel8:standard:15.0.200512",
          "version": "15.0.200512"
       }
    ]
    

    如果您使用上述其中一個映像來建立虛擬機,則會預安裝 SQL Server 2019 (15.x)。 如本文所述,跳過安裝 SQL Server 和 mssql-tools 一節。

    重要

    機器名稱不得超過 15 個字元,才能設定可用性群組。 用戶名稱不能包含大寫字元,而且密碼必須超過 12 個字元。

  2. 我們要在可用性設定組中建立 3 部 M。 在下列命令中更改以下的值:

    • <resourceGroupName>
    • <VM-basename>
    • <availabilitySetName>
    • <VM-Size> - 例如 "Standard_D16_v3"
    • <username>
    • <adminPassword>
    for i in `seq 1 3`; do
           az vm create \
             --resource-group <resourceGroupName> \
             --name <VM-basename>$i \
             --availability-set <availabilitySetName> \
             --size "<VM-Size>"  \
             --image "RedHat:RHEL-HA:7.6:7.6.2019062019" \
             --admin-username "<username>" \
             --admin-password "<adminPassword>" \
             --authentication-type all \
             --generate-ssh-keys
    done
    

上述命令會建立 VM,並建立這些 VM 的預設虛擬網路。 如需不同設定的詳細資訊,請參閱 az vm create 一文。

對每個 VM 完成此命令後,應該會產生如下的結果:

{
  "fqdns": "",
  "id": "/subscriptions/<subscriptionId>/resourceGroups/<resourceGroupName>/providers/Microsoft.Compute/virtualMachines/<VM1>",
  "location": "eastus2",
  "macAddress": "<Some MAC address>",
  "powerState": "VM running",
  "privateIpAddress": "<IP1>",
  "publicIpAddress": "",
  "resourceGroup": "<resourceGroupName>",
  "zones": ""
}

重要

使用上述命令建立的預設映像,依預設會建立 32GB 的作業系統磁碟。 此預設安裝可能會耗盡可用空間。 您可以使用在上述 az vm create 命令中新增的參數,建立具有 128GB 的作業系統磁碟作為範例:--os-disk-size-gb 128

接著,如果您需要擴充適當的資料夾磁碟區以容納您的安裝,您可以設定邏輯磁碟區管理員 (LVM)

測試與已建立的 VM 之間的連線

在 Azure Cloud Shell 中使用下列命令,連線至 VM1 或其他 VM。 如果您找不到 VM IP,請依照此 Azure Cloud Shell 快速入門的指示操作。

ssh <username>@publicipaddress

如果連線成功,您應會看見下列表示 Linux 終端機的輸出:

[<username>@<VM1> ~]$

輸入 exit 以退出 SSH 工作階段。

啟用高可用性

重要

為了完成本教學課程的這個部分,您必須具有 RHEL 的訂用帳戶和高可用性附加元件。 如果您在上一節中使用建議的映像,就不需要註冊另一個訂用帳戶。

連線 至每個 VM 節點,並遵循本指南來啟用 HA。 如需詳細資訊,請參閱為 RHEL 啟用高可用性訂用帳戶

提示

同時開啟每個 VM 的 SSH 工作階段,會比較方便作業,因為在這整篇文章中的每個 VM 上,將必須執行相同的命令。

如果您要複製並貼上多個 sudo 命令,並提示您輸入密碼,則不會執行其他命令。 請個別執行每個命令。

  1. 若要開啟 Pacemaker 防火牆埠,請在每個 VM 上執行下列命令:

    sudo firewall-cmd --permanent --add-service=high-availability
    sudo firewall-cmd --reload
    
  2. 使用下列命令,在所有節點上更新及安裝 Pacemaker 套件:

    注意

    nmap 會安裝為此命令區塊中的一項工具,用以尋找您網路中可用的 IP 位址。 您不需要安裝 nmap,但稍後在本教學課程中會很有用。

    sudo yum update -y
    sudo yum install -y pacemaker pcs fence-agents-all resource-agents fence-agents-azure-arm nmap
    sudo reboot
    
  3. 為安裝 Pacemaker 套件時所建立的預設使用者設定密碼。 在所有節點上使用相同的密碼。

    sudo passwd hacluster
    
  4. 使用下列命令開啟 hosts 檔案,並設定主機名稱解析。 如需詳細資訊,請參閱設定 AG 以了解如何設定 hosts 檔案。

    sudo vi /etc/hosts
    

    vi 編輯器中,輸入 i 以插入文字,並在空白行上新增對應 VM 的私人 IP。 然後,在 IP 旁的空格後面新增 VM 名稱。 各行應包含個別的項目。

    <IP1> <VM1>
    <IP2> <VM2>
    <IP3> <VM3>
    

    重要

    建議您在上一個範例中使用您的 私人IP 位址。 在此設定中使用公用 IP 位址將導致設定失敗,而且我們不建議您將 VM 公開至外部網路。

    若要結束 vi 編輯器,請先按 Esc 鍵,然後輸入命令 :wq 以寫入檔案並結束。

建立 Pacemaker 叢集

在本節中,您會啟用並啟動pcsd服務,然後設定叢集。 針對 Linux 上的 SQL Server,不會自動建立叢集資源。 您必須手動啟用和建立 Pacemaker 資源。 如需詳細資訊,請參閱設定 RHEL 故障轉移叢集實例的文章。

啟用並啟動 pcsd 服務和 Pacemaker

  1. 在所有節點上執行命令。 這些命令可讓節點在每個節點重新啟動后重新加入叢集。

    sudo systemctl enable pcsd
    sudo systemctl start pcsd
    sudo systemctl enable pacemaker
    
  2. 從所有節點移除任何現有的叢集設定。 執行以下命令:

    sudo pcs cluster destroy
    sudo systemctl enable pacemaker
    
  3. 在主要節點上執行下列命令,以設定叢集。

    • 執行 pcs cluster auth 命令來驗證叢集節點時,系統會提示您輸入密碼。 請輸入先前建立之 hacluster 使用者的密碼。

    RHEL7

    sudo pcs cluster auth <VM1> <VM2> <VM3> -u hacluster
    sudo pcs cluster setup --name az-hacluster <VM1> <VM2> <VM3> --token 30000
    sudo pcs cluster start --all
    sudo pcs cluster enable --all
    

    RHEL8

    針對 RHEL 8,您必須個別驗證節點。 出現提示時,請手動輸入 hacluster 的使用者名稱和密碼。

    sudo pcs host auth <node1> <node2> <node3>
    sudo pcs cluster setup <clusterName> <node1> <node2> <node3>
    sudo pcs cluster start --all
    sudo pcs cluster enable --all
    
  4. 執行下列命令,以確認所有節點都已連線。

    sudo pcs status
    

    RHEL 7

    如果所有節點都在在線,您會看到類似下列範例的輸出:

    Cluster name: az-hacluster
    
    WARNINGS:
    No stonith devices and stonith-enabled is not false
    
    Stack: corosync
    Current DC: <VM2> (version 1.1.19-8.el7_6.5-c3c624ea3d) - partition with quorum
    Last updated: Fri Aug 23 18:27:57 2019
    Last change: Fri Aug 23 18:27:56 2019 by hacluster via crmd on <VM2>
    
    3 nodes configured
    0 resources configured
    
    Online: [ <VM1> <VM2> <VM3> ]
    
    No resources
    
    Daemon Status:
          corosync: active/enabled
          pacemaker: active/enabled
          pcsd: active/enabled
    

    RHEL 8

    Cluster name: az-hacluster
    
    WARNINGS:
    No stonith devices and stonith-enabled is not false
    
    Cluster Summary:
      * Stack: corosync
      * Current DC: <VM2> (version 1.1.19-8.el7_6.5-c3c624ea3d) - partition with quorum
      * Last updated: Fri Aug 23 18:27:57 2019
      * Last change: Fri Aug 23 18:27:56 2019 by hacluster via crmd on <VM2>
      * 3 nodes configured
      * 0 resource instances configured
    
    Node List:
      * Online: [ <VM1> <VM2> <VM3> ]
    
    Full List of Resources:
      * No resources
    
    Daemon Status:
      * corosync: active/enabled
      * pacemaker: active/enabled
      * pcsd: active/enabled
    
  5. 將即時叢集中的預期投票設定為 3。 此命令只會影響即時叢集,而且不會變更組態檔。

    在所有節點上,使用下列命令設定預期的投票:

    sudo pcs quorum expected-votes 3
    

設定隔離代理程式

若要設定隔離代理程式,本教學課程會修改下列指示。 如需詳細資訊,請參閱建立 STONITH 裝置

檢查 Azure 柵欄代理程式的版本,以確保其已更新。 使用下列命令:

sudo yum info fence-agents-azure-arm

您應該會看到類似於下列範例的輸出。

Loaded plugins: langpacks, product-id, search-disabled-repos, subscription-manager
Installed Packages
Name        : fence-agents-azure-arm
Arch        : x86_64
Version     : 4.2.1
Release     : 11.el7_6.8
Size        : 28 k
Repo        : installed
From repo   : rhel-ha-for-rhel-7-server-eus-rhui-rpms
Summary     : Fence agent for Azure Resource Manager
URL         : https://github.com/ClusterLabs/fence-agents
License     : GPLv2+ and LGPLv2+
Description : The fence-agents-azure-arm package contains a fence agent for Azure instances.

在 Microsoft Entra 識別碼中註冊新的應用程式

若要在 Microsoft Entra ID 中註冊新的應用程式(先前稱為 Azure Active Directory),請遵循下列步驟:

  1. 移至 https://portal.azure.com
  2. 開啟 [ Microsoft Entra ID 屬性] 窗格 ,並記下 Tenant ID
  3. 選取 應用程式註冊
  4. 選取新增註冊
  5. 輸入名稱,例如 <resourceGroupName>-app。 如需支援的帳戶類型,請選取 [僅限 Microsoft - 單一租使用者],在此組織目錄中選取 [帳戶]。
  6. 選取 [Web ] 作為 [ 重新導向 URI],然後輸入 URL(例如 http://localhost),然後選取 [ 新增]。 登入 URL 可以是任何有效的 URL。 完成後,請選取 [註冊]。
  7. 針對新的應用程式註冊選擇 [ 憑證和密碼 ],然後選取 [ 新增客戶端密碼]。
  8. 輸入新金鑰的描述(用戶端密碼),然後選取 [ 新增]。
  9. 記下秘密的值。 它會作為服務主體的密碼
  10. 選取 [概觀]。 記下應用程式識別碼。 它會作為服務主體的用戶名稱(下列步驟中的登入標識符)。

為隔離代理程式建立自訂角色

遵循教學課程來使用 Azure CLI 建立 Azure 自訂角色

您的 JSON 檔案看起來應該類似下列範例:

  • <username> 取代為您選擇的名稱。 這是為了避免在建立此角色定義時出現重複的狀況。
  • <subscriptionId> 取代為您的 Azure 訂用帳戶識別碼。
{
  "Name": "Linux Fence Agent Role-<username>",
  "Id": null,
  "IsCustom": true,
  "Description": "Allows to power-off and start virtual machines",
  "Actions": [
    "Microsoft.Compute/*/read",
    "Microsoft.Compute/virtualMachines/powerOff/action",
    "Microsoft.Compute/virtualMachines/start/action"
  ],
  "NotActions": [
  ],
  "AssignableScopes": [
    "/subscriptions/<subscriptionId>"
  ]
}

若要新增角色,請執行下列命令:

  • <filename> 取代為檔案名稱。
  • 如果您不是從檔案儲存後所在的資料夾執行命令,而是從其他路徑執行命令,請在命令中放入檔案的資料夾路徑。
az role definition create --role-definition "<filename>.json"

您應該會看見下列輸出:

{
  "assignableScopes": [
    "/subscriptions/<subscriptionId>"
  ],
  "description": "Allows to power-off and start virtual machines",
  "id": "/subscriptions/<subscriptionId>/providers/Microsoft.Authorization/roleDefinitions/<roleNameId>",
  "name": "<roleNameId>",
  "permissions": [
    {
      "actions": [
        "Microsoft.Compute/*/read",
        "Microsoft.Compute/virtualMachines/powerOff/action",
        "Microsoft.Compute/virtualMachines/start/action"
      ],
      "dataActions": [],
      "notActions": [],
      "notDataActions": []
    }
  ],
  "roleName": "Linux Fence Agent Role-<username>",
  "roleType": "CustomRole",
  "type": "Microsoft.Authorization/roleDefinitions"
}

將自訂角色指派給服務主體

將在上一個步驟中建立的自訂角色 Linux Fence Agent Role-<username> 指派給服務主體。 不要再使用擁有者角色。

  1. 移至 https://portal.azure.com
  2. 開啟 [所有資源] 窗格
  3. 選取第一個叢集節點的虛擬機器
  4. 選取 [存取控制 (IAM)]
  5. 選取 [新增角色指派]
  6. 從 [角色] 清單中選取角色 Linux Fence Agent Role-<username>
  7. 在 [ 選取 ] 清單中,輸入您先前建立的應用程式名稱, <resourceGroupName>-app
  8. 選取儲存
  9. 對所有叢集節點重複這些步驟。

建立 STONITH 裝置

在節點 1 上執行下列命令:

  • <ApplicationID> 取代為您的應用程式註冊中的識別碼值。
  • <servicePrincipalPassword> 取代為用戶端密碼中的值。
  • 以本教學課程中所用之訂閱的資源群組取代 <resourceGroupName>
  • 取代您 Azure 訂用帳戶中的 <tenantID><subscriptionId>
sudo pcs property set stonith-timeout=900
sudo pcs stonith create rsc_st_azure fence_azure_arm login="<ApplicationID>" passwd="<servicePrincipalPassword>" resourceGroup="<resourceGroupName>" tenantId="<tenantID>" subscriptionId="<subscriptionId>" power_timeout=240 pcmk_reboot_timeout=900

由於我們已在防火牆中新增允許 HA 服務的規則 (--add-service=high-availability),因此不需要在所有節點上開啟下列防火牆連接埠:2224、3121、21064、5405。 不過,如果您遇到HA的任何類型的連線問題,請使用下列命令來開啟與HA相關聯的這些埠。

提示

在本教學課程中,您可以選擇性地同時新增所有連接埠,以節省時間。 需要開啟的埠會在後續相關章節中說明。 如果您要在此時新增所有連接埠,請新增其他連接埠:1433 和 5022。

sudo firewall-cmd --zone=public --add-port=2224/tcp --add-port=3121/tcp --add-port=21064/tcp --add-port=5405/tcp --permanent
sudo firewall-cmd --reload

安裝 SQL Server 和 mssql-tools

注意

如果您已在 RHEL8-HA 上預先安裝 SQL Server 2019 (15.x) 建立 VM,則可以略過下列步驟來安裝 SQL Server 和 mssql-tools,並在您在所有 VM 上執行 命令sudo /opt/mssql/bin/mssql-conf set-sa-password,並在所有 VM 上設定 sa 密碼後啟動 [設定可用性群組] 區段。

依照下一節的指示,在 VM 上安裝 SQL Server 和 mssql-tools。 您可以選擇下列其中一個範例,在 RHEL 7 上安裝 SQL Server 2017 (14.x),或在 RHEL 8 上安裝 SQL Server 2019 (15.x)。 請在所有節點上執行這些動作。 如需詳細資訊,請參閱在 Red Hat VM 上安裝 SQL Server

在 VM 上安裝 SQL Server

下列命令可用來安裝 SQL Server:

RHEL 7 與 SQL Server 2017

sudo curl -o /etc/yum.repos.d/mssql-server.repo https://packages.microsoft.com/config/rhel/7/mssql-server-2017.repo
sudo yum install -y mssql-server
sudo /opt/mssql/bin/mssql-conf setup
sudo yum install mssql-server-ha

RHEL 8 與 SQL Server 2019

sudo curl -o /etc/yum.repos.d/mssql-server.repo https://packages.microsoft.com/config/rhel/8/mssql-server-2019.repo
sudo yum install -y mssql-server
sudo /opt/mssql/bin/mssql-conf setup
sudo yum install mssql-server-ha

開啟防火牆連接埠 1433 以進行遠端連線

您必須在 VM 上開啟埠 1433,才能從遠端連線。 請使用下列命令,在每個 VM 的防火牆中開啟連接埠 1433:

sudo firewall-cmd --zone=public --add-port=1433/tcp --permanent
sudo firewall-cmd --reload

安裝 SQL Server 命令列工具

下列命令可用來安裝 SQL Server 命令列工具。 如需詳細資訊,請參閱安裝 SQL Server 命令列工具

RHEL 7

sudo curl -o /etc/yum.repos.d/msprod.repo https://packages.microsoft.com/config/rhel/7/prod.repo
sudo yum install -y mssql-tools unixODBC-devel

RHEL 8

sudo curl -o /etc/yum.repos.d/msprod.repo https://packages.microsoft.com/config/rhel/8/prod.repo
sudo yum install -y mssql-tools unixODBC-devel

注意

為方便起見,請將 /opt/mssql-tools/bin/ 新增至您的 PATH 環境變數。 這可讓您不需要指定完整路徑,即可執行工具。 若要修改登入工作階段和互動式/非登入工作階段的 PATH,請執行下列命令:

echo 'export PATH="$PATH:/opt/mssql-tools/bin"' >> ~/.bash_profile
echo 'export PATH="$PATH:/opt/mssql-tools/bin"' >> ~/.bashrc
source ~/.bashrc

檢查 SQL Server 的狀態

完成設定之後,您可以檢查 SQL Server 的狀態,並確認它正在執行:

systemctl status mssql-server --no-pager

您應該會看見下列輸出:

● mssql-server.service - Microsoft SQL Server Database Engine
   Loaded: loaded (/usr/lib/systemd/system/mssql-server.service; enabled; vendor preset: disabled)
   Active: active (running) since Thu 2019-12-05 17:30:55 UTC; 20min ago
     Docs: https://learn.microsoft.com/sql/linux
 Main PID: 11612 (sqlservr)
   CGroup: /system.slice/mssql-server.service
           ├─11612 /opt/mssql/bin/sqlservr
           └─11640 /opt/mssql/bin/sqlservr

設定可用性群組

使用下列步驟,為您的 VM 設定 SQL Server Always On 可用性群組。 如需詳細資訊,請參閱 設定 SQL Server Always On 可用性群組以在 Linux 上取得高可用性。

啟用 AlwaysOn 可用性群組並重新啟動 mssql-server

在每部裝載 SQL Server 執行個體的節點上,啟用 AlwaysOn 可用性群組。 然後,重新啟動 mssql-server。 執行下列指令碼:

sudo /opt/mssql/bin/mssql-conf set hadr.hadrenabled 1
sudo systemctl restart mssql-server

建立憑證

我們目前不支援對 AG 端點進行 AD 驗證。 因此,我們必須使用憑證為 AG 端點加密。

  1. 使用 SQL Server Management Studio (SSMS) 或 sqlcmd 連線至所有節點。 執行下列命令,以啟用 AlwaysOn_health 工作階段,並建立主要金鑰:

    重要

    如果您要從遠端連線到 SQL Server 實例,您必須在防火牆上開啟埠 1433。 您也必須在每個 VM 的 NSG 中,允許對連接埠 1433 的輸入連線。 如需詳細資訊,請參閱建立安全性規則,以了解如何建立輸入安全性規則。

    • <Master_Key_Password> 取代為您自己的密碼。
    ALTER EVENT SESSION  AlwaysOn_health ON SERVER WITH (STARTUP_STATE=ON);
    GO
    CREATE MASTER KEY ENCRYPTION BY PASSWORD = '<Master_Key_Password>';
    
  2. 使用 SSMS 或 sqlcmd 連線至主要複本。 下列命令會在 上 /var/opt/mssql/data/dbm_certificate.cer 建立憑證,並在主要 SQL Server 複本上建立私鑰 var/opt/mssql/data/dbm_certificate.pvk

    • <Private_Key_Password> 取代為您自己的密碼。
    CREATE CERTIFICATE dbm_certificate WITH SUBJECT = 'dbm';
    GO
    
    BACKUP CERTIFICATE dbm_certificate
       TO FILE = '/var/opt/mssql/data/dbm_certificate.cer'
       WITH PRIVATE KEY (
               FILE = '/var/opt/mssql/data/dbm_certificate.pvk',
               ENCRYPTION BY PASSWORD = '<Private_Key_Password>'
           );
    GO
    

執行 exit 命令以結束 sqlcmd 工作階段,然後回到您的 SSH 工作階段。

將憑證複製到次要複本並在伺服器上建立憑證

  1. 將先前建立的兩個檔案複製到將裝載可用性複本的所有伺服器上的相同位置。

    在主要伺服器上執行下列 scp 命令,將憑證複製到目標伺服器:

    • <username><VM2> 更改為您所使用的使用者名稱和目標 VM 名稱。
    • 對所有次要複本執行此命令。

    注意

    您不需要執行為您提供根環境的 sudo -i。 您可以直接在每個命令前面執行 sudo 命令,如同我們先前在本教學課程中所做的一樣。

    # The below command allows you to run commands in the root environment
    sudo -i
    
    scp /var/opt/mssql/data/dbm_certificate.* <username>@<VM2>:/home/<username>
    
  2. 在目標伺服器上,執行下列命令:

    • <username> 取代為您的使用者名稱。
    • mv 命令會將檔案或目錄移至另一個位置。
    • chown 命令可用來變更檔案、目錄或連結的擁有者和群組。
    • 對所有次要複本執行這些命令。
    sudo -i
    mv /home/<username>/dbm_certificate.* /var/opt/mssql/data/
    cd /var/opt/mssql/data
    chown mssql:mssql dbm_certificate.*
    
  3. 下列 Transact-SQL 指令碼會從您在 SQL Server 主要複本上建立的備份建立憑證。 請以強式密碼更新指令碼。 解密密碼與您在上一個步驟中用來建立 .pvk 檔案的密碼相同。 若要建立憑證,請使用 sqlcmd 或 SSMS 在所有次要伺服器上執行下列指令碼:

    CREATE CERTIFICATE dbm_certificate
        FROM FILE = '/var/opt/mssql/data/dbm_certificate.cer'
        WITH PRIVATE KEY (
        FILE = '/var/opt/mssql/data/dbm_certificate.pvk',
        DECRYPTION BY PASSWORD = '<Private_Key_Password>'
                );
    GO
    

在所有複本上建立資料庫鏡像端點

使用 sqlcmd 或 SSMS,在所有 SQL Server 執行個體上執行下列指令碼:

CREATE ENDPOINT [Hadr_endpoint]
    AS TCP (LISTENER_PORT = 5022)
    FOR DATABASE_MIRRORING (
    ROLE = ALL,
    AUTHENTICATION = CERTIFICATE dbm_certificate,
ENCRYPTION = REQUIRED ALGORITHM AES
);
GO

ALTER ENDPOINT [Hadr_endpoint] STATE = STARTED;
GO

建立可用性群組

使用 sqlcmd 或 SSMS,連線至裝載主要複本的 SQL Server 執行個體。 執行下列命令,以建立可用性群組:

  • ag1 取代為您所需的可用性群組名稱。
  • <VM1><VM2><VM3> 值取代為裝載複本的 SQL Server 執行個體的名稱。
CREATE AVAILABILITY GROUP [ag1]
     WITH (DB_FAILOVER = ON, CLUSTER_TYPE = EXTERNAL)
     FOR REPLICA ON
         N'<VM1>'
          WITH (
             ENDPOINT_URL = N'tcp://<VM1>:5022',
             AVAILABILITY_MODE = SYNCHRONOUS_COMMIT,
             FAILOVER_MODE = EXTERNAL,
             SEEDING_MODE = AUTOMATIC
             ),
         N'<VM2>'
          WITH (
             ENDPOINT_URL = N'tcp://<VM2>:5022',
             AVAILABILITY_MODE = SYNCHRONOUS_COMMIT,
             FAILOVER_MODE = EXTERNAL,
             SEEDING_MODE = AUTOMATIC
             ),
         N'<VM3>'
         WITH(
            ENDPOINT_URL = N'tcp://<VM3>:5022',
            AVAILABILITY_MODE = SYNCHRONOUS_COMMIT,
            FAILOVER_MODE = EXTERNAL,
            SEEDING_MODE = AUTOMATIC
            );
GO

ALTER AVAILABILITY GROUP [ag1] GRANT CREATE ANY DATABASE;
GO

為 Pacemaker 建立 SQL Server 登入

在所有 SQL Server 執行個體上,建立 Pacemaker 的 SQL Server 登入。 下列 Transact-SQL 會建立登入。

  • <password> 取代為您自己的複雜密碼。
USE [master]
GO

CREATE LOGIN [pacemakerLogin] with PASSWORD= N'<password>';
GO

ALTER SERVER ROLE [sysadmin] ADD MEMBER [pacemakerLogin];
GO

在所有 SQL Server 執行個體上,儲存 SQL Server 登入所使用的認證。

  1. 建立檔案:

    sudo vi /var/opt/mssql/secrets/passwd
    
  2. 將下列幾行新增至 檔案:

    pacemakerLogin
    <password>
    

    若要結束 vi 編輯器,請先按 Esc 鍵,然後輸入命令 :wq 以寫入檔案並結束。

  3. 使該檔案只能由 root 讀取:

    sudo chown root:root /var/opt/mssql/secrets/passwd
    sudo chmod 400 /var/opt/mssql/secrets/passwd
    

將次要複本聯結至可用性群組

  1. 若要將次要複本加入 AG,您必須在所有伺服器的防火牆上開啟埠 5022。 在 SSH 工作階段中執行下列命令:

    sudo firewall-cmd --zone=public --add-port=5022/tcp --permanent
    sudo firewall-cmd --reload
    
  2. 在次要複本上執行下列命令,以將其聯結至 AG:

    ALTER AVAILABILITY GROUP [ag1] JOIN WITH (CLUSTER_TYPE = EXTERNAL);
    GO
    
    ALTER AVAILABILITY GROUP [ag1] GRANT CREATE ANY DATABASE;
    GO
    
  3. 對主要複本與每個次要複本,執行下列 Transact-SQL 指令碼:

    GRANT ALTER, CONTROL, VIEW DEFINITION ON AVAILABILITY GROUP::ag1 TO pacemakerLogin;
    GO
    
    GRANT VIEW SERVER STATE TO pacemakerLogin;
    GO
    
  4. 聯結次要複本後,您可以在 SSMS 物件總管中加以檢視,方法是展開 Always On 高可用性節點:

    Screenshot shows the primary and secondary availability replicas.

將資料庫新增至可用性群組

我們遵循設定 可用性群組一文來新增資料庫

此步驟使用下列 Transact-SQL 命令。 在主要複本上執行下列命令:

CREATE DATABASE [db1]; -- creates a database named db1
GO

ALTER DATABASE [db1] SET RECOVERY FULL; -- set the database in full recovery model
GO

BACKUP DATABASE [db1] -- backs up the database to disk
   TO DISK = N'/var/opt/mssql/data/db1.bak';
GO

ALTER AVAILABILITY GROUP [ag1] ADD DATABASE [db1]; -- adds the database db1 to the AG
GO

確認已在次要伺服器上建立資料庫

在每個 SQL Server 次要複本上執行下列查詢,以確認 db1 資料庫是否已建立並處於 SYNCHRONIZED 狀態:

SELECT * FROM sys.databases WHERE name = 'db1';
GO
SELECT DB_NAME(database_id) AS 'database', synchronization_state_desc FROM sys.dm_hadr_database_replica_states;

db1synchronization_state_desc 列示 [已同步],表示複本已同步。 次要複本會在主要複本中顯示 db1

在 Pacemaker 叢集中建立可用性群組資源

我們會遵循指南,在 Pacemaker 叢集中建立可用性群組資源。

注意

無偏差通訊

本發行項包含字詞「奴隸」的參考;Microsoft 將此內容中使用該字詞視為有冒犯性。 因為該字詞目前出現在軟體中,所以也會出現在本發行項中。 當軟體移除該字詞時,我們也會將其從發行項中移除。

建立 AG 叢集資源

  1. 根據稍早選擇的環境,使用下列其中一個命令,在可用性群組 ag1 中建立資源 ag_cluster

    RHEL 7

    sudo pcs resource create ag_cluster ocf:mssql:ag ag_name=ag1 meta failure-timeout=30s master notify=true
    

    RHEL 8

    sudo pcs resource create ag_cluster ocf:mssql:ag ag_name=ag1 meta failure-timeout=30s promotable notify=true
    
  2. 使用下列命令,確定您的資源已上線,再繼續進行:

    sudo pcs resource
    

    您應該會看見下列輸出:

    RHEL 7

    [<username>@VM1 ~]$ sudo pcs resource
    Master/Slave Set: ag_cluster-master [ag_cluster]
    Masters: [ <VM1> ]
    Slaves: [ <VM2> <VM3> ]
    

    RHEL 8

    [<username>@VM1 ~]$ sudo pcs resource
    * Clone Set: ag_cluster-clone [ag_cluster] (promotable):
    * ag_cluster             (ocf::mssql:ag) :            Slave VMrhel3 (Monitoring)
    * ag_cluster             (ocf::mssql:ag) :            Master VMrhel1 (Monitoring)
    * ag_cluster             (ocf::mssql:ag) :            Slave VMrhel2 (Monitoring)
    

建立虛擬 IP 資源

  1. 使用網路中可用的靜態 IP 位址建立虛擬 IP 資源。 您可以使用命令工具 nmap 來尋找位址。

    nmap -sP <IPRange>
    # For example: nmap -sP 10.0.0.*
    # The above will scan for all IP addresses that are already occupied in the 10.0.0.x space.
    
  2. 啟用 stonith 的屬性設定為 false:

    sudo pcs property set stonith-enabled=false
    
  3. 使用下列命令建立虛擬IP資源。 將取代 <availableIP> 為未使用的IP位址。

    sudo pcs resource create virtualip ocf:heartbeat:IPaddr2 ip=<availableIP>
    

新增限制式

  1. 為了確保 IP 位址和 AG 資源在相同的節點上執行,必須設定共置限制式。 執行以下命令:

    RHEL 7

    sudo pcs constraint colocation add virtualip ag_cluster-master INFINITY with-rsc-role=Master
    

    RHEL 8

     sudo pcs constraint colocation add virtualip with master ag_cluster-clone INFINITY with-rsc-role=Master
    
  2. 建立排序限制式,以確保 AG 資源會在 IP 位址之前啟動並執行。 雖然共置限制式隱含排序限制式,但此步驟會強制執行它。

    RHEL 7

    sudo pcs constraint order promote ag_cluster-master then start virtualip
    

    RHEL 8

    sudo pcs constraint order promote ag_cluster-clone then start virtualip
    
  3. 若要驗證限制式,請執行下列命令:

    sudo pcs constraint list --full
    

    您應該會看見下列輸出:

    RHEL 7

    Location Constraints:
    Ordering Constraints:
          promote ag_cluster-master then start virtualip (kind:Mandatory) (id:order-ag_cluster-master-virtualip-mandatory)
    Colocation Constraints:
          virtualip with ag_cluster-master (score:INFINITY) (with-rsc-role:Master) (id:colocation-virtualip-ag_cluster-master-INFINITY)
    Ticket Constraints:
    

    RHEL 8

    Location Constraints:
    Ordering Constraints:
            promote ag_cluster-clone then start virtualip (kind:Mandatory) (id:order-ag_cluster-clone-virtualip-mandatory)
    Colocation Constraints:
            virtualip with ag_cluster-clone (score:INFINITY) (with-rsc-role:Master) (id:colocation-virtualip-ag_cluster-clone-INFINITY)
    Ticket Constraints:
    

重新啟用 stonith

我們已做好測試準備。 在節點 1 上執行下列命令,以在叢集中重新啟用 stonith:

sudo pcs property set stonith-enabled=true

檢查叢集狀態

您可以使用下列命令來檢查叢集資源的狀態:

[<username>@VM1 ~]$ sudo pcs status
Cluster name: az-hacluster
Stack: corosync
Current DC: <VM3> (version 1.1.19-8.el7_6.5-c3c624ea3d) - partition with quorum
Last updated: Sat Dec  7 00:18:38 2019
Last change: Sat Dec  7 00:18:02 2019 by root via cibadmin on VM1

3 nodes configured
5 resources configured

Online: [ <VM1> <VM2> <VM3> ]

Full list of resources:

 Master/Slave Set: ag_cluster-master [ag_cluster]
     Masters: [ <VM2> ]
     Slaves: [ <VM1> <VM3> ]
 virtualip      (ocf::heartbeat:IPaddr2):       Started <VM2>
 rsc_st_azure   (stonith:fence_azure_arm):      Started <VM1>

Daemon Status:
  corosync: active/enabled
  pacemaker: active/enabled
  pcsd: active/enabled

測試容錯移轉

為了確保到目前為止,組態已成功,我們會測試故障轉移。 如需詳細資訊,請參閱 Linux 上的 Always On 可用性群組容錯移轉

  1. 執行下列命令,手動將主要複本容錯移轉至 <VM2>。 將 <VM2> 取代為您伺服器名稱的值。

    RHEL 7

    sudo pcs resource move ag_cluster-master <VM2> --master
    

    RHEL 8

    sudo pcs resource move ag_cluster-clone <VM2> --master
    

    您也可以指定其他選項,以便自動停用為了將資源移至所需節點而建立的暫存條件約束,而且不需要在下列指示中執行步驟 2 和 3。

    RHEL 7

    sudo pcs resource move ag_cluster-master <VM2> --master lifetime=30S
    

    RHEL 8

    sudo pcs resource move ag_cluster-clone <VM2> --master lifetime=30S
    

    另一個自動化步驟 2 和 3 的另一個替代方案,可清除資源移動命令本身中的暫存條件約束,就是在單一行中結合多個命令。

    RHEL 7

    sudo pcs resource move ag_cluster-master <VM2> --master && sleep 30 && pcs resource clear ag_cluster-master
    

    RHEL 8

    sudo pcs resource move ag_cluster-clone <VM2> --master && sleep 30 && pcs resource clear ag_cluster-clone
    
  2. 如果您再次檢查條件約束,您會看到因為手動故障轉移而新增了另一個條件約束:

    RHEL 7

    [<username>@VM1 ~]$ sudo pcs constraint list --full
    Location Constraints:
          Resource: ag_cluster-master
            Enabled on: VM2 (score:INFINITY) (role: Master) (id:cli-prefer-ag_cluster-master)
    Ordering Constraints:
            promote ag_cluster-master then start virtualip (kind:Mandatory) (id:order-ag_cluster-master-virtualip-mandatory)
    Colocation Constraints:
            virtualip with ag_cluster-master (score:INFINITY) (with-rsc-role:Master) (id:colocation-virtualip-ag_cluster-master-INFINITY)
    Ticket Constraints:
    

    RHEL 8

    [<username>@VM1 ~]$ sudo pcs constraint list --full
    Location Constraints:
          Resource: ag_cluster-master
            Enabled on: VM2 (score:INFINITY) (role: Master) (id:cli-prefer-ag_cluster-clone)
    Ordering Constraints:
            promote ag_cluster-clone then start virtualip (kind:Mandatory) (id:order-ag_cluster-clone-virtualip-mandatory)
    Colocation Constraints:
            virtualip with ag_cluster-clone (score:INFINITY) (with-rsc-role:Master) (id:colocation-virtualip-ag_cluster-clone-INFINITY)
    Ticket Constraints:
    
  3. 使用下列命令,移除識別碼為 cli-prefer-ag_cluster-master 的限制式:

    RHEL 7

    sudo pcs constraint remove cli-prefer-ag_cluster-master
    

    RHEL 8

    sudo pcs constraint remove cli-prefer-ag_cluster-clone
    
  4. 使用命令 sudo pcs resource 檢查您的叢集資源,您應該會看到此時的主要執行個體為 <VM2>

    [<username>@<VM1> ~]$ sudo pcs resource
    Master/Slave Set: ag_cluster-master [ag_cluster]
         ag_cluster (ocf::mssql:ag):        FAILED <VM1> (Monitoring)
         Masters: [ <VM2> ]
         Slaves: [ <VM3> ]
    virtualip      (ocf::heartbeat:IPaddr2):       Started <VM2>
    [<username>@<VM1> ~]$ sudo pcs resource
    Master/Slave Set: ag_cluster-master [ag_cluster]
         Masters: [ <VM2> ]
         Slaves: [ <VM1> <VM3> ]
    virtualip      (ocf::heartbeat:IPaddr2):       Started <VM2>
    

測試隔離

您可以執行下列命令來測試隔離。 請嘗試對 <VM3> 執行以下來自 <VM1> 的命令。

sudo pcs stonith fence <VM3> --debug

注意

根據預設,隔離動作會先將節點關閉,然後再開啟。 如果您只想讓節點離線,請在命令中使用選項 --off

您應該會取得下列輸出:

[<username>@<VM1> ~]$ sudo pcs stonith fence <VM3> --debug
Running: stonith_admin -B <VM3>
Return Value: 0
--Debug Output Start--
--Debug Output End--

Node: <VM3> fenced

如需測試隔離裝置的詳細資訊,請參閱下列 Red Hat 文章。

後續步驟