Pacemaker による SUSE Linux Enterprise Server 上の Azure VM での IBM Db2 LUW の高可用性

[アーティクル]
01/18/2024

高可用性とディザスターリカバリー (HADR) 構成の IBM Db2 for Linux, UNIX, and Windows (LUW) は、プライマリデータベースインスタンスを実行する 1 つのノードと、セカンダリデータベースインスタンスを実行する 1 つ以上のノードで構成されています。プライマリデータベースインスタンスに対する変更は、実際の構成に応じて、同期的または非同期的にセカンダリデータベースインスタンスにレプリケートされます。

Note

この記事には、Microsoft が使用しなくなった用語への言及が含まれています。ソフトウェアからこれらの用語が削除された時点で、この記事から削除します。

この記事では、Azure 仮想マシン (VM) をデプロイして構成し、クラスターフレームワークをインストールし、HADR 構成で IBM Db2 LUW をインストールする方法について説明します。

この記事では、HADR の IBM Db2 LUW をインストールして構成する方法や SAP ソフトウェアのインストールについては説明しません。これらのタスクの実行に役立つように、SAP と IBM のインストールマニュアルへの参照を提供します。この記事では、Azure 環境に固有の部分に重点が置かれています。

SAP ノート 1928533 に記載されているように、サポートされる IBM Db2 バージョンは 10.5 以上です。

インストールを開始する前に、以下の SAP ノートとドキュメントを参照してください。

SAP ノート	説明
1928533	SAP applications on Azure: Supported products and Azure VM types (Azure 上の SAP アプリケーション: サポートされる製品と Azure VM の種類)
2015553	SAP on Azure:Support prerequisites (Microsoft Azure 上の SAP: サポートの前提条件)
2178632	SAP on Azure 用の主要な監視メトリック
2191498	SAP on Linux with Azure:Enhanced monitoring (Azure を使用した Linux 上の SAP: 拡張された監視機能)
2243692	Linux on Azure (IaaS) VM:SAP license issues (Microsoft Azure (IaaS) VM 上の Linux: SAP ライセンスの問題)
1984787	SUSE LINUX Enterprise Server 12:インストールに関する注記
1999351	Troubleshooting enhanced Azure monitoring for SAP (強化された Azure Monitoring for SAP のトラブルシューティング)
2233094	DB6:IBM Db2 for Linux, UNIX, and Windows を使用する Azure 上の SAP アプリケーション - 追加情報
1612105	DB6:HADR の Db2 に関する FAQ

ドキュメント
SAP Community Wiki:Linux に必要な SAP ノートがすべて掲載されています
Linux 上の SAP のための Azure Virtual Machines の計画と実装に関するガイド
Linux 上の SAP のための Azure Virtual Machines のデプロイ (この記事)
Linux 上の SAP のための Azure Virtual Machines データベース管理システム (DBMS) のデプロイに関するガイド
Azure での SAP ワークロードの計画とデプロイに関するチェックリスト
SUSE Linux Enterprise Server for SAP Applications 12 SP4 のベストプラクティスガイド
SUSE Linux Enterprise High Availability Extension 12 SP4
SAP ワークロードのための IBM Db2 Azure Virtual Machines DBMS のデプロイ
IBM Db2 HADR 11.1
IBM Db2 HADR R 10.5

概要

高可用性を実現するには、可用性ゾーン間にまたがり、フレキシブルオーケストレーションを使用する仮想マシンスケールセットまたは可用性セット内にある仮想マシンスケールセットにデプロイされている、2 台以上の Azure 仮想マシンに、HADR を備えた IBM Db2 LUW をインストールします。

以下の図には、データベースサーバーである 2 台の Azure VM の設定が示されています。どちらのデータベースサーバー Azure VM も、それぞれ独自のストレージが接続され、稼動しています。 HADR では、いずれか 1 つの Azure VM にある 1 つのデータベースインスタンスにプライマリインスタンスの役割が与えられます。すべてのクライアントは、このプライマリインスタンスに接続されています。データベーストランザクションにおけるすべての変更は、Db2 のトランザクションログとしてローカルに永続化されます。トランザクションログレコードは、ローカルに永続化されると、セカンダリデータベースサーバー (スタンバイサーバーまたはスタンバイインスタンス) 上のデータベースインスタンスに TCP/IP 経由で転送されます。スタンバイインスタンスは、転送されたトランザクションログレコードをロールフォワードすることによってローカルデータベースを更新します。このようにして、スタンバイサーバーはプライマリサーバーと同期された状態で維持されます。

HADR は、レプリケーション機能にすぎません。障害の検出や自動引き継ぎ (フェールオーバー) の機能はありません。スタンバイサーバーへの引き継ぎ (切り替え) は、データベース管理者が手動で開始する必要があります。自動引き継ぎと障害検出を実現するために、Linux Pacemaker クラスタリング機能を使用できます。 Pacemaker では 2 つのデータベースサーバーインスタンスを監視します。プライマリデータベースサーバーインスタンスがクラッシュすると、Pacemaker で、スタンバイサーバーによる HADR の自動引き継ぎが開始されます。また、Pacemaker では確実に仮想 IP アドレスが新しいプライマリサーバーに割り当てられます。

IBM Db2 high availability overview

SAP アプリケーションサーバーをプライマリデータベースに接続するには、仮想ホスト名と仮想 IP アドレスが必要です。フェールオーバー後、SAP アプリケーションサーバーは新しいプライマリデータベースインスタンスに接続されます。 Azure の環境では、IBM Db2 の HADR に必要な方法で仮想 IP アドレスを使用するために Azure ロードバランサーが必要になります。

HADR の IBM Db2 LUW と Pacemaker が高可用性 SAP システムの設定にいかに適しているかを十分に理解するのに役立つように、次の図では、IBM Db2 データベースに基づく SAP システムの高可用性設定の概要を示します。この記事では、IBM Db2 のみを取り上げていますが、SAP システムの他のコンポーネントの設定方法に関する他の記事への参照を提供します。

IBM DB2 high availability full environment overview

必要な手順の概要

IBM Db2 構成をデプロイするには、これらの手順に従う必要があります。

環境を計画する。
VM をデプロイします。
SUSE Linux を更新してファイルシステムを構成する。
Pacemaker をインストールして構成する。
高可用性 NFS をインストールする。
別のクラスターに ASCS/ERS をインストールする。
分散/高可用性オプション (SWPM) で IBM Db2 データベースをインストールする。
セカンダリデータベースノードとインスタンスをインストールおよび作成し、HADR を構成する。
HADR が動作していることを確認する。
Pacemaker の構成を適用して IBM Db2 を制御する。
Azure Load Balancer を構成する。
プライマリおよびダイアログアプリケーションサーバーをインストールする。
SAP アプリケーションサーバーの構成を確認して調整する。
フェールオーバーおよび引き継ぎテストを実行する。

HADR の IBM Db2 LUW をホストするための Azure インフラストラクチャを計画する

デプロイする前に、計画プロセスを完了します。計画では、Azure で HADR の Db2 の構成をデプロイするための基盤を築きます。 IMB Db2 LUW (SAP 環境のデータベース部分) の計画に含める必要がある重要な要素は、以下の表にリストされています。

トピック	簡単な説明
Azure リソースグループを定義する	VM、仮想ネットワーク、Azure Load Balancer、およびその他のリソースをデプロイするリソースグループ。既存のものでも、新しいものでもかまいません。
仮想ネットワークまたはサブネットの定義	IBM Db2 の VM と Azure Load Balancer のデプロイ先。既存のものでも、新たに作成したものでもかまいません。
IBM Db2 LUW をホストしている仮想マシン	VM サイズ、ストレージ、ネットワーク、IP アドレス。
IBM Db2 データベースの仮想ホスト名と仮想 IP	SAP アプリケーションサーバーの接続に使用される仮想 IP またはホスト名。 db-virt-hostname、db-virt-ip。
Azure フェンス	Azure フェンスまたは SBD フェンス (強く推奨)。スプリットブレインの状況を回避するための方法。
SBD VM	SBD 仮想マシンのサイズ、ストレージ、ネットワーク。
Azure Load Balancer	Standard (推奨)、Db2 データベース向けのプローブポート probe-port (62500 を推奨) の使用。
名前解決	その環境における名前解決のしくみ。 DNS サービスを強くお勧めします。ローカルホストファイルを使用できます。

Azure の Linux Pacemaker の詳細については、「Azure の SUSE Linux Enterprise Server に Pacemaker をセットアップする」を参照してください。

重要

Db2 バージョン 11.5.6 以降では、IBM の Pacemaker を使用した統合ソリューションを強くお勧めします。

SUSE Linux へのデプロイ

IBM Db2 LUW のリソースエージェントは、SUSE Linux Enterprise Server for SAP Applications に同梱されています。このドキュメントで説明されている設定では、SUSE Linux Server for SAP Applications を使用する必要があります。 Azure Marketplace には、SUSE Enterprise Server for SAP Applications 12 のイメージが含まれており、新しい Azure 仮想マシンのデプロイに使用できます。 Azure VM Marketplace で VM イメージを選択するときに Azure Marketplace を介して SUSE によって提供される、さまざまなサポートまたはサービスモデルに注意してください。

ホスト:DNS の更新

仮想ホスト名を含む、すべてのホスト名のリストを作成し、適切な IP アドレスからホスト名への解決ができるよう、DNS サーバーを更新します。 DNS サーバーが存在しない場合や DNS エントリを更新したり作成したりできない場合は、このシナリオに参加している各 VM のローカルホストファイルを使用する必要があります。ホストファイルのエントリを使用する場合は、エントリが SAP システム環境内のすべての VM に適用されていることを確認します。しかし、Azure に理想的な形で拡張される DNS を使用することをお勧めします

手動デプロイ

選択した OS が IBM Db2 LUW 用の IBM/SAP によってサポートされていることを確認してください。 Azure VM と Db2 リリースでサポートされている OS バージョンのリストは、SAP ノート 1928533 で確認できます。 Db2 リリースごとの OS リリースのリストは、SAP 製品の可用性マトリックスにあります。 SLES 12 SP4 以上の使用を強くお勧めします。このバージョン以降の SUSE Linux で Azure に関連したパフォーマンスが向上するためです。

リソースグループを作成または選択します。
仮想ネットワークとサブネットを作成または選択します。
SAP 仮想マシンに適切なデプロイの種類を選択します。通常は、柔軟なオーケストレーションを備えた仮想マシンスケールセットです。
仮想マシン 1 を作成します。
1. Azure Marketplace の SLES for SAP イメージを使用します。
2. 手順 3 で作成したスケールセット、可用性ゾーン、可用性セットを選択します。
仮想マシン 2 を作成します。
1. Azure Marketplace の SLES for SAP イメージを使用します。
2. 手順 3 で作成したスケールセット、可用性ゾーン、可用性セットを選択します (手順 4 と同じゾーンではありません)。
VM にデータディスクを追加した後、「SAP ワークロードのための IBM Db2 Azure Virtual Machines DBMS のデプロイ」という記事のファイルシステム設定に関する推奨事項を確認します。

IBM Db2 LUW と SAP 環境をインストールする

IBM Db2 LUW に基づく SAP 環境のインストールを開始する前に、以下のドキュメントを確認してください。

Azure のドキュメント
SAP のドキュメント
IBM のドキュメント

このドキュメントへのリンクは、この記事の概要セクションで提供されています。

IBM Db2 LUW での NetWeaver ベースアプリケーションのインストールについては、SAP のインストールマニュアルを確認してください。

SAP ヘルプポータルに関するガイドは、SAP Installation Guide Finder を使用して検索できます。

以下のフィルターを設定することで、ポータルに表示されるガイドの数を減らすことができます。

[I want to](検索対象): "Install a new system"
[My Database](使用データベース): "IBM Db2 for Linux, Unix, and Windows"
SAP NetWeaver のバージョン、スタック構成、オペレーティングシステムに関するその他のフィルター

HADR 搭載の IBM Db2 LUW を設定するためのインストールのヒント

プライマリ IBM Db2 LUW データベースインスタンスを設定するには、次のようにします。

高可用性または分散オプションを使用する。
SAP ASCS/ERS とデータベースインスタンスをインストールする。
新たにインストールされたデータベースのバックアップを作成する。

重要

インストール中に設定される "データベース通信ポート" を書き留めておいてください。これは、両方のデータベースインスタンスで同じポート番号である必要があります。 SAP SWPM Port Definition

SAP の同種システムコピー手順を使用してスタンバイデータベースサーバーを設定するには、これらの手順を行います。

[System copy](システムコピー) オプション>[Target systems](ターゲットシステム)>[分散]>[データベースインスタンス] の順に選択します。
バックアップを使用してスタンバイサーバーインスタンスにバックアップを復元できるように、コピー方法として [Homogeneous System](同種システム) を選択します。
同種システムコピーのデータベースを復元する最後の手順に到達したら、インストーラーを終了します。プライマリホストのバックアップからデータベースを復元します。後続のインストールフェーズはすべて、プライマリデータベースサーバー上で実行済みです。
IBM Db2 の HADR を設定します。
Note

Azure と Pacemaker に固有のインストールと構成の場合:SAP Software Provisioning Manager を使用したインストール手順の中で、IBM Db2 LUW の高可用性に関してはっきりした疑問が生じます。
- [IBM Db2 pureScale] は選択しない。
- [Install IBM Tivoli System Automation for Multiplatforms](IBM Tivoli System Automation for Multiplatforms のインストール) は選択しない。
- [Generate cluster configuration files](クラスター構成ファイルの生成) は選択しない。

Linux Pacemaker に SBD デバイスを使用する場合は、以下の Db2 HADR パラメーターを設定します。

HADR peer window duration (seconds) (HADR_PEER_WINDOW) = 300
HADR timeout value (HADR_TIMEOUT) = 60

Azure Pacemaker フェンスエージェントを使用する場合は、次のパラメーターを設定します。

HADR peer window duration (seconds) (HADR_PEER_WINDOW) = 900
HADR timeout value (HADR_TIMEOUT) = 60

最初のフェールオーバー/引き継ぎテストに基づく上記のパラメーターをお勧めします。これらのパラメーター設定でフェールオーバーと引き継ぎが適切に機能するかどうかを必ずテストしてください。個々の構成は異なる場合があるため、パラメーターには調整が必要になる可能性があります。

重要

通常起動を使用した HADR 構成の IBM Db2 に固有の情報:プライマリデータベースインスタンスを起動する前に、セカンダリまたはスタンバイデータベースインスタンスが稼動している必要があります。

デモンストレーションの目的上、このドキュメントで説明されている手順では、データベースの SID が PTR となっています。

IBM Db2 HADR の確認

HADR を構成し、プライマリおよびスタンバイノードの状態が PEER および CONNECTED になったら、以下の確認を行います。

Execute command as db2<sid> db2pd -hadr -db <SID>

#Primary output:
# Database Member 0 -- Database PTR -- Active -- Up 1 days 01:51:38 -- Date 2019-02-06-15.35.28.505451
# 
#                             HADR_ROLE = PRIMARY
#                           REPLAY_TYPE = PHYSICAL
#                         HADR_SYNCMODE = NEARSYNC
#                            STANDBY_ID = 1
#                         LOG_STREAM_ID = 0
#                            HADR_STATE = PEER
#                            HADR_FLAGS = TCP_PROTOCOL
#                   PRIMARY_MEMBER_HOST = azibmdb02
#                      PRIMARY_INSTANCE = db2ptr
#                        PRIMARY_MEMBER = 0
#                   STANDBY_MEMBER_HOST = azibmdb01
#                      STANDBY_INSTANCE = db2ptr
#                        STANDBY_MEMBER = 0
#                   HADR_CONNECT_STATUS = CONNECTED
#              HADR_CONNECT_STATUS_TIME = 02/05/2019 13:51:47.170561 (1549374707)
#           HEARTBEAT_INTERVAL(seconds) = 15
#                      HEARTBEAT_MISSED = 0
#                    HEARTBEAT_EXPECTED = 6137
#                 HADR_TIMEOUT(seconds) = 60
#         TIME_SINCE_LAST_RECV(seconds) = 13
#              PEER_WAIT_LIMIT(seconds) = 0
#            LOG_HADR_WAIT_CUR(seconds) = 0.000
#     LOG_HADR_WAIT_RECENT_AVG(seconds) = 0.000025
#    LOG_HADR_WAIT_ACCUMULATED(seconds) = 434.595
#                   LOG_HADR_WAIT_COUNT = 223713
# SOCK_SEND_BUF_REQUESTED,ACTUAL(bytes) = 0, 46080
# SOCK_RECV_BUF_REQUESTED,ACTUAL(bytes) = 0, 374400
#             PRIMARY_LOG_FILE,PAGE,POS = S0000280.LOG, 15571, 27902548040
#             STANDBY_LOG_FILE,PAGE,POS = S0000280.LOG, 15571, 27902548040
#                   HADR_LOG_GAP(bytes) = 0
#      STANDBY_REPLAY_LOG_FILE,PAGE,POS = S0000280.LOG, 15571, 27902548040
#        STANDBY_RECV_REPLAY_GAP(bytes) = 0
#                      PRIMARY_LOG_TIME = 02/06/2019 15:34:39.000000 (1549467279)
#                      STANDBY_LOG_TIME = 02/06/2019 15:34:39.000000 (1549467279)
#               STANDBY_REPLAY_LOG_TIME = 02/06/2019 15:34:39.000000 (1549467279)
#          STANDBY_RECV_BUF_SIZE(pages) = 2048
#              STANDBY_RECV_BUF_PERCENT = 0
#            STANDBY_SPOOL_LIMIT(pages) = 0
#                 STANDBY_SPOOL_PERCENT = NULL
#                    STANDBY_ERROR_TIME = NULL
#                  PEER_WINDOW(seconds) = 300
#                       PEER_WINDOW_END = 02/06/2019 15:40:25.000000 (1549467625)
#              READS_ON_STANDBY_ENABLED = N

#Secondary output:
# Database Member 0 -- Database PTR -- Standby -- Up 1 days 01:46:43 -- Date 2019-02-06-15.38.25.644168
# 
#                             HADR_ROLE = STANDBY
#                           REPLAY_TYPE = PHYSICAL
#                         HADR_SYNCMODE = NEARSYNC
#                            STANDBY_ID = 0
#                         LOG_STREAM_ID = 0
#                            HADR_STATE = PEER
#                            HADR_FLAGS = TCP_PROTOCOL
#                   PRIMARY_MEMBER_HOST = azibmdb02
#                      PRIMARY_INSTANCE = db2ptr
#                        PRIMARY_MEMBER = 0
#                   STANDBY_MEMBER_HOST = azibmdb01
#                      STANDBY_INSTANCE = db2ptr
#                        STANDBY_MEMBER = 0
#                   HADR_CONNECT_STATUS = CONNECTED
#              HADR_CONNECT_STATUS_TIME = 02/05/2019 13:51:47.205067 (1549374707)
#           HEARTBEAT_INTERVAL(seconds) = 15
#                      HEARTBEAT_MISSED = 0
#                    HEARTBEAT_EXPECTED = 6186
#                 HADR_TIMEOUT(seconds) = 60
#         TIME_SINCE_LAST_RECV(seconds) = 5
#              PEER_WAIT_LIMIT(seconds) = 0
#            LOG_HADR_WAIT_CUR(seconds) = 0.000
#     LOG_HADR_WAIT_RECENT_AVG(seconds) = 0.000023
#    LOG_HADR_WAIT_ACCUMULATED(seconds) = 434.595
#                   LOG_HADR_WAIT_COUNT = 223725
# SOCK_SEND_BUF_REQUESTED,ACTUAL(bytes) = 0, 46080
# SOCK_RECV_BUF_REQUESTED,ACTUAL(bytes) = 0, 372480
#             PRIMARY_LOG_FILE,PAGE,POS = S0000280.LOG, 15574, 27902562173
#             STANDBY_LOG_FILE,PAGE,POS = S0000280.LOG, 15574, 27902562173
#                   HADR_LOG_GAP(bytes) = 0
#      STANDBY_REPLAY_LOG_FILE,PAGE,POS = S0000280.LOG, 15574, 27902562173
#        STANDBY_RECV_REPLAY_GAP(bytes) = 155
#                      PRIMARY_LOG_TIME = 02/06/2019 15:37:34.000000 (1549467454)
#                      STANDBY_LOG_TIME = 02/06/2019 15:37:34.000000 (1549467454)
#               STANDBY_REPLAY_LOG_TIME = 02/06/2019 15:37:34.000000 (1549467454)
#          STANDBY_RECV_BUF_SIZE(pages) = 2048
#              STANDBY_RECV_BUF_PERCENT = 0
#            STANDBY_SPOOL_LIMIT(pages) = 0
#                 STANDBY_SPOOL_PERCENT = NULL
#                    STANDBY_ERROR_TIME = NULL
#                  PEER_WINDOW(seconds) = 300
#                       PEER_WINDOW_END = 02/06/2019 15:43:19.000000 (1549467799)
#              READS_ON_STANDBY_ENABLED = N

Azure Load Balancer を構成する

VM 構成中に、ネットワークセクションでロードバランサーを作成するか既存のものを選択する選択肢もあります。 DB2 データベースの高可用性セットアップ用に標準ロードバランサーを設定するには、以下の手順に従います。

Azure portal を使って高可用性 SAP システム用の標準ロードバランサーを設定するには、「ロードバランサーの作成」の手順に従います。ロードバランサーのセットアップ時には、以下の点を考慮してください。

フロントエンド IP 構成: フロントエンド IP を作成します。お使いのデータベース仮想マシンと同じ仮想ネットワークとサブネットを選びます。
バックエンドプール: バックエンドプールを作成し、データベース VM を追加します。
インバウンド規則: 負荷分散規則を作成します。両方の負荷分散規則で同じ手順に従います。
- フロントエンド IP アドレス: フロントエンド IP を選択します。
- バックエンドプール: バックエンドプールを選択します。
- 高可用性ポート: このオプションを選択します。
- [プロトコル]: [TCP] を選択します。
- 正常性プローブ: 次の詳細を使って正常性プローブを作成します。
  - [プロトコル]: [TCP] を選択します。
  - ポート: たとえば、625<instance-no.>。
  - サイクル間隔: 「5」と入力します。
  - プローブしきい値: 「2」と入力します。
- アイドルタイムアウト (分): 「30」と入力します。
- フローティング IP を有効にする: このオプションを選択します。

Note

正常性プローブ構成プロパティ numberOfProbes (ポータルでは [異常しきい値] とも呼ばれます) が順守されていません。成功または失敗した連続プローブの数を制御するには、プロパティ probeThreshold を 2 に設定します。現在、このプロパティは Azure portal を使用して設定できないため、Azure CLI または PowerShell コマンドを使用してください。

# Create the load balancer resource with frontend IP. Allocation of private IP address is dynamic using below command. If you want to pass static IP address, include parameter --private-ip-address.
az network lb create -g MyResourceGroup -n MyLB --sku Standard --vnet-name MyVMsVirtualNetwork --subnet MyVMsSubnet --backend-pool-name MyBackendPool --frontend-ip-name MyDBFrontendIpName

# Create the health probe
az network lb probe create -g MyResourceGroup --lb-name MyLB -n MyDBHealthProbe --protocol tcp --port MyDBHealthProbePort --interval 5 --probe-threshold 2
 
# Create load balancing rule
az network lb rule create -g MyResourceGroup --lb-name MyLB -n MyDBRuleName --protocol All --frontend-ip-name MyDBFrontendIpName --frontend-port 0 --backend-pool-name MyBackendPool --backend-port 0 --probe-name MyDBHealthProbe --idle-timeout-in-minutes 30 --enable-floating-ip 

# Add database VMs in backend pool
az network nic ip-config address-pool add --address-pool MyBackendPool --ip-config-name DBVm1IpConfigName --nic-name DBVm1NicName -g MyResourceGroup --lb-name MyLB
az network nic ip-config address-pool add --address-pool MyBackendPool --ip-config-name DBVm2IpConfigName --nic-name DBVm2NicName -g MyResourceGroup --lb-name MyLB

展開して完全な CLI コードを表示する

# Define variables for Resource Group, and Database VMs.

rg_name="resourcegroup-name"
vm1_name="db1-name"
vm2_name="db2-name"

# Define variables for the load balancer that will be utilized in the creation of the load balancer resource.

lb_name="sap-db-sid-ilb"
bkp_name="db-backendpool"
db_fip_name="db-frontendip"

db_hp_name="db-healthprobe"
db_hp_port="625<instance-no>"

db_rule_name="db-lb-rule"
 
# Command to get VMs network information like primary NIC name, primary IP configuration name, virtual network name, and subnet name. 
 
vm1_primary_nic=$(az vm nic list -g $rg_name --vm-name $vm1_name --query "[?primary == \`true\`].{id:id} || [?primary == \`null\`].{id:id}" -o tsv)
vm1_nic_name=$(basename $vm1_primary_nic)
vm1_ipconfig=$(az network nic ip-config list -g $rg_name --nic-name $vm1_nic_name --query "[?primary == \`true\`].name" -o tsv)
 
vm2_primary_nic=$(az vm nic list -g $rg_name --vm-name $vm2_name --query "[?primary == \`true\`].{id:id} || [?primary == \`null\`].{id:id}" -o tsv)
vm2_nic_name=$(basename $vm2_primary_nic)
vm2_ipconfig=$(az network nic ip-config list -g $rg_name --nic-name $vm2_nic_name --query "[?primary == \`true\`].name" -o tsv)
 
vnet_subnet_id=$(az network nic show -g $rg_name -n $vm1_nic_name --query ipConfigurations[0].subnet.id -o tsv)
vnet_name=$(basename $(dirname $(dirname $vnet_subnet_id)))
subnet_name=$(basename $vnet_subnet_id)
 
# Create the load balancer resource with frontend IP.
# Allocation of private IP address is dynamic using below command. If you want to pass static IP address, include parameter --private-ip-address. 
  
az network lb create -g $rg_name -n $lb_name --sku Standard --vnet-name $vnet_name --subnet $subnet_name --backend-pool-name $bkp_name --frontend-ip-name $db_fip_name
 
# Create the health probe
 
az network lb probe create -g $rg_name --lb-name $lb_name -n $db_hp_name --protocol tcp --port $db_hp_port --interval 5 --probe-threshold 2
 
# Create load balancing rule
  
az network lb rule create -g $rg_name --lb-name $lb_name -n  $db_rule_name --protocol All --frontend-ip-name $db_fip_name --frontend-port 0 --backend-pool-name $bkp_name --backend-port 0 --probe-name $db_hp_name --idle-timeout-in-minutes 30 --enable-floating-ip 
 
# Add database VMs in backend pool
 
az network nic ip-config address-pool add --address-pool $bkp_name --ip-config-name $vm1_ipconfig --nic-name $vm1_nic_name -g $rg_name --lb-name $lb_name
az network nic ip-config address-pool add --address-pool $bkp_name --ip-config-name $vm2_ipconfig --nic-name $vm2_nic_name -g $rg_name --lb-name $lb_name

# [OPTIONAL] Change the assignment of frontend IP address from dynamic to static
dbfip=$(az network lb frontend-ip show --lb-name $lb_name -g $rg_name -n $db_fip_name --query "{privateIPAddress:privateIPAddress}" -o tsv)
az network lb frontend-ip update --lb-name $lb_name -g $rg_name -n $db_fip_name --private-ip-address $dbfip

# Create frontend IP configurations
$db_fip = New-AzLoadBalancerFrontendIpConfig -Name MyDBFrontendIpName -SubnetId MyDBSubnetName

# Create backend pool
$bePool = New-AzLoadBalancerBackendAddressPoolConfig -Name MyBackendPool

# Create health probe
$db_healthprobe = New-AzLoadBalancerProbeConfig -Name MyDBHealthProbe -Protocol 'tcp' -Port MyDBHealthProbePort -IntervalInSeconds 5 -ProbeThreshold 2 -ProbeCount 1

# Create load balancing rule
$db_rule = New-AzLoadBalancerRuleConfig -Name MyDBRuleName -Probe $db_healthprobe -Protocol 'All' -IdleTimeoutInMinutes 30 -FrontendIpConfiguration $db_fip -BackendAddressPool $bePool -EnableFloatingIP

# Create the load balancer resource
$lb = New-AzLoadBalancer -ResourceGroupName MyResourceGroup -Name MyLB -Location MyRegion -Sku 'Standard' -FrontendIpConfiguration $db_fip -BackendAddressPool $bePool -LoadBalancingRule $db_rule -Probe $db_healthprobe

展開して完全な PowerShell コードを表示する

# Define variables for Resource Group, and Database VMs.

$rg_name = 'resourcegroup-name'
$vm1_name = 'db1-name'
$vm2_name = 'db2-name'

# Define variables for the load balancer that will be utilized in the creation of the load balancer resource.

$lb_name = 'sap-db-sid-ilb'
$bkp_name = 'db-backendpool'
$db_fip_name = 'db-frontendip'
 
$db_hp_name = 'db-healthprobe'
$db_hp_port = '625<instance-no>'
 
$db_rule_name = 'db-lb-rule'
 
# Command to get VMs network information like primary NIC name, primary IP configuration name, virtual network name, and subnet name.
 
$vm1 = Get-AzVM -ResourceGroupName $rg_name -Name $vm1_name
$vm1_primarynic = $vm1.NetworkProfile.NetworkInterfaces | Where-Object {($_.Primary -eq "True") -or ($_.Primary -eq $null)}
$vm1_nic_name = $vm1_primarynic.Id.Split('/')[-1]
 
$vm1_nic_info = Get-AzNetworkInterface -Name $vm1_nic_name -ResourceGroupName $rg_name
$vm1_primaryip = $vm1_nic_info.IpConfigurations | Where-Object -Property Primary -EQ -Value "True"
$vm1_ipconfig_name = ($vm1_primaryip).Name
 
$vm2 = Get-AzVM -ResourceGroupName $rg_name -Name $vm2_name
$vm2_primarynic = $vm2.NetworkProfile.NetworkInterfaces | Where-Object {($_.Primary -eq "True") -or ($_.Primary -eq $null)}
$vm2_nic_name = $vm2_primarynic.Id.Split('/')[-1]
 
$vm2_nic_info = Get-AzNetworkInterface -Name $vm2_nic_name -ResourceGroupName $rg_name
$vm2_primaryip = $vm2_nic_info.IpConfigurations | Where-Object -Property Primary -EQ -Value "True"
$vm2_ipconfig_name = ($vm2_primaryip).Name
 
$vnet_name = $vm1_primaryip.Subnet.Id.Split('/')[-3]
$subnet_name = $vm1_primaryip.Subnet.Id.Split('/')[-1]
$location = $vm1.Location
 
# Create frontend IP resource.
# Allocation of private IP address is dynamic using below command. If you want to pass static IP address, include parameter -PrivateIpAddress
 
$db_lb_fip = @{
    Name = $db_fip_name
    SubnetId = $vm1_primaryip.Subnet.Id
}
$db_fip = New-AzLoadBalancerFrontendIpConfig @db_lb_fip

# Create backend pool
 
$bepool = New-AzLoadBalancerBackendAddressPoolConfig -Name $bkp_name

# Create the health probe
 
$db_probe = @{
    Name = $db_hp_name
    Protocol = 'tcp'
    Port = $db_hp_port
    IntervalInSeconds = '5'
    ProbeThreshold = '2'
    ProbeCount = '1'
}
$db_healthprobe = New-AzLoadBalancerProbeConfig @db_probe
    
# Create load balancing rule
 
$db_lbrule = @{
    Name = $db_rule_name
    Probe = $db_healthprobe
    Protocol = 'All'
    IdleTimeoutInMinutes = '30'
    FrontendIpConfiguration = $db_fip
    BackendAddressPool = $bePool 
} 
$db_rule = New-AzLoadBalancerRuleConfig @db_lbrule -EnableFloatingIP 
 
# Create the load balancer resource
 
$loadbalancer = @{
    ResourceGroupName = $rg_name
    Name = $lb_name
    Location = $location
    Sku = 'Standard'
    FrontendIpConfiguration = $db_fip
    BackendAddressPool = $bePool
    LoadBalancingRule = $db_rule
    Probe = $db_healthprobe
} 
$lb = New-AzLoadBalancer @loadbalancer

# Add DB VMs in backend pool
 
$vm1_primaryip.LoadBalancerBackendAddressPools.Add($lb.BackendAddressPools[0])
$vm2_primaryip.LoadBalancerBackendAddressPools.Add($lb.BackendAddressPools[0])
$vm1_nic_info | Set-AzNetworkInterface
$vm2_nic_info | Set-AzNetworkInterface

重要

フローティング IP は、負荷分散シナリオの NIC セカンダリ IP 構成ではサポートされていません。詳細については、Azure Load Balancer の制限事項に関する記事を参照してください。 VM に別の IP アドレスが必要な場合は、2 つ目の NIC をデプロイします。

Note

パブリック IP アドレスのない VM が、Standard の Azure Load Balancer の内部 (パブリック IP アドレスのない) インスタンスのバックエンドプール内に配置されている場合、パブリックエンドポイントへのルーティングを許可するように追加の構成が実行されない限り、送信インターネット接続はありません。送信接続を実現する方法の詳細については、「SAP の高可用性シナリオにおける Azure Standard Load Balancer を使用した VM のパブリックエンドポイント接続」を参照してください。

重要

Azure Load Balancer の背後に配置された Azure VM では TCP タイムスタンプを有効にしないでください。 TCP タイムスタンプを有効にすると正常性プローブが失敗する可能性があります。パラメーター net.ipv4.tcp_timestamps を 0 に設定します。詳細については、「Load Balancer の正常性プローブ」を参照してください。

Pacemaker クラスターを作成する

この IBM Db2 サーバー用に基本的な Pacemaker クラスターを作成する場合は、「Azure の SUSE Linux Enterprise Server に Pacemaker をセットアップする」を参照してください。

Db2 Pacemaker の構成

ノードの障害発生時に自動フェールオーバーに Pacemaker を使用する場合は、Db2 インスタンスと Pacemaker を適宜構成する必要があります。このセクションでは、この種の構成について説明します。

以下の項目には、次のいずれかのプレフィックスが付いています。

[A] :すべてのノードに適用できます
[1] :ノード 1 にのみ適用できます
[2] :ノード 2 にのみ適用できます

[A] Pacemaker の構成に関する前提条件:

ユーザー db2<sid> で、db2stop を使用して両方のデータベースサーバーをシャットダウンします。
db2<sid> ユーザーのシェル環境を /bin/ksh に変更します。 Yast ツールを使用することをお勧めします。

Pacemaker の構成

重要

最近のテストで、バックログと 1 つの接続のみを処理するという制限があるため、netcat によって要求への応答が停止される状況があることが明らかになりました。 netcat リソースでは、Azure ロードバランサー要求のリッスンを停止し、フローティング IP は使用できなくなります。既存の Pacemaker クラスターについては、以前、netcat を socat に置き換えることをお勧めしました。現時点では、resource-agents パッケージの一部である azure-lb リソースエージェントを使用することをお勧めしています。パッケージのバージョン要件は次のとおりです。

SLES 12 SP4/SP5 の場合、バージョンは resource-agents-4.3.018.a7fb5035-3.30.1 以上である必要があります。
SLES 15/15 SP1 の場合、バージョンは resource-agents-4.3.0184.6ee15eb2-4.13.1 以上である必要があります。

変更には短時間のダウンタイムが必要であることに注意してください。
既存の Pacemaker クラスターについては、「Azure Load-Balancer の検出のセキュリティ強化」で説明されているように、socat を使用するよう構成が既に変更されていた場合は、すぐに azure-lb リソースエージェントに切り替える必要はありません。

[1] IBM Db2 HADR 固有の Pacemaker の構成:

# Put Pacemaker into maintenance mode
sudo crm configure property maintenance-mode=true

[1] IBM Db2 リソースを作成する:

# Replace **bold strings** with your instance name db2sid, database SID, and virtual IP address/Azure Load Balancer.
sudo crm configure primitive rsc_Db2_db2ptr_PTR db2 \
        params instance="db2ptr" dblist="PTR" \
        op start interval="0" timeout="130" \
        op stop interval="0" timeout="120" \
        op promote interval="0" timeout="120" \
        op demote interval="0" timeout="120" \
        op monitor interval="30" timeout="60" \
        op monitor interval="31" role="Master" timeout="60"

# Configure virtual IP - same as Azure Load Balancer IP
sudo crm configure primitive rsc_ip_db2ptr_PTR IPaddr2 \
        op monitor interval="10s" timeout="20s" \
        params ip="10.100.0.10"

# Configure probe port for Azure load Balancer
sudo crm configure primitive rsc_nc_db2ptr_PTR azure-lb port=62500 \
        op monitor timeout=20s interval=10

sudo crm configure group g_ip_db2ptr_PTR rsc_ip_db2ptr_PTR rsc_nc_db2ptr_PTR

sudo crm configure ms msl_Db2_db2ptr_PTR rsc_Db2_db2ptr_PTR \
        meta target-role="Started" notify="true"

sudo crm configure colocation col_db2_db2ptr_PTR inf: g_ip_db2ptr_PTR:Started msl_Db2_db2ptr_PTR:Master

sudo crm configure order ord_db2_ip_db2ptr_PTR inf: msl_Db2_db2ptr_PTR:promote g_ip_db2ptr_PTR:start

sudo crm configure rsc_defaults resource-stickiness=1000
sudo crm configure rsc_defaults migration-threshold=5000

[1] IBM Db2 リソースを起動する:

Pacemaker のメンテナンスモードを解除します。

# Put Pacemaker out of maintenance-mode - that start IBM Db2
sudo crm configure property maintenance-mode=false

[1] クラスターの状態が正常であることと、すべてのリソースが起動されていることを確認します。リソースがどのノードで実行されているかは重要ではありません。

sudo crm status

# 2 nodes configured
# 5 resources configured

# Online: [ azibmdb01 azibmdb02 ]

# Full list of resources:

# stonith-sbd    (stonith:external/sbd): Started azibmdb02
# Resource Group: g_ip_db2ptr_PTR
#      rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb02
#      rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb02
# Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
#      Masters: [ azibmdb02 ]
#      Slaves: [ azibmdb01 ]

重要

Pacemaker のツールを使用して、Pacemaker によってクラスター化された Db2 インスタンスを管理する必要があります。 db2stop などの db2 コマンドを使用する場合、Pacemaker ではアクションがリソースのエラーとして検出されます。メンテナンスを行う場合は、ノードまたはリソースをメンテナンスモードにすることができます。 Pacemaker によってリソースの監視が中断されます。その後、通常の db2 管理コマンドを使用できます。

接続に仮想 IP を使用するよう SAP プロファイルに変更を加える

HADR 構成のプライマリインスタンスに接続するには、SAP アプリケーションレイヤーで、Azure Load Balancer 用に定義して構成した仮想 IP アドレスを使用する必要があります。次の変更が必要です。

/sapmnt/<SID>/profile/DEFAULT.PFL

SAPDBHOST = db-virt-hostname
j2ee/dbhost = db-virt-hostname

/sapmnt/<SID>/global/db6/db2cli.ini

Hostname=db-virt-hostname

プライマリおよびダイアログアプリケーションサーバーをインストールする

Db2 HADR 構成に対してプライマリおよびダイアログアプリケーションサーバーをインストールする際は、その構成用に選択した仮想ホスト名を使用します。

Db2 HADR 構成を作成する前にインストールを行った場合は、前のセクションの説明に従って変更を加え、SAP Java スタックに対しては次のように変更を行う必要があります。

ABAP+Java または Java スタックシステムの JDBC URL の確認

J2EE Config ツールを使用して JDBC URL を確認または更新します。 J2EE Config ツールはグラフィカルツールであるため、X サーバーがインストールされている必要があります。

J2EE インスタンスのプライマリアプリケーションサーバーにサインインし、以下を実行します。
```
sudo /usr/sap/*SID*/*Instance*/j2ee/configtool/configtool.sh
```
左側のフレームで、セキュリティストアを選択します。
右側のフレームで、キー jdbc/pool/<SAPSID>/url を選択します。
JDBC URL のホスト名を仮想ホスト名に変更します。
```
jdbc:db2://db-virt-hostname:5912/TSP:deferPrepares=0
```
[追加] を選択します。
変更を保存するには、左上のディスクアイコンを選択します。
構成ツールを閉じます。
Java インスタンスを再起動します。

HADR 設定のログアーカイブを構成する

HADR 設定の Db2 ログアーカイブを構成するには、すべてのログアーカイブ保存先から自動的にログを取得できるようにプライマリとスタンバイの両方のデータベースを構成することをお勧めします。プライマリデータベースとスタンバイデータベースの両方で、すべてのログアーカイブの場所 (データベースインスタンスの 1 つでログファイルがアーカイブされる可能性のある場所) からログアーカイブファイルを取得できる必要があります。

ログアーカイブは、プライマリデータベースでのみ実行されます。データベースサーバーの HADR ロールを変更した場合または障害が発生した場合は、新しいプライマリデータベースがログアーカイブを担います。複数のログアーカイブの場所を設定した場合は、ログが 2 回アーカイブされる可能性があります。ローカルまたはリモートのキャッチアップが発生した場合は、古いプライマリサーバーから新しいプライマリサーバーのアクティブなログの場所に、アーカイブされたログを手動でコピーする必要がある場合もあります。

両方のノードからログが書き込まれる共通の NFS 共有を構成することをお勧めします。 NFS 共有は高可用である必要があります。

トランスポートまたはプロファイルディレクトリで既存の高可用性 NFS 共有を使用することができます。詳細については、次を参照してください。

SUSE Linux Enterprise Server 上の Azure VM での NFS の高可用性。
SAP アプリケーション用の Azure NetApp Files を使用した SUSE Linux Enterprise Server 上の Azure VM 上の SAP NetWeaver の高可用性。
Azure NetApp Files (NFS 共有を作成する場合)。

クラスターの設定をテストする

このセクションでは、Db2 の HADR 設定をテストする方法について説明します。 ''すべてのテストで前提となるのは、root ユーザーとしてログインしていること'' と、IBM Db2 プライマリが azibmdb01 仮想マシンで実行されていることです。

すべてのテストケースの初期状態は次のとおりです: (crm_mon -r または crm status)

crm status は実行時の Pacemaker 状態のスナップショットです。
crm_mon -r は Pacemaker 状態の連続出力です。

2 nodes configured
5 resources configured

Online: [ azibmdb01 azibmdb02 ]

Full list of resources:

stonith-sbd     (stonith:external/sbd): Started azibmdb02
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Stopped
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Stopped
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     rsc_Db2_db2ptr_PTR      (ocf::heartbeat:db2):   Promoting azibmdb01
     Slaves: [ azibmdb02 ]

SAP システムにおける最初の状態は、次のイメージに示されているように、[Transaction DBACOCKPIT](トランザクション DBACOCKPIT) > [構成] > [概要] に文書化されます。

DBACockpit - Pre Migration

IBM Db2 の引き継ぎをテストする

重要

テストを開始する前に、次のことを確認します。

Pacemaker に失敗したアクションがない (crm status)。
場所の制約 (移行テストの残り) はありません。
IBM Db2 HADR 同期が動作している。ユーザー db2<sid> で確認します。
```
db2pd -hadr -db <DBSID>
```

次のコマンドを実行して、プライマリ Db2 データベースを実行しているノードを移行します。

crm resource migrate msl_Db2_db2ptr_PTR azibmdb02

移行が完了した後、crm status の出力は次のようになります。

2 nodes configured
5 resources configured

Online: [ azibmdb01 azibmdb02 ]

Full list of resources:

stonith-sbd     (stonith:external/sbd): Started azibmdb02
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb02
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb02
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     Masters: [ azibmdb02 ]
     Slaves: [ azibmdb01 ]

DBACockpit - Post Migration

"crm resource migrate" を使用したリソースの移行により、場所の制約が作成されます。場所の制約は削除する必要があります。場所の制約が削除されていないと、リソースをフェールバックできない場合や、不要な引き継ぎが行われる場合があります。

リソースを再度 azibmdb01 に移行し、場所の制約をクリアします

crm resource migrate msl_Db2_db2ptr_PTR azibmdb01
crm resource clear msl_Db2_db2ptr_PTR

crm resource migrate <res_name><host>: 場所の制約を作成します。引き継ぎで問題が生じる場合があります。
crm resource clear <res_name>: 場所の制約をクリアします。
crm resource cleanup <res_name>: リソースのエラーをすべてクリアします。

SBD フェンスをテストする

この場合は、SBD フェンスをテストします。これは、SUSE Linux を使用するときに実行することをお勧めします。

azibmdb01:~ # ps -ef|grep sbd
root       2374      1  0 Feb05 ?        00:00:17 sbd: inquisitor
root       2378   2374  0 Feb05 ?        00:00:40 sbd: watcher: /dev/disk/by-id/scsi-36001405fbbaab35ee77412dacb77ae36 - slot: 0 - uuid: 27cad13a-0bce-4115-891f-43b22cfabe65
root       2379   2374  0 Feb05 ?        00:01:51 sbd: watcher: Pacemaker
root       2380   2374  0 Feb05 ?        00:00:18 sbd: watcher: Cluster

azibmdb01:~ # kill -9 2374

クラスターノード azibmdb01 を再起動する必要があります。 IBM Db2 のプライマリ HADR ロールは azibmdb02 に移動されます。 azibmdb01 がオンラインに戻ると、Db2 インスタンスがセカンダリデータベースインスタンスのロールに移動します。

再起動された以前のプライマリで Pacemaker サービスが自動的に起動しない場合は、次のように手動で起動してください。

sudo service pacemaker start

手動での引き継ぎをテストする

手動での引き継ぎをテストするには、azibmdb01 ノードで Pacemaker サービスを停止します。

service pacemaker stop

azibmdb02 の状態

2 nodes configured
5 resources configured

Online: [ azibmdb02 ]
OFFLINE: [ azibmdb01 ]

Full list of resources:

stonith-sbd     (stonith:external/sbd): Started azibmdb02
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb02
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb02
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     Masters: [ azibmdb02 ]
     Stopped: [ azibmdb01 ]

フェールオーバー後、再び azibmdb01 上でサービスを開始できます。

service pacemaker start

HADR プライマリデータベースを実行するノード上で Db2 プロセスを中止する

#Kill main db2 process - db2sysc
azibmdb01:~ # ps -ef|grep db2s
db2ptr    34598  34596  8 14:21 ?        00:00:07 db2sysc 0

azibmdb01:~ # kill -9 34598

Db2 インスタンスで障害が発生し、Pacemaker から次の状態がレポートされます。

2 nodes configured
5 resources configured

Online: [ azibmdb01 azibmdb02 ]

Full list of resources:

stonith-sbd    (stonith:external/sbd): Started azibmdb01
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Stopped
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Stopped
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     Slaves: [ azibmdb02 ]
     Stopped: [ azibmdb01 ]

Failed Actions:
* rsc_Db2_db2ptr_PTR_demote_0 on azibmdb01 'unknown error' (1): call=157, status=complete, exitreason='',
    last-rc-change='Tue Feb 12 14:28:19 2019', queued=40ms, exec=223ms

Pacemaker によって、同じノードで Db2 プライマリデータベースインスタンスが再起動されます。または、セカンダリデータベースインスタンスを実行しているノードにフェールオーバーされ、エラーがレポートされます。

2 nodes configured
5 resources configured

Online: [ azibmdb01 azibmdb02 ]

Full list of resources:

stonith-sbd    (stonith:external/sbd): Started azibmdb01
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb01
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb01
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     Masters: [ azibmdb01 ]
     Slaves: [ azibmdb02 ]

Failed Actions:
* rsc_Db2_db2ptr_PTR_demote_0 on azibmdb01 'unknown error' (1): call=157, status=complete, exitreason='',
    last-rc-change='Tue Feb 12 14:28:19 2019', queued=40ms, exec=223ms

セカンダリデータベースインスタンスを実行するノード上の Db2 プロセスを中止する

azibmdb02:~ # ps -ef|grep db2s
db2ptr    65250  65248  0 Feb11 ?        00:09:27 db2sysc 0

azibmdb02:~ # kill -9

このノードは、失敗した状態になり、エラーがレポートされます。

2 nodes configured
5 resources configured

Online: [ azibmdb01 azibmdb02 ]

Full list of resources:

stonith-sbd    (stonith:external/sbd): Started azibmdb01
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb01
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb01
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     rsc_Db2_db2ptr_PTR      (ocf::heartbeat:db2):   FAILED azibmdb02
     Masters: [ azibmdb01 ]

Failed Actions:
* rsc_Db2_db2ptr_PTR_monitor_30000 on azibmdb02 'not running' (7): call=144, status=complete, exitreason='',
last-rc-change='Tue Feb 12 14:36:59 2019', queued=0ms, exec=0ms

Db2 インスタンスが、以前割り当てられていたセカンダリロールで再起動されます。

2 nodes configured
5 resources configured

Online: [ azibmdb01 azibmdb02 ]

Full list of resources:

stonith-sbd     (stonith:external/sbd): Started azibmdb01
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb01
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb01
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     Masters: [ azibmdb01 ]
     Slaves: [ azibmdb02 ]

Failed Actions:
* rsc_Db2_db2ptr_PTR_monitor_30000 on azibmdb02 'not running' (7): call=144, status=complete, exitreason='',
    last-rc-change='Tue Feb 12 14:36:59 2019', queued=0ms, exec=0ms

HADR プライマリデータベースインスタンスを実行するノード上の DB を db2stop force を使用して停止する

2 nodes configured
5 resources configured

Online: [ azibmdb01 azibmdb02 ]

Full list of resources:

stonith-sbd     (stonith:external/sbd): Started azibmdb01
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb01
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb01
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     Masters: [ azibmdb01 ]
     Slaves: [ azibmdb02 ]

ユーザー db2<sid> として、db2stop force コマンドを実行します。

azibmdb01:~ # su - db2ptr
azibmdb01:db2ptr> db2stop force

障害が検出されました

2 nodes configured
5 resources configured

Online: [ azibmdb01 azibmdb02 ]

Full list of resources:

stonith-sbd    (stonith:external/sbd): Started azibmdb01
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Stopped
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Stopped
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     rsc_Db2_db2ptr_PTR      (ocf::heartbeat:db2):   FAILED azibmdb01
     Slaves: [ azibmdb02 ]

Failed Actions:
* rsc_Db2_db2ptr_PTR_demote_0 on azibmdb01 'unknown error' (1): call=201, status=complete, exitreason='',
    last-rc-change='Tue Feb 12 14:45:25 2019', queued=1ms, exec=150ms

Db2 HADR セカンダリデータベースインスタンスがプライマリロールに昇格されました。

nodes configured
5 resources configured

Online: [ azibmdb01 azibmdb02 ]

Full list of resources:

stonith-sbd     (stonith:external/sbd): Started azibmdb01
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb02
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb02
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     Masters: [ azibmdb02 ]
     Stopped: [ azibmdb01 ]

Failed Actions:
* rsc_Db2_db2ptr_PTR_start_0 on azibmdb01 'unknown error' (1): call=205, stat
us=complete, exitreason='',
    last-rc-change='Tue Feb 12 14:45:27 2019', queued=0ms, exec=865ms

HADR プライマリデータベースインスタンスを実行するノード上の VM を再起動でクラッシュさせる

#Linux kernel panic - with OS restart
azibmdb01:~ # echo b > /proc/sysrq-trigger

Pacemaker はセカンダリインスタンスをプライマリインスタンスロールに昇格させます。古いプライマリインスタンスは、VM の再起動後にその VM とすべてのサービスが完全に復元された後、セカンダリロールに移行されます。

nodes configured
5 resources configured

Online: [ azibmdb01 azibmdb02 ]

Full list of resources:

stonith-sbd     (stonith:external/sbd): Started azibmdb02
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb01
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb01
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     Masters: [ azibmdb01 ]
     Slaves: [ azibmdb02 ]

HADR プライマリデータベースインスタンスを実行する VM を "停止" してクラッシュさせる

#Linux kernel panic - halts OS
azibmdb01:~ # echo b > /proc/sysrq-trigger

この場合、Pacemaker で、プライマリデータベースインスタンスを実行しているノードが応答していないことが検出されます。

2 nodes configured
5 resources configured

Node azibmdb01: UNCLEAN (online)
Online: [ azibmdb02 ]

Full list of resources:

stonith-sbd     (stonith:external/sbd): Started azibmdb02
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb01
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb01
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     Masters: [ azibmdb01 ]
     Slaves: [ azibmdb02 ]

次の手順は、スプリットブレイン の状況を確認することです。プライマリデータベースインスタンスを最後に実行したノードがダウンしていることが、最後まで残ったノードで確認された後、リソースのフェールオーバーが実行されます。

2 nodes configured
5 resources configured

Online: [ azibmdb02 ]
OFFLINE: [ azibmdb01 ]

Full list of resources:

stonith-sbd     (stonith:external/sbd): Started azibmdb02
Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb02
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb02
Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     Masters: [ azibmdb02 ]
     Stopped: [ azibmdb01 ]

ノードが "停止" した場合、障害が発生したノードを (Azure portal、PowerShell、または Azure CLI で) Azure 管理ツールを使用して再起動する必要があります。障害が発生したノードがオンラインに戻った後、Db2 インスタンスがセカンダリロールとして起動されます。

2 nodes configured
5 resources configured

Online: [ azibmdb01 azibmdb02 ]

Full list of resources:

stonith-sbd     (stonith:external/sbd): Started azibmdb02
 Resource Group: g_ip_db2ptr_PTR
     rsc_ip_db2ptr_PTR  (ocf::heartbeat:IPaddr2):       Started azibmdb02
     rsc_nc_db2ptr_PTR  (ocf::heartbeat:azure-lb):      Started azibmdb02
 Master/Slave Set: msl_Db2_db2ptr_PTR [rsc_Db2_db2ptr_PTR]
     Masters: [ azibmdb02 ]
     Slaves: [ azibmdb01 ]

Pacemaker による SUSE Linux Enterprise Server 上の Azure VM での IBM Db2 LUW の高可用性

概要

必要な手順の概要

HADR の IBM Db2 LUW をホストするための Azure インフラストラクチャを計画する

SUSE Linux へのデプロイ

ホスト:DNS の更新

手動デプロイ

IBM Db2 LUW と SAP 環境をインストールする

HADR 搭載の IBM Db2 LUW を設定するためのインストールのヒント

IBM Db2 HADR の確認

Azure Load Balancer を構成する

Pacemaker クラスターを作成する

Db2 Pacemaker の構成

Pacemaker の構成

接続に仮想 IP を使用するよう SAP プロファイルに変更を加える

プライマリおよびダイアログ アプリケーション サーバーをインストールする

ABAP+Java または Java スタック システムの JDBC URL の確認

HADR 設定のログ アーカイブを構成する

クラスターの設定をテストする

IBM Db2 の引き継ぎをテストする

SBD フェンスをテストする

手動での引き継ぎをテストする

HADR プライマリ データベースを実行するノード上で Db2 プロセスを中止する

セカンダリ データベース インスタンスを実行するノード上の Db2 プロセスを中止する

HADR プライマリ データベース インスタンスを実行するノード上の DB を db2stop force を使用して停止する

HADR プライマリ データベース インスタンスを実行するノード上の VM を再起動でクラッシュさせる

HADR プライマリ データベース インスタンスを実行する VM を "停止" してクラッシュさせる

次のステップ

その他のリソース

プライマリおよびダイアログアプリケーションサーバーをインストールする

ABAP+Java または Java スタックシステムの JDBC URL の確認

HADR 設定のログアーカイブを構成する

HADR プライマリデータベースを実行するノード上で Db2 プロセスを中止する

セカンダリデータベースインスタンスを実行するノード上の Db2 プロセスを中止する

HADR プライマリデータベースインスタンスを実行するノード上の DB を db2stop force を使用して停止する

HADR プライマリデータベースインスタンスを実行するノード上の VM を再起動でクラッシュさせる

HADR プライマリデータベースインスタンスを実行する VM を "停止" してクラッシュさせる