Menyiapkan Pacemaker di Red Hat Enterprise Linux di Azure
Artikel ini menjelaskan cara mengonfigurasi kluster Pacemaker dasar di Red Hat Enterprise Server (RHEL). Instruksinya mencakup RHEL 7, RHEL 8, dan RHEL 9.
Prasyarat
Baca makalah dan Catatan SAP berikut terlebih dahulu:
- 1928533 Catatan SAP, yang memiliki:
- Daftar ukuran komputer virtual (VM) Azure yang didukung untuk penyebaran perangkat lunak SAP.
- Informasi kapasitas penting untuk ukuran komputer virtual Azure.
- Kombinasi perangkat lunak dan sistem operasi (OS) dan database SAP yang didukung.
- Versi kernel SAP yang diperlukan untuk Windows dan Linux di Microsoft Azure.
- Catatan SAP 2015553 mencantumkan prasyarat untuk penyebaran perangkat lunak SAP yang didukung SAP di Azure.
- Catatan SAP 2002167 merekomendasikan pengaturan OS untuk Red Hat Enterprise Linux.
- Catatan SAP 3108316 merekomendasikan pengaturan OS untuk Red Hat Enterprise Linux 9.x.
- Catatan SAP 2009879 memiliki Pedoman SAP HANA untuk Red Hat Enterprise Linux.
- Catatan SAP 3108302 memiliki Panduan SAP Hana untuk Red Hat Enterprise Linux 9.x.
- Catatan SAP 2178632 memiliki informasi rinci tentang semua metrik pemantauan yang dilaporkan untuk SAP pada Azure.
- SAP Note 2191498 memiliki versi Agen Host SAP yang diperlukan untuk Linux di Azure.
- Catatan SAP 2243692 memiliki informasi tentang lisensi SAP di Linux pada Azure.
- Catatan SAP 1999351 memiliki lebih banyak informasi pemecahan masalah bagi ekstensi Azure Enhanced Monitoring untuk SAP.
- SAP Community WIKI memiliki semua SAP Note yang diperlukan untuk Linux.
- Microsoft Azure Virtual Machines perencanaan dan penerapan untuk SAP di Linux
- Microsoft Azure Virtual Machines penyebaran untuk SAP di Linux (artikel ini)
- Penyebaran Azure Virtual Machines DBMS untuk SAP pada Linux
- Replikasi sistem SAP Hana di kluster Pacemaker
- Dokumentasi RHEL umum:
- Dokumentasi RHEL khusus Azure:
- Kebijakan Dukungan untuk Kluster Ketersediaan Tinggi RHEL - Microsoft Azure Virtual Machines sebagai Anggota Kluster
- Memasang dan Mengonfigurasikan Red Hat Enterprise Linux 7.4 (dan yang lebih baru) Ketersediaan Tinggi Kluster pada Microsoft Azure
- Pertimbangan dalam Mengadopsi RHEL 8 - Ketersediaan dan Kluster Tinggi
- Mengonfigurasi SAP S/4HANA ASCS/ERS dengan Standalone Enqueue Server 2 (ENSA2) di Pacemaker pada RHEL 7.6
- RHEL untuk Penawaran SAP di Azure
Penginstalan kluster
Catatan
Red Hat tidak mendukung pengawas yang ditimulasi perangkat lunak. Red Hat tidak mendukung SBD pada platform cloud. Untuk informasi selengkapnya, lihat Kebijakan Dukungan untuk Kluster Ketersediaan Tinggi RHEL - sbd dan fence_sbd.
Satu-satunya mekanisme pagar yang didukung untuk kluster Pacemaker RHEL di Azure adalah agen pagar Azure.
Item berikut dimulai dengan:
- [A]: Berlaku untuk semua simpul
- [1]: Hanya berlaku untuk simpul 1
- [2]: Hanya berlaku untuk simpul 2
Perbedaan dalam perintah atau konfigurasi antara RHEL 7 dan RHEL 8/RHEL 9 ditandai dalam dokumen.
[A] Melakukan Pendaftaran. Langkah ini bersifat opsional. Jika Anda menggunakan gambar yang diaktifkan RHEL SAP HA, langkah ini tidak diperlukan.
Misalnya, jika Anda menyebarkan di RHEL 7, daftarkan VM Anda dan lampirkan ke kumpulan yang berisi repositori untuk RHEL 7.
sudo subscription-manager register # List the available pools sudo subscription-manager list --available --matches '*SAP*' sudo subscription-manager attach --pool=<pool id>
Saat Anda melampirkan kumpulan ke gambar RHEL bayar sesuai pemakaian Marketplace Azure, Anda secara efektif ditagih dua kali lipat untuk penggunaan RHEL Anda. Anda ditagih sekali untuk gambar bayar sesuai penggunaan dan sekali untuk pemberian hak RHEL di kumpulan yang Anda lampirkan. Untuk mengurangi situasi ini, Azure sekarang menyediakan gambar RHEL bawa langganan Anda sendiri. Untuk informasi lebih lanjut, lihat Red Hat Enterprise Linux menghadirkan gambar Azure langganan Anda sendiri.
[A] Mengaktifkan RHEL untuk repositori SAP. Langkah ini bersifat opsional. Jika Anda menggunakan gambar yang diaktifkan RHEL SAP HA, langkah ini tidak diperlukan.
Untuk menginstal paket yang diperlukan pada RHEL 7, aktifkan repositori berikut:
sudo subscription-manager repos --disable "*" sudo subscription-manager repos --enable=rhel-7-server-rpms sudo subscription-manager repos --enable=rhel-ha-for-rhel-7-server-rpms sudo subscription-manager repos --enable=rhel-sap-for-rhel-7-server-rpms sudo subscription-manager repos --enable=rhel-ha-for-rhel-7-server-eus-rpms
[A] Pasang add-on RHEL HA.
sudo yum install -y pcs pacemaker fence-agents-azure-arm nmap-ncat
Penting
Kami merekomendasikan versi agen pagar Azure berikut (atau yang lebih baru) agar pelanggan mendapatkan manfaat dari waktu failover yang lebih cepat, jika penghentian sumber daya gagal atau node kluster tidak dapat berkomunikasi satu sama lain lagi:
RHEL 7.7 atau yang lebih tinggi menggunakan versi terbaru paket agen pagar yang tersedia.
RHEL 7.6: agen pagar-4.2.1-11.el7_6.8
RHEL 7.5: agen pagar-4.0.11-86.el7_5.8
RHEL 7.4: agen pagar-4.0.11-66.el7_4.12
Untuk informasi selengkapnya, lihat Azure VM yang berjalan sebagai anggota kluster Ketersediaan Tinggi RHEL membutuhkan waktu yang sangat lama untuk dipatahkan, atau pemagaran gagal/waktu habis sebelum VM dimatikan.
Penting
Kami merekomendasikan versi agen pagar Azure berikut (atau yang lebih baru) untuk pelanggan yang ingin menggunakan identitas terkelola untuk sumber daya Azure alih-alih nama perwakilan layanan untuk agen pagar:
RHEL 8.4: agen pagar-4.2.1-54.el8.
RHEL 8.2: fence-agents-4.2.1-41.el8_2.4
RHEL 8.1: fence-agents-4.2.1-30.el8_1.4
RHEL 7.9: fence-agents-4.2.1-41.el7_9.4.
Penting
Pada RHEL 9, kami merekomendasikan versi paket berikut (atau yang lebih baru) untuk menghindari masalah dengan agen pagar Azure:
agen pagar-4.10.0-20.el9_0.7
fence-agents-common-4.10.0-20.el9_0.6
ha-cloud-support-4.10.0-20.el9_0.6.x86_64.rpm
Periksa versi agen pagar Azure. Jika perlu, perbarui ke versi minimum yang diperlukan atau yang lebih baru.
# Check the version of the Azure Fence Agent sudo yum info fence-agents-azure-arm
Penting
Jika Anda perlu memperbarui agen pagar Azure, dan jika Anda menggunakan peran kustom, pastikan untuk memperbarui peran kustom untuk menyertakan powerOff tindakan. Untuk informasi selengkapnya, lihat Membuat peran kustom untuk agen pagar.
Jika Anda menyebarkan di RHEL 9, instal juga agen sumber daya untuk penyebaran cloud.
sudo yum install -y resource-agents-cloud
[A] Siapkan resolusi nama host.
Anda bisa menggunakan server DNS atau mengubah
/etc/hosts
file pada semua simpul. Contoh ini memperlihatkan cara menggunakan file/etc/hosts
. Ganti alamat IP dan nama host dalam perintah berikut.Penting
Jika Anda menggunakan nama host dalam konfigurasi kluster, sangat penting untuk memiliki resolusi nama host yang andal. Komunikasi kluster gagal jika nama tidak tersedia, yang dapat menyebabkan penundaan failover kluster.
Manfaat penggunaannya
/etc/hosts
adalah kluster Anda menjadi independen dari DNS, yang bisa menjadi satu titik kegagalan juga.sudo vi /etc/hosts
Sisipkan baris berikut ke
/etc/hosts
. Ubah alamat IP dan nama host agar sesuai dengan lingkungan Anda.# IP address of the first cluster node 10.0.0.6 prod-cl1-0 # IP address of the second cluster node 10.0.0.7 prod-cl1-1
[A] Ubah
hacluster
kata sandi ke kata sandi yang sama.sudo passwd hacluster
[A] Tambahkan aturan firewall untuk Pacemaker.
Tambahkan aturan firewall berikut ke semua komunikasi kluster antara node kluster.
sudo firewall-cmd --add-service=high-availability --permanent sudo firewall-cmd --add-service=high-availability
[A] Aktifkan layanan kluster dasar.
Jalankan perintah berikut untuk mengaktifkan layanan Pacemaker dan memulainya.
sudo systemctl start pcsd.service sudo systemctl enable pcsd.service
[1] Buat kluster Pacemaker.
Jalankan perintah berikut untuk mengautentikasi node dan membuat kluster. Atur token ke 30000 untuk memungkinkan pemeliharaan yang mempertahankan memori. Untuk informasi selengkapnya, lihat artikel untuk Linux ini.
Jika Anda membangun kluster di RHEL 7.x, gunakan perintah berikut:
sudo pcs cluster auth prod-cl1-0 prod-cl1-1 -u hacluster sudo pcs cluster setup --name nw1-azr prod-cl1-0 prod-cl1-1 --token 30000 sudo pcs cluster start --all
Jika Anda membangun kluster di RHEL 8.x/RHEL 9.x, gunakan perintah berikut:
sudo pcs host auth prod-cl1-0 prod-cl1-1 -u hacluster sudo pcs cluster setup nw1-azr prod-cl1-0 prod-cl1-1 totem token=30000 sudo pcs cluster start --all
Verifikasi status kluster dengan menjalankan perintah berikut:
# Run the following command until the status of both nodes is online sudo pcs status # Cluster name: nw1-azr # WARNING: no stonith devices and stonith-enabled is not false # Stack: corosync # Current DC: prod-cl1-1 (version 1.1.18-11.el7_5.3-2b07d5c5a9) - partition with quorum # Last updated: Fri Aug 17 09:18:24 2018 # Last change: Fri Aug 17 09:17:46 2018 by hacluster via crmd on prod-cl1-1 # # 2 nodes configured # 0 resources configured # # Online: [ prod-cl1-0 prod-cl1-1 ] # # No resources # # Daemon Status: # corosync: active/disabled # pacemaker: active/disabled # pcsd: active/enabled
[A] Tetapkan suara yang diharapkan.
# Check the quorum votes pcs quorum status # If the quorum votes are not set to 2, execute the next command sudo pcs quorum expected-votes 2
Tip
Jika Anda membangun kluster multinode, yaitu kluster dengan lebih dari dua node, jangan atur suara ke 2.
[1] Izinkan tindakan pagar bersamaan.
sudo pcs property set concurrent-fencing=true
Membuat perangkat anggar
Perangkat anggar menggunakan identitas terkelola untuk sumber daya Azure atau perwakilan layanan untuk mengotorisasi terhadap Azure.
Untuk membuat identitas terkelola (MSI), buat identitas terkelola yang ditetapkan sistem untuk setiap mesin virtual di kluster. Jika identitas terkelola yang ditetapkan sistem sudah ada, identitas tersebut akan digunakan. Jangan gunakan identitas terkelola yang ditetapkan pengguna dengan Pacemaker saat ini. Perangkat pagar, berdasarkan identitas terkelola, didukung pada RHEL 7.9 dan RHEL 8.x/RHEL 9.x.
[1] Membuat peran kustom untuk agen anggar
Identitas terkelola dan perwakilan layanan tidak memiliki izin untuk mengakses sumber daya Azure Anda secara default. Anda perlu memberikan izin identitas terkelola atau perwakilan layanan untuk memulai dan menghentikan (mematikan) semua VM kluster. Jika Anda belum membuat peran kustom, Anda dapat membuatnya dengan menggunakan PowerShell atau Azure CLI.
Gunakan konten berikut untuk file input. Anda perlu menyesuaikan konten dengan langganan Anda, yaitu, mengganti xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx
dan yyyyyyyy-yyyy-yyyy-yyyy-yyyyyyyyyyyy
dengan ID langganan Anda. Jika Anda hanya memiliki satu langganan, hapus entri kedua di AssignableScopes
.
{
"Name": "Linux Fence Agent Role",
"description": "Allows to power-off and start virtual machines",
"assignableScopes": [
"/subscriptions/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
"/subscriptions/yyyyyyyy-yyyy-yyyy-yyyy-yyyyyyyyyyyy"
],
"actions": [
"Microsoft.Compute/*/read",
"Microsoft.Compute/virtualMachines/powerOff/action",
"Microsoft.Compute/virtualMachines/start/action"
],
"notActions": [],
"dataActions": [],
"notDataActions": []
}
[A] Menetapkan peran kustom
Gunakan identitas terkelola atau perwakilan layanan.
Tetapkan peran Linux Fence Agent Role
kustom yang dibuat di bagian terakhir untuk setiap identitas terkelola VM kluster. Setiap identitas terkelola yang ditetapkan sistem mesin virtual memerlukan peran yang ditetapkan untuk setiap sumber daya mesin virtual kluster. Untuk informasi lebih lanjut, lihat Menetapkan akses ke identitas terkelola untuk mengakses sumber daya menggunakan portal Azure. Verifikasi bahwa setiap penetapan peran identitas terkelola VM berisi semua VM kluster.
Penting
Ketahuilah bahwa penugasan dan penghapusan otorisasi dengan identitas terkelola dapat ditunda hingga efektif.
[1] Buat perangkat STONITH
Setelah mengedit izin untuk VM, Anda dapat mengonfigurasi perangkat anggar di kluster.
sudo pcs property set stonith-timeout=900
Catatan
Opsi pcmk_host_map
ini hanya diperlukan dalam perintah jika nama host RHEL dan nama Azure VM tidak identik. Tentukan pemetaan dalam format nama host:vm-name.
Lihat bagian yang ditebalkan dalam perintah. Untuk informasi selengkapnya, lihat Format apa yang harus saya gunakan untuk menentukan pemetaan simpul ke perangkat anggar di pcmk_host_map?.
Untuk RHEL 7.x, gunakan perintah berikut untuk mengonfigurasi perangkat pagar:
sudo pcs stonith create rsc_st_azure fence_azure_arm msi=true resourceGroup="resource group" \
subscriptionId="subscription id" pcmk_host_map="prod-cl1-0:prod-cl1-0-vm-name;prod-cl1-1:prod-cl1-1-vm-name" \
power_timeout=240 pcmk_reboot_timeout=900 pcmk_monitor_timeout=120 pcmk_monitor_retries=4 pcmk_action_limit=3 pcmk_delay_max=15 \
op monitor interval=3600
Untuk RHEL 8.x/9.x, gunakan perintah berikut untuk mengonfigurasi perangkat pagar:
# Run following command if you are setting up fence agent on (two-node cluster and pacemaker version greater than 2.0.4-6.el8) OR (HANA scale out)
sudo pcs stonith create rsc_st_azure fence_azure_arm msi=true resourceGroup="resource group" \
subscriptionId="subscription id" pcmk_host_map="prod-cl1-0:prod-cl1-0-vm-name;prod-cl1-1:prod-cl1-1-vm-name" \
power_timeout=240 pcmk_reboot_timeout=900 pcmk_monitor_timeout=120 pcmk_monitor_retries=4 pcmk_action_limit=3 \
op monitor interval=3600
# Run following command if you are setting up fence agent on (two-node cluster and pacemaker version less than 2.0.4-6.el8)
sudo pcs stonith create rsc_st_azure fence_azure_arm msi=true resourceGroup="resource group" \
subscriptionId="subscription id" pcmk_host_map="prod-cl1-0:prod-cl1-0-vm-name;prod-cl1-1:prod-cl1-1-vm-name" \
power_timeout=240 pcmk_reboot_timeout=900 pcmk_monitor_timeout=120 pcmk_monitor_retries=4 pcmk_action_limit=3 pcmk_delay_max=15 \
op monitor interval=3600
Jika Anda menggunakan perangkat anggar berdasarkan konfigurasi perwakilan layanan, baca Mengubah dari SPN ke MSI untuk kluster Pacemaker dengan menggunakan anggar Azure dan pelajari cara mengonversi ke konfigurasi identitas terkelola.
Tip
- Untuk menghindari perlombaan pagar dalam kluster pacemaker dua node, Anda dapat mengonfigurasi
priority-fencing-delay
properti kluster. Properti ini memperkenalkan penundaan tambahan dalam pemagaran simpul yang memiliki prioritas total sumber daya yang lebih tinggi ketika skenario split-brain terjadi. Untuk informasi selengkapnya, lihat Dapatkah Pacemaker memagari node kluster dengan sumber daya terkecil yang berjalan?. - Properti
priority-fencing-delay
ini berlaku untuk Pacemaker versi 2.0.4-6.el8 atau lebih tinggi dan pada kluster dua node. Jika Anda mengonfigurasipriority-fencing-delay
properti kluster, Anda tidak perlu mengaturpcmk_delay_max
properti . Tetapi jika versi Pacemaker kurang dari 2.0.4-6.el8, Anda perlu mengaturpcmk_delay_max
properti . - Untuk instruksi tentang cara mengatur
priority-fencing-delay
properti kluster, lihat masing-masing dokumen SAP ASCS/ERS dan SAP Hana scale-up HA.
Operasi pemantauan dan pemagaran tidak dibuat berurutan. Akibatnya, jika ada operasi pemantauan yang berjalan lebih lama dan peristiwa anggar simultan, tidak ada penundaan pada failover kluster karena operasi pemantauan sudah berjalan.
[1] Mengaktifkan penggunaan perangkat STONITH
sudo pcs property set stonith-enabled=true
Tip
Agen pagar Azure memerlukan konektivitas keluar ke titik akhir publik. Untuk informasi selengkapnya bersama dengan solusi yang mungkin, lihat Konektivitas titik akhir publik untuk VM menggunakan ILB standar.
Mengonfigurasi Pacemaker untuk acara terjadwal Azure
Azure menawarkan kejadian terjadwal. Peristiwa terjadwal dikirim melalui layanan metadata dan memungkinkan waktu bagi aplikasi untuk mempersiapkan peristiwa tersebut.
Agen azure-events-az
sumber daya Pacemaker memantau peristiwa Azure terjadwal. Jika peristiwa terdeteksi dan agen sumber daya menentukan bahwa simpul kluster lain tersedia, peristiwa tersebut mengatur atribut kesehatan kluster.
Ketika atribut kesehatan kluster diatur untuk simpul, batasan lokasi memicu dan semua sumber daya dengan nama yang tidak dimulai health-
dimigrasikan jauh dari simpul dengan peristiwa terjadwal. Setelah node kluster yang terpengaruh bebas dari menjalankan sumber daya kluster, peristiwa terjadwal diakui dan dapat menjalankan tindakannya, seperti mulai ulang.
[A] Pastikan bahwa paket untuk
azure-events-az
agen sudah diinstal dan diperbarui.RHEL 8.x: sudo dnf info resource-agents RHEL 9.x: sudo dnf info resource-agents-cloud
Persyaratan versi minimum:
- RHEL 8.4:
resource-agents-4.1.1-90.13
- RHEL 8.6:
resource-agents-4.9.0-16.9
- RHEL 8.8:
resource-agents-4.9.0-40.1
- RHEL 9.0:
resource-agents-cloud-4.10.0-9.6
- RHEL 9.2 dan yang lebih baru:
resource-agents-cloud-4.10.0-34.1
- RHEL 8.4:
[1] Konfigurasikan sumber daya di Pacemaker.
#Place the cluster in maintenance mode sudo pcs property set maintenance-mode=true
[1] Atur strategi dan batasan node kesehatan kluster Pacemaker.
sudo pcs property set node-health-strategy=custom sudo pcs constraint location 'regexp%!health-.*' \ rule score-attribute='#health-azure' \ defined '#uname'
Penting
Jangan tentukan sumber daya lain dalam kluster yang dimulai dengan
health-
selain sumber daya yang dijelaskan di langkah berikutnya.[1] Tetapkan nilai awal atribut kluster. Jalankan untuk setiap node kluster dan untuk lingkungan peluasan skala termasuk VM pembuat mayoritas.
sudo crm_attribute --node prod-cl1-0 --name '#health-azure' --update 0 sudo crm_attribute --node prod-cl1-1 --name '#health-azure' --update 0
[1] Konfigurasikan sumber daya di Pacemaker. Pastikan sumber daya dimulai dengan
health-azure
.sudo pcs resource create health-azure-events \ ocf:heartbeat:azure-events-az op monitor interval=10s sudo pcs resource clone health-azure-events allow-unhealthy-nodes=true
Keluarkan kluster Pacemaker dari mode pemeliharaan.
sudo pcs property set maintenance-mode=false
Hapus kesalahan apa pun selama pengaktifan dan verifikasi bahwa
health-azure-events
sumber daya telah berhasil dimulai pada semua node kluster.sudo pcs resource cleanup
Eksekusi kueri pertama kali untuk peristiwa terjadwal dapat memakan waktu hingga dua menit. Pengujian pacemaker dengan peristiwa terjadwal dapat menggunakan tindakan reboot atau penyebaran ulang untuk VM kluster. Untuk informasi selengkapnya, lihat Peristiwa terjadwal.
Konfigurasi pagar opsional
Tip
Bagian ini hanya berlaku jika Anda ingin mengonfigurasi perangkat fence_kdump
pagar khusus .
Jika Anda perlu mengumpulkan informasi diagnostik dalam VM, mungkin berguna untuk mengonfigurasi perangkat pagar lain berdasarkan agen fence_kdump
pagar . Agen fence_kdump
dapat mendeteksi bahwa node memasuki pemulihan crash kdump dan dapat memungkinkan layanan pemulihan crash selesai sebelum metode anggar lainnya dipanggil. Perhatikan bahwa fence_kdump
bukan pengganti mekanisme pagar tradisional, seperti agen pagar Azure, saat Anda menggunakan Azure VM.
Penting
Ketahuilah bahwa ketika fence_kdump
dikonfigurasi sebagai perangkat anggar tingkat pertama, ia memperkenalkan penundaan dalam operasi pagar dan, masing-masing, keterlambatan dalam failover sumber daya aplikasi.
Jika crash dump berhasil terdeteksi, anggar tertunda hingga layanan pemulihan crash selesai. Jika simpul yang gagal tidak dapat dijangkau atau jika tidak merespons, pagar ditunda oleh waktu yang ditentukan, jumlah iterasi yang dikonfigurasi, dan fence_kdump
batas waktu. Untuk informasi selengkapnya, lihat Bagaimana cara mengonfigurasi fence_kdump di kluster Red Hat Pacemaker?.
Batas waktu yang diusulkan fence_kdump
mungkin perlu disesuaikan dengan lingkungan tertentu.
Kami menyarankan agar Anda mengonfigurasi fence_kdump
pagar hanya jika perlu untuk mengumpulkan diagnostik dalam VM dan selalu dalam kombinasi dengan metode pagar tradisional, seperti agen pagar Azure.
Artikel Red Hat KB berikut berisi informasi penting tentang mengonfigurasi fence_kdump
pagar:
- Lihat Bagaimana cara mengonfigurasi fence_kdump di kluster Red Hat Pacemaker?.
- Lihat Cara mengonfigurasi/mengelola tingkat anggar dalam kluster RHEL dengan Pacemaker.
- Lihat fence_kdump gagal dengan "batas waktu setelah X detik" dalam kluster RHEL 6 atau 7 HA dengan alat kexec yang lebih lama dari 2.0.14.
- Untuk informasi tentang cara mengubah batas waktu default, lihat Bagaimana cara mengonfigurasi kdump untuk digunakan dengan Add-On RHEL 6, 7, 8 HA?.
- Untuk informasi tentang cara mengurangi penundaan failover saat Anda menggunakan
fence_kdump
, lihat Dapatkah saya mengurangi penundaan failover yang diharapkan saat menambahkan konfigurasi fence_kdump?.
Jalankan langkah-langkah opsional berikut untuk ditambahkan fence_kdump
sebagai konfigurasi pagar tingkat pertama, selain konfigurasi agen pagar Azure.
[A] Verifikasi bahwa
kdump
aktif dan dikonfigurasi.systemctl is-active kdump # Expected result # active
[A] Install
fence_kdump
agen pagar.yum install fence-agents-kdump
[1] Buat
fence_kdump
perangkat anggar di kluster.pcs stonith create rsc_st_kdump fence_kdump pcmk_reboot_action="off" pcmk_host_list="prod-cl1-0 prod-cl1-1" timeout=30
[1] Konfigurasikan tingkat anggar sehingga
fence_kdump
mekanisme anggar dilibatkan terlebih dahulu.pcs stonith create rsc_st_kdump fence_kdump pcmk_reboot_action="off" pcmk_host_list="prod-cl1-0 prod-cl1-1" pcs stonith level add 1 prod-cl1-0 rsc_st_kdump pcs stonith level add 1 prod-cl1-1 rsc_st_kdump pcs stonith level add 2 prod-cl1-0 rsc_st_azure pcs stonith level add 2 prod-cl1-1 rsc_st_azure # Check the fencing level configuration pcs stonith level # Example output # Target: prod-cl1-0 # Level 1 - rsc_st_kdump # Level 2 - rsc_st_azure # Target: prod-cl1-1 # Level 1 - rsc_st_kdump # Level 2 - rsc_st_azure
[A] Izinkan port yang diperlukan untuk
fence_kdump
melalui firewall.firewall-cmd --add-port=7410/udp firewall-cmd --add-port=7410/udp --permanent
[A] Pastikan bahwa
initramfs
file gambar berisifence_kdump
file danhosts
. Untuk informasi selengkapnya, lihat Bagaimana cara mengonfigurasi fence_kdump di kluster Red Hat Pacemaker?.lsinitrd /boot/initramfs-$(uname -r)kdump.img | egrep "fence|hosts" # Example output # -rw-r--r-- 1 root root 208 Jun 7 21:42 etc/hosts # -rwxr-xr-x 1 root root 15560 Jun 17 14:59 usr/libexec/fence_kdump_send
[A] Lakukan
fence_kdump_nodes
konfigurasi untuk/etc/kdump.conf
menghindarifence_kdump
kegagalan dengan batas waktu untuk beberapakexec-tools
versi. Untuk informasi selengkapnya, lihat fence_kdump waktu habis saat fence_kdump_nodes tidak ditentukan dengan alat kexec versi 2.0.15 atau yang lebih baru dan fence_kdump gagal dengan "batas waktu setelah X detik" di kluster KETERSEDIAAN TINGGI RHEL 6 atau 7 dengan versi alat kexec yang lebih lama dari 2.0.14. Contoh konfigurasi untuk kluster dua node disajikan di sini. Setelah Anda membuat perubahan dalam/etc/kdump.conf
, gambar kdump harus diregenerasi. Untuk meregenerasi, mulai ulangkdump
layanan.vi /etc/kdump.conf # On node prod-cl1-0 make sure the following line is added fence_kdump_nodes prod-cl1-1 # On node prod-cl1-1 make sure the following line is added fence_kdump_nodes prod-cl1-0 # Restart the service on each node systemctl restart kdump
Uji konfigurasi dengan membuat crash sebuah simpul. Untuk informasi selengkapnya, lihat Bagaimana cara mengonfigurasi fence_kdump di kluster Red Hat Pacemaker?.
Penting
Jika kluster sudah dalam penggunaan produktif, rencanakan pengujian yang sesuai karena crash node berdampak pada aplikasi.
echo c > /proc/sysrq-trigger
Langkah berikutnya
- Lihat Perencanaan dan implementasi Azure Virtual Machines untuk SAP.
- Lihat Penyebaran Azure Virtual Machines untuk SAP.
- Lihat Penyebaran DBMS Azure Virtual Machines untuk SAP.
- Untuk mempelajari cara menetapkan KETERSEDIAAN TINGGI dan merencanakan pemulihan bencana SAP Hana di Azure VM, lihat Ketersediaan Tinggi SAP Hana di Azure Virtual Machines.