Mengonfigurasi kluster Pacemaker untuk grup ketersediaan SQL Server

Berlaku untuk:SQL Server di Linux

Artikel ini menjelaskan cara membuat kluster tiga node di Linux menggunakan Pacemaker, dan menambahkan grup ketersediaan yang dibuat sebelumnya sebagai sumber daya di kluster. Untuk ketersediaan tinggi, grup ketersediaan di Linux memerlukan tiga simpul - lihat Ketersediaan tinggi dan perlindungan data untuk konfigurasi grup ketersediaan.

Catatan

Artikel ini berisi referensi ke istilah slave, istilah yang tidak lagi digunakan Microsoft. Ketika istilah tersebut dihapus dari perangkat lunak, kami menghapusnya dari artikel ini.

SQL Server tidak terintegrasi erat dengan Pacemaker di Linux seperti halnya dengan pengklusteran failover Windows Server (WSFC). Instans SQL Server tidak mengetahui kluster, dan semua orkestrasi berasal dari luar masuk. Pacemaker menyediakan orkestrasi sumber daya kluster. Selain itu, nama jaringan virtual khusus untuk pengklusteran failover Windows Server; tidak ada yang setara di Pacemaker. Tampilan manajemen dinamis grup ketersediaan (DMV) yang mengkueri informasi kluster mengembalikan baris kosong pada kluster Pacemaker. Untuk membuat pendengar untuk koneksi ulang transparan setelah failover, daftarkan nama pendengar secara manual di DNS dengan IP yang digunakan untuk membuat sumber daya IP virtual.

Anda masih dapat membuat pendengar untuk koneksi ulang transparan setelah failover, tetapi Anda harus mendaftarkan nama pendengar secara manual di server DNS dengan IP yang digunakan untuk membuat sumber daya IP virtual (seperti yang dijelaskan di bagian berikut).

Bagian berikut menelusuri langkah-langkah untuk menyiapkan kluster Pacemaker dan menambahkan grup ketersediaan sebagai sumber daya di kluster untuk ketersediaan tinggi, untuk setiap distribusi Linux yang didukung.

Lapisan pengklusteran didasarkan pada add-on Red Hat Enterprise Linux (RHEL) HA yang dibangun di atas Pacemaker.

Catatan

Akses ke dokumentasi lengkap Red Hat memerlukan langganan yang valid.

Untuk informasi selengkapnya tentang konfigurasi kluster, opsi agen sumber daya, dan manajemen, kunjungi dokumentasi referensi RHEL.

Peta Strategi

Langkah-langkah untuk membuat grup ketersediaan di server Linux untuk ketersediaan tinggi berbeda dari langkah-langkah pada kluster failover Windows Server. Daftar berikut ini menjelaskan langkah-langkah tingkat tinggi:

Konfigurasikan SQL Server pada node kluster.
Buat grup ketersediaan.
Konfigurasikan manajer sumber daya kluster, seperti Pacemaker. Instruksi ini ada di artikel ini.

Cara mengonfigurasi manajer sumber daya kluster tergantung pada distribusi Linux tertentu.

Penting

Lingkungan produksi memerlukan agen pembatas untuk ketersediaan tinggi. Demonstrasi dalam dokumentasi ini tidak menggunakan agen anggar. Demonstrasi hanya untuk pengujian dan validasi. Kluster Linux menggunakan pengamanan untuk mengembalikan kluster ke status yang dikenal. Cara mengonfigurasi fencing tergantung pada distribusi dan lingkungan. Saat ini, anggar tidak tersedia di beberapa lingkungan cloud. Untuk informasi selengkapnya, lihat Kebijakan Dukungan untuk Kluster Ketersediaan Tinggi RHEL - Platform Virtualisasi.
Tambahkan grup ketersediaan sebagai sumber daya di kluster.

Mengonfigurasi ketersediaan tinggi untuk RHEL

Untuk mengonfigurasi ketersediaan tinggi untuk RHEL, aktifkan langganan ketersediaan tinggi lalu konfigurasikan Pacemaker.

Mengaktifkan langganan ketersediaan tinggi untuk RHEL

Setiap simpul dalam kluster harus memiliki langganan yang sesuai untuk RHEL dan Add-on Ketersediaan Tinggi. Tinjau persyaratan di Cara menginstal paket kluster Ketersediaan Tinggi di Red Hat Enterprise Linux. Ikuti langkah-langkah ini untuk mengonfigurasi langganan dan repositori:

Daftarkan sistem.
```
sudo subscription-manager register
```
Berikan nama pengguna dan kata sandi Anda.
Cantumkan kumpulan yang tersedia untuk pendaftaran.
```
sudo subscription-manager list --available
```
Catatan

Untuk RHEL 10, perintah daftar adalah sebagai berikut:
```
sudo subscription-manager repos --list
```
Dari daftar kumpulan yang tersedia, catat ID kumpulan untuk langganan ketersediaan tinggi.
Perbarui skrip berikut. Ganti <pool id> dengan ID kumpulan untuk ketersediaan tinggi dari langkah sebelumnya. Jalankan skrip untuk melampirkan langganan.
```
sudo subscription-manager attach --pool=<pool id>
```

Aktifkan repositori.

RHEL 7

sudo subscription-manager repos --enable=rhel-ha-for-rhel-7-server-rpms

RHEL 8

sudo subscription-manager repos --enable=rhel-8-for-x86_64-highavailability-rpms

RHEL 9

sudo subscription-manager repos --enable=rhel-9-for-x86_64-highavailability-rpms

RHEL 10

sudo subscription-manager repos --enable=rhel-10-for-x86_64-highavailability-rpms

Untuk informasi selengkapnya, lihat Pacemaker - Kluster Ketersediaan Tinggi, Open Source.

Setelah Anda mengonfigurasi langganan, selesaikan langkah-langkah berikut untuk mengonfigurasi Pacemaker:

Mengonfigurasi Pacemaker

Setelah Anda mendaftarkan langganan, selesaikan langkah-langkah berikut untuk mengonfigurasi Pacemaker:

Pada semua node kluster, buka port firewall Pacemaker. Untuk membuka port ini dengan firewalld, jalankan perintah berikut:
```
sudo firewall-cmd --permanent --add-service=high-availability
sudo firewall-cmd --reload
```
Jika firewall tidak memiliki konfigurasi ketersediaan tinggi bawaan, buka port berikut untuk Pacemaker.
- TCP: Port 2224, 3121, 21064
- UDP: Port 5405

Instal paket Pacemaker pada semua simpul.

sudo yum install pacemaker pcs fence-agents-all resource-agents

Atur kata sandi untuk pengguna default yang dibuat saat menginstal paket Pacemaker dan Corosync. Gunakan kata sandi yang sama pada semua simpul.
```
sudo passwd hacluster
```
Untuk memungkinkan simpul bergabung kembali dengan klaster setelah restart, aktifkan dan mulai layanan pcsd dan Pacemaker. Jalankan perintah berikut pada semua simpul.
```
sudo systemctl enable pcsd
sudo systemctl start pcsd
sudo systemctl enable pacemaker
```
Buat Kluster. Untuk membuat kluster, jalankan perintah berikut pada satu simpul:

RHEL 7
```
sudo pcs cluster auth <node1> <node2> <node3> -u hacluster -p <password for hacluster>
sudo pcs cluster setup --name <clusterName> <node1> <node2> <node3>
sudo pcs cluster start --all
sudo pcs cluster enable --all
```
RHEL 8 dan versi yang lebih baru

Untuk RHEL 8 dan versi yang lebih baru, Anda perlu mengautentikasi simpul secara terpisah. Masukkan nama pengguna dan kata sandi hacluster secara manual saat diminta.
```
sudo pcs host auth <node1> <node2> <node3>
sudo pcs cluster setup <clusterName> <node1> <node2> <node3>
sudo pcs cluster start --all
sudo pcs cluster enable --all
```
Catatan

Jika sebelumnya Anda mengonfigurasi kluster pada simpul yang sama, Anda perlu menggunakan --force opsi saat menjalankan pcs cluster setup. Opsi ini setara dengan menjalankan pcs cluster destroy. Untuk mengaktifkan kembali Pacemaker, jalankan sudo systemctl enable pacemaker.
Instal agen sumber daya SQL Server untuk SQL Server. Jalankan perintah berikut pada semua simpul.
```
sudo yum install mssql-server-ha
```

Setelah Pacemaker dikonfigurasi, gunakan pcs untuk berinteraksi dengan kluster. Jalankan semua perintah pada satu simpul dari kluster.

Pertimbangan untuk beberapa antarmuka jaringan (NIC)

Saat menyiapkan ketersediaan tinggi dengan server yang memiliki beberapa NIC, ikuti saran berikut:

Pastikan file hosts dikonfigurasi agar alamat IP server dari beberapa antarmuka jaringan dipetakan ke nama host server Linux pada setiap simpul.
Saat menyiapkan klaster menggunakan Pacemaker, penggunaan nama host server seharusnya mengonfigurasi Corosync untuk mengatur semua NIC. Kami hanya ingin komunikasi Pacemaker/Corosync melalui satu NIC. Setelah kluster Pacemaker dikonfigurasi, ubah konfigurasi dalam corosync.conf file, dan perbarui alamat IP untuk NIC khusus yang ingin Anda gunakan untuk komunikasi Pacemaker/Corosync.
Yang <hostname> yang diberikan dalam file corosync.conf harus sama dengan output yang dihasilkan saat melakukan pencarian terbalik (ping -a <ip_address>), dan itu harus merupakan nama pendek yang dikonfigurasi pada host. Pastikan hosts file juga mewakili alamat IP yang tepat untuk resolusi nama.

Perubahan pada contoh file corosync.conf disorot di bawah ini:

  nodelist {
    node {
        ring0_addr: <ip_address_of_node1_NIC1>
        name: <hostname_of_node1>
        nodeid: 1
    }
    node {
        ring0_addr: <ip_address_of_node2_NIC1>
        name: <hostname_of_node2>
        nodeid: 2
    }
    node {
        ring0_addr: <ip_address_of_node3_NIC1>
        name: <hostname_of_node3>
        nodeid: 3
    }
  }

Mengonfigurasi perangkat pembatas

Vendor kluster Pacemaker memerlukan isolasi node yang gagal menggunakan perangkat fencing yang dikonfigurasi untuk penyiapan kluster yang didukung. Ketika pengelola sumber daya kluster tidak dapat menentukan status simpul atau sumber daya pada simpul, pengamanan otomatis membawa kluster ke keadaan yang diketahui.

Perangkat pagar menyediakan agen anggar. Menyiapkan Pacemaker di Red Hat Enterprise Linux di Azure memberikan contoh cara membuat perangkat pelindung untuk kluster ini di Azure. Ubah instruksi untuk lingkungan Anda.

Pemagaran tingkat sumber daya memastikan bahwa tidak ada kerusakan data dalam pemadaman dengan mengonfigurasi sumber daya. Misalnya, Anda dapat menggunakan pembatasan level sumber daya untuk menandai disk pada node sebagai usang ketika koneksi komunikasi terputus.

Pengamanan tingkat node memastikan bahwa node tidak mengoperasikan sumber daya apa pun. Ini dilakukan dengan mengatur ulang simpul. Pacemaker mendukung berbagai perangkat anggar. Contohnya termasuk catu daya yang tidak dapat diinterupsi atau kartu antarmuka manajemen untuk server.

Untuk informasi tentang mengisolasi node yang gagal, lihat artikel berikut ini:

Catatan

Karena konfigurasi pagar tingkat node sangat bergantung pada lingkungan Anda, nonaktifkan untuk tutorial ini (dapat dikonfigurasi nanti). Skrip berikut menonaktifkan pembatasan level simpul.

sudo pcs property set stonith-enabled=false

Atur properti kluster interval pemeriksaan ulang

cluster-recheck-interval menunjukkan interval polling di mana kluster memeriksa perubahan parameter sumber daya, batasan, atau opsi kluster lainnya. Jika replika mengalami kegagalan, kluster mencoba menghidupkan ulang replika dalam interval yang ditentukan oleh nilai failure-timeout dan nilai cluster-recheck-interval. Misalnya, jika failure-timeout diatur ke 60 detik dan cluster-recheck-interval diatur ke 120 detik, mulai ulang dicoba pada interval yang lebih besar dari 60 detik tetapi kurang dari 120 detik. Kami menyarankan agar Anda menyetel waktu habis kegagalan menjadi 60 detik dan cluster-recheck-interval ke nilai yang lebih besar dari 60 detik. Pengaturan cluster-recheck-interval ke nilai kecil tidak disarankan.

Untuk memperbarui nilai properti, jalankan: 2 minutes

sudo pcs property set cluster-recheck-interval=2min

Jika Anda sudah memiliki kelompok ketersediaan yang dikelola oleh klaster Pacemaker, paket Pacemaker 1.1.18-11.el7 memperkenalkan perubahan perilaku untuk pengaturan klaster saat nilainya adalah start-failure-is-fatal. Perubahan ini memengaruhi alur kerja failover. Jika replika utama mengalami pemadaman, kluster diharapkan akan beralih ke salah satu replika sekunder yang tersedia. Sebagai gantinya, pengguna melihat bahwa kluster terus mencoba memulai replika utama yang gagal. Jika primer tersebut tidak pernah online (karena pemadaman permanen), kluster tidak pernah beralih ke replika sekunder lain yang tersedia. Karena perubahan ini, konfigurasi yang disarankan sebelumnya untuk diatur start-failure-is-fatal tidak lagi valid, dan pengaturan perlu dikembalikan ke nilai defaultnya.true

Selain itu, sumber daya AG perlu diperbarui untuk menyertakan properti failure-timeout.

Untuk memperbarui nilai properti, jalankan: true

sudo pcs property set start-failure-is-fatal=true

Untuk memperbarui properti sumber daya ag_clusterfailure-timeout ke 60s, jalankan:

pcs resource update ag_cluster meta failure-timeout=60s

Untuk informasi tentang properti kluster Pacemaker, lihat Properti Kluster Pacemaker.

Perhatian

Kata sandi Anda harus mengikuti kebijakan kata sandi default SQL Server. Secara default, kata sandi harus panjangnya minimal delapan karakter dan berisi karakter dari tiga dari empat set berikut: huruf besar, huruf kecil, digit dasar-10, dan simbol. Panjang kata sandi bisa hingga 128 karakter. Gunakan kata sandi yang panjang dan kompleks mungkin.

Pada semua instans SQL Server, buat login server untuk Pacemaker.

Transact-SQL berikut ini membuat login. Ganti <password> dengan kata sandi kompleks Anda sendiri.
```
USE [master];
GO

CREATE LOGIN [pacemakerLogin]
    WITH PASSWORD = N'<password>';

ALTER SERVER ROLE [sysadmin] ADD MEMBER [pacemakerLogin];
```
Pada saat pembuatan grup ketersediaan, pengguna Pacemaker memerlukan izin ALTER, CONTROL, dan VIEW DEFINITION pada grup tersebut, setelah grup dibuat tetapi sebelum node ditambahkan ke dalamnya.

Pada semua instans SQL Server, simpan kredensial untuk login SQL Server.

Ganti <password> dengan kata sandi kompleks Anda sendiri.

echo 'pacemakerLogin' >> ~/pacemaker-passwd
echo '<password>' >> ~/pacemaker-passwd
sudo mv ~/pacemaker-passwd /var/opt/mssql/secrets/passwd
sudo chown root:root /var/opt/mssql/secrets/passwd
sudo chmod 400 /var/opt/mssql/secrets/passwd # Only readable by root

Membuat sumber daya grup ketersediaan

Setelah membuat AG di SQL Server, Anda harus membuat sumber daya yang sesuai di Pacemaker saat Anda menentukan jenis kluster Eksternal. AG memerlukan dua sumber daya: sumber daya grup ketersediaan, dan sumber daya alamat IP. Mengonfigurasi sumber daya alamat IP bersifat opsional jika Anda tidak menggunakan pendengar. Namun, disarankan saat Anda memerlukan fitur pendengar.

Agen Pacemaker HA v2 (pratinjau)

Di SQL Server 2025 (17.x) dengan Pembaruan Kumulatif (CU) 3 dan versi yang lebih baru, agen Pacemaker HA v2 baru tersedia di dalam paket mssql-server-ha.

Agen Pacemaker HA versi 2 memperkenalkan peningkatan keandalan dan kinerja dibandingkan agen sebelumnya, termasuk:

Peningkatan performa failover untuk mengurangi waktu failover yang direncanakan dan tidak direncanakan.
Dukungan untuk kebijakan failover otomatis yang fleksibel, termasuk konfigurasi batas waktu pemeriksaan kesehatan dan tingkat kondisi kegagalan.
Dukungan untuk TLS 1.3 untuk komunikasi antara kluster Pacemaker dan SQL Server.

Agen Pacemaker HA v2 saat ini berada dalam tahap eksperimental. Agen Pacemaker HA (v1) yang ada masih didukung sepenuhnya untuk implementasi produksi.

Catatan

Saat Anda membuat sumber daya, dan secara berkala setelahnya, agen sumber daya Pacemaker secara otomatis menetapkan nilai REQUIRED_SYNCHRONIZED_SECONDARIES_TO_COMMIT pada grup ketersediaan berdasarkan konfigurasi grup ketersediaan. Misalnya, jika grup ketersediaan memiliki tiga replika sinkron, agen akan mengatur REQUIRED_SYNCHRONIZED_SECONDARIES_TO_COMMIT ke 1. Untuk informasi lebih lanjut dan opsi konfigurasi tambahan, lihat Ketersediaan Tinggi dan Perlindungan Data untuk Konfigurasi Grup Ketersediaan.

Buat sumber daya AG di Pacemaker menggunakan agen Pacemaker HA yang ada (v1):

RHEL 7

Gunakan perintah berikut create :

sudo pcs resource create ag_cluster ocf:mssql:ag ag_name=ag1 meta failure-timeout=60s master notify=true

RHEL 8 dan versi yang lebih baru

Gunakan perintah berikut create :

sudo pcs resource create ag_cluster ocf:mssql:ag ag_name=ag1 meta failure-timeout=60s promotable notify=true

Untuk menggunakan agen Pacemaker HA v2, buat sumber daya AG menggunakan agv2 agen sumber daya:

sudo pcs resource create <NameForAGResource> ocf:mssql:agv2 ag_name=<AGName> meta failure-timeout=30s promotable notify=true

Penyebaran baru pada SQL Server 2025 (17.x) dapat mengevaluasi agen HA Pacemaker v2. Penyebaran produksi yang ada harus ditingkatkan jika sesuai.

Saat meng-upgrade atau menyebarkan Pacemaker HA agent v2, buat AG resource baru menggunakan agen agv2 daripada agen yang lama ag. Jika Anda sudah mengonfigurasi sumber daya AG yang ada, hapus dan buat sumber daya baru menggunakan agv2:

sudo pcs resource delete <NameForAGResource>

Operasi ini menghentikan sementara sinkronisasi AG saat sumber daya sedang dibuat ulang. Menghapus dan membuat ulang sumber daya Pacemaker AG tidak menghapus AG. Setelah sumber daya dibuat ulang, Pacemaker melanjutkan manajemen dan sinkronisasi AG secara otomatis.

Membuat sumber daya IP virtual

Untuk membuat sumber daya alamat IP virtual, jalankan perintah berikut pada satu simpul. Gunakan alamat IP statis yang tersedia dari jaringan. Ganti alamat IP antara <10.128.16.240> dengan alamat IP yang valid.

sudo pcs resource create virtualip ocf:heartbeat:IPaddr2 ip=<10.128.16.240>

Tidak ada nama server virtual yang setara di Pacemaker. Untuk menggunakan string koneksi yang menunjuk ke nama server string, bukan alamat IP, daftarkan alamat sumber daya IP virtual dan nama server virtual yang diinginkan di DNS. Untuk konfigurasi DR, daftarkan nama server virtual dan alamat IP yang diinginkan dengan server DNS di situs utama dan DR.

Menambahkan batasan kolokasi

Hampir setiap keputusan dalam kluster Pacemaker, seperti memilih tempat sumber daya harus dijalankan, dilakukan dengan membandingkan skor. Skor dihitung per sumber daya. Manajer sumber daya kluster memilih simpul dengan skor tertinggi untuk sumber daya tertentu. Jika simpul memiliki skor negatif untuk sumber daya, sumber daya tidak dapat berjalan pada simpul tersebut.

Pada kluster pacemaker, Anda dapat memanipulasi keputusan kluster dengan batasan. Batasan memiliki nilai. Jika batasan memiliki skor yang lebih rendah dari INFINITY, Pacemaker menganggapnya sebagai rekomendasi. Skor INFINITY bersifat wajib.

Untuk memastikan bahwa replika utama dan sumber daya ip virtual berjalan pada host yang sama, tentukan batasan kolokasi dengan skor INFINITY. Untuk menambahkan batasan kolokasi, jalankan perintah berikut pada satu simpul.

RHEL 7

Saat Anda membuat ag_cluster sumber daya di RHEL 7, sumber daya akan dibuat sebagai ag_cluster-master. Gunakan perintah berikut untuk RHEL 7:

sudo pcs constraint colocation add virtualip ag_cluster-master INFINITY with-rsc-role=Master

RHEL 8

Saat Anda membuat ag_cluster sumber daya di RHEL 8, sumber daya akan dibuat sebagai ag_cluster-clone. Gunakan perintah berikut:

sudo pcs constraint colocation add virtualip with master ag_cluster-clone INFINITY with-rsc-role=Master

RHEL 9 dan versi yang lebih baru

Saat Anda membuat sumber daya ag_cluster di RHEL 9 serta versi-versi yang lebih baru, sumber daya tersebut dibuat sebagai ag_cluster-clone. Gunakan perintah berikut:

sudo pcs constraint colocation add virtualip with promoted ag_cluster-clone INFINITY with-rsc-role=Promoted

Menambahkan batasan pemesanan

Batasan kolokasi memiliki batasan pengurutan implisit. Ini memindahkan sumber daya IP virtual sebelum memindahkan sumber daya grup ketersediaan. Secara default urutan peristiwa adalah:

Pengguna mengeluarkan perintah pcs resource move ke grup ketersediaan utama dari node1 ke node2.
Sumber daya IP virtual berhenti pada simpul 1.
Sumber daya IP virtual dimulai pada simpul 2.

Catatan

Saat ini, alamat IP sementara menunjuk ke simpul 2, sedangkan simpul 2 masih merupakan sekunder sebelum failover.
Grup ketersediaan utama pada node 1 diganti ke sekunder.
Grup ketersediaan sekunder pada simpul 2 dipromosikan menjadi primer.

Untuk mencegah alamat IP menunjuk sementara ke simpul dengan sekunder sebelum failover, tambahkan kendala pengurutan.

Untuk menambahkan batasan pengurutan, jalankan perintah berikut pada satu simpul:

RHEL 7

sudo pcs constraint order promote ag_cluster-master then start virtualip

RHEL 8 dan versi yang lebih baru

sudo pcs constraint order promote ag_cluster-clone then start virtualip

Penting

Setelah mengonfigurasi kluster dan menambahkan grup ketersediaan sebagai sumber daya kluster, Anda tidak dapat menggunakan Transact-SQL untuk melakukan failover pada sumber daya grup ketersediaan. Sumber daya kluster SQL Server di Linux tidak digabungkan seketat dengan sistem operasi seperti yang ada di Windows Server Failover Cluster (WSFC). Layanan SQL Server tidak mengetahui keberadaan kluster. Semua orkestrasi dilakukan melalui alat manajemen kluster. Di RHEL atau Ubuntu gunakan pcs dan di SLES gunakan crm alat.

Failover grup ketersediaan secara manual dengan menggunakan pcs. Jangan memulai failover dengan Transact-SQL. Untuk petunjuknya, lihat Failover.

Pemindahan otomatis grup ketersediaan Always On di Linux

Lapisan pengklusteran didasarkan pada SUSE High Availability Extension (HAE) yang dibangun di atas Pacemaker.

Untuk informasi selengkapnya tentang konfigurasi kluster, opsi agen sumber daya, manajemen, praktik terbaik, dan rekomendasi, lihat Ekstensi Ketersediaan Tinggi SUSE Linux Enterprise.

Catatan

Mulai SQL Server 2025 (17.x), SUSE Linux Enterprise Server (SLES) tidak didukung.

Peta Strategi

Prosedur untuk membuat grup ketersediaan untuk ketersediaan tinggi berbeda antara server Linux dan kluster failover Windows Server. Daftar berikut ini menjelaskan langkah-langkah tingkat tinggi:

Konfigurasikan SQL Server pada node kluster.
Buat grup ketersediaan.
Konfigurasikan manajer sumber daya kluster, seperti Pacemaker. Instruksi ini ada di artikel ini.

Cara mengonfigurasi manajer sumber daya kluster tergantung pada distribusi Linux tertentu.

Penting

Lingkungan produksi memerlukan agen pembatas untuk ketersediaan tinggi. Contoh dalam artikel ini tidak menggunakan agen pengaman. Mereka hanya untuk pengujian dan validasi.

Kluster Linux menggunakan pengamanan untuk mengembalikan kluster ke status yang dikenal. Cara mengonfigurasi fencing tergantung pada distribusi dan lingkungan. Saat ini, anggar tidak tersedia di beberapa lingkungan cloud. Untuk informasi selengkapnya, lihat SUSE Linux Enterprise High Availability Extension.
Menambahkan grup ketersediaan sebagai sumber daya di kluster

Prasyarat

Untuk menyelesaikan skenario end-to-end berikut, Anda memerlukan tiga komputer untuk menyebarkan kluster tiga node. Langkah-langkah berikut menguraikan cara mengonfigurasi server ini.

Menyiapkan dan mengonfigurasi sistem operasi pada setiap node kluster

Langkah pertama adalah mengonfigurasi sistem operasi pada node kluster. Untuk panduan ini, gunakan SLES 12 SP3 dengan langganan yang valid untuk add-on HA.

Menginstal dan mengonfigurasi layanan SQL Server pada setiap node kluster

Instal dan siapkan layanan SQL Server di semua simpul. Untuk petunjuk terperinci, lihat Panduan penginstalan untuk SQL Server di Linux.
Menunjuk satu simpul sebagai node utama dan lainnya sebagai sekunder. Gunakan istilah-istilah ini di seluruh panduan ini.
Pastikan simpul yang akan menjadi bagian dari kluster dapat berkomunikasi satu sama lain.

Contoh berikut menunjukkan /etc/hosts dengan penambahan untuk tiga simpul bernama SLES1, SLES2, dan SLES3.
```
127.0.0.1   localhost
10.128.16.33 SLES1
10.128.16.77 SLES2
10.128.16.22 SLES3
```
Semua node kluster harus dapat mengakses satu sama lain melalui SSH. Alat seperti hb_report atau crm_report (untuk pemecahan masalah) dan Hawk's History Explorer memerlukan akses SSH tanpa kata sandi antara simpul, jika tidak, mereka hanya dapat mengumpulkan data dari simpul saat ini. Jika Anda menggunakan port SSH non-standar, gunakan opsi -X (lihat man halaman). Misalnya, jika port SSH Anda adalah 3479, panggil crm_report dengan:
```
sudo crm_report -X "-p 3479" [...]
```
Untuk informasi selengkapnya, lihat bagian Panduan Administrasi SLES - Lain-lain.

Perhatian

Pada semua instans SQL Server, buat login server untuk Pacemaker.

Transact-SQL berikut ini membuat login. Ganti <password> dengan kata sandi kompleks Anda sendiri.
```
USE [master];
GO

CREATE LOGIN [pacemakerLogin]
    WITH PASSWORD = N'<password>';

ALTER SERVER ROLE [sysadmin] ADD MEMBER [pacemakerLogin];
```
Pada saat pembuatan grup ketersediaan, pengguna Pacemaker memerlukan izin ALTER, CONTROL, dan VIEW DEFINITION pada grup tersebut, setelah grup dibuat tetapi sebelum node ditambahkan ke dalamnya.

Pada semua instans SQL Server, simpan kredensial untuk login SQL Server.

Ganti <password> dengan kata sandi kompleks Anda sendiri.

echo 'pacemakerLogin' >> ~/pacemaker-passwd
echo '<password>' >> ~/pacemaker-passwd
sudo mv ~/pacemaker-passwd /var/opt/mssql/secrets/passwd
sudo chown root:root /var/opt/mssql/secrets/passwd
sudo chmod 400 /var/opt/mssql/secrets/passwd # Only readable by root

Mengonfigurasi grup ketersediaan

Di server Linux, konfigurasikan grup ketersediaan lalu konfigurasikan sumber daya kluster. Untuk mengonfigurasi grup ketersediaan, lihat Mengonfigurasi grup ketersediaan SQL Server untuk ketersediaan tinggi di Linux

Menginstal dan mengonfigurasi Pacemaker pada setiap node kluster

Menginstal ekstensi Ketersediaan Tinggi

Sebagai referensi, lihat Menginstal SUSE Linux Enterprise Server dan Ekstensi Ketersediaan Tinggi.
Instal paket agen sumber daya SQL Server pada kedua simpul.
```
sudo zypper install mssql-server-ha
```

Menyiapkan simpul pertama

Lihat instruksi penginstalan SLES.

Masuk sebagai root ke komputer fisik atau virtual yang ingin Anda gunakan sebagai node kluster.
Mulai skrip bootstrap dengan mengeksekusi:
```
sudo ha-cluster-init
```
Jika NTP belum dikonfigurasi untuk memulai pada waktu boot, pesan akan muncul.

Jika Anda tetap memutuskan untuk melanjutkan, skrip secara otomatis menghasilkan kunci untuk akses SSH dan alat sinkronisasi Csync2, dan memulai layanan yang diperlukan untuk keduanya.
Untuk mengonfigurasi lapisan komunikasi kluster (Corosync):
1. Masukkan alamat jaringan yang akan diikat. Secara default, skrip mengusulkan alamat jaringan eth0. Atau, masukkan alamat jaringan yang berbeda, misalnya alamat bond0.
2. Masukkan alamat multicast. Skrip mengusulkan alamat acak yang dapat Anda gunakan sebagai default.
3. Masukkan port multicast. Skrip mengusulkan 5405 sebagai default.
4. Untuk mengonfigurasi SBD (), masukkan jalur persisten ke partisi perangkat blok yang ingin Anda gunakan untuk SBD. Jalur harus konsisten di semua simpul dalam kluster.
Akhirnya, skrip akan memulai layanan Pacemaker untuk membawa kluster satu node online dan mengaktifkan antarmuka manajemen Web Hawk2. URL yang digunakan untuk Hawk2 ditampilkan di layar.
Untuk detail proses penyiapan, periksa /var/log/sleha-bootstrap.log. Anda sekarang memiliki kluster satu node yang sedang berjalan. Periksa status kluster dengan status crm:
```
sudo crm status
```
Anda juga dapat melihat konfigurasi kluster dengan crm configure show xml atau crm configure show.
Prosedur bootstrap membuat pengguna Linux bernama hacluster dengan kata sandi linux. Ganti kata sandi default dengan kata sandi yang aman sesegera mungkin:
```
sudo passwd hacluster
```

Menambahkan simpul ke kluster yang ada

Jika Anda memiliki kluster yang berjalan dengan satu atau beberapa simpul, tambahkan lebih banyak simpul kluster menggunakan skrip bootstrap ha-cluster-join. Skrip hanya memerlukan akses ke node kluster yang ada dan akan menyelesaikan penyiapan dasar pada komputer saat ini secara otomatis. Gunakan langkah-langkah berikut:

Jika Anda telah mengonfigurasi node kluster yang ada dengan YaST modul kluster, pastikan prasyarat berikut terpenuhi sebelum Anda menjalankan ha-cluster-join:

Pengguna root pada simpul yang ada memiliki kunci SSH untuk masuk tanpa kata sandi.
Csync2 sudah dikonfigurasi pada node yang ada. Untuk informasi selengkapnya, lihat Mengonfigurasi Csync2 dengan YaST.

Masuk sebagai root ke komputer fisik atau virtual yang seharusnya bergabung dengan kluster.
Mulai skrip bootstrap dengan mengeksekusi:
```
sudo ha-cluster-join
```
Jika NTP belum dikonfigurasi untuk memulai pada waktu boot, pesan akan muncul.
Jika Anda tetap memutuskan untuk melanjutkan, Anda akan dimintai alamat IP node yang ada. Masukkan alamat IP.
Jika Anda belum mengonfigurasi akses SSH tanpa kata sandi antara kedua komputer, Anda juga dimintai kata sandi akar dari simpul yang ada.

Setelah masuk ke simpul yang ditentukan, skrip menyalin konfigurasi Corosync, mengonfigurasi SSH dan Csync2, dan membawa komputer saat ini online sebagai node kluster baru. Selain itu, ini memulai layanan yang diperlukan untuk Hawk. Jika Anda telah mengonfigurasi penyimpanan bersama dengan OCFS2, maka itu juga secara otomatis membuat direktori titik kait untuk sistem file OCFS2.
Ulangi langkah-langkah sebelumnya untuk semua komputer yang ingin Anda tambahkan ke kluster.
Untuk detail prosesnya, periksa /var/log/ha-cluster-bootstrap.log.
Periksa status kluster dengan sudo crm status. Jika Anda berhasil menambahkan simpul kedua, outputnya mirip dengan yang berikut ini:
```
sudo crm status
```
Output terlihat mirip dengan contoh berikut:
```
3 nodes configured
1 resource configured
Online: [ SLES1 SLES2 SLES3]
Full list of resources:
admin_addr     (ocf::heartbeat:IPaddr2):       Started node1
```
Catatan

admin_addr adalah sumber daya kluster IP virtual yang dikonfigurasi selama penyiapan kluster satu node awal.

Setelah menambahkan semua simpul, periksa apakah Anda perlu menyesuaikan kebijakan tanpa kuorum dalam opsi kluster global. Ini sangat penting untuk kluster dua node.

Atur properti kluster interval pemeriksaan ulang

Untuk memperbarui nilai properti, jalankan: 2 minutes

crm configure property cluster-recheck-interval=2min

Selain itu, sumber daya AG perlu diperbarui untuk menyertakan properti failure-timeout.

Untuk memperbarui nilai properti, jalankan: true

crm configure property start-failure-is-fatal=true

Perbarui properti sumber daya AG yang sudah ada agar menjalankan failure-timeout (ganti 60s dengan nama sumber daya grup ketersediaan Anda):

crm configure edit ag1

Di editor teks, tambahkan meta failure-timeout=60s setelah setiap param dan sebelum setiap op.

Untuk informasi selengkapnya tentang properti kluster Pacemaker, lihat Mengonfigurasi Sumber Daya Kluster.

Pertimbangan untuk beberapa antarmuka jaringan (NIC)

Saat menyiapkan ketersediaan tinggi dengan server yang memiliki beberapa NIC, ikuti saran berikut:

Pastikan file hosts dikonfigurasi agar alamat IP server dari beberapa antarmuka jaringan dipetakan ke nama host server Linux pada setiap simpul.
Saat menyiapkan klaster menggunakan Pacemaker, penggunaan nama host server seharusnya mengonfigurasi Corosync untuk mengatur semua NIC. Kami hanya ingin komunikasi Pacemaker/Corosync melalui satu NIC. Setelah kluster Pacemaker dikonfigurasi, ubah konfigurasi dalam corosync.conf file, dan perbarui alamat IP untuk NIC khusus yang ingin Anda gunakan untuk komunikasi Pacemaker/Corosync.
Yang <hostname> yang diberikan dalam file corosync.conf harus sama dengan output yang dihasilkan saat melakukan pencarian terbalik (ping -a <ip_address>), dan itu harus merupakan nama pendek yang dikonfigurasi pada host. Pastikan hosts file juga mewakili alamat IP yang tepat untuk resolusi nama.

Perubahan pada contoh file corosync.conf disorot di bawah ini:

  nodelist {
    node {
        ring0_addr: <ip_address_of_node1_NIC1>
        name: <hostname_of_node1>
        nodeid: 1
    }
    node {
        ring0_addr: <ip_address_of_node2_NIC1>
        name: <hostname_of_node2>
        nodeid: 2
    }
    node {
        ring0_addr: <ip_address_of_node3_NIC1>
        name: <hostname_of_node3>
        nodeid: 3
    }
  }

Mengonfigurasi perangkat pembatas

Pemagaran tingkat sumber daya memastikan terutama bahwa tidak ada kerusakan data selama pemadaman dengan mengonfigurasi sumber daya. Anda dapat menggunakan pembatasan tingkat sumber daya, misalnya, dengan DRBD (Perangkat Blok Terdistribusi Yang Direplikasi) untuk menandai disk pada simpul sebagai kedaluarsa saat tautan komunikasi terputus.

Pengamanan tingkat node memastikan bahwa node tidak mengoperasikan sumber daya apa pun. Ini dilakukan dengan mengatur ulang simpul, dan implementasi Pacemaker disebut STONITH. Pacemaker mendukung berbagai perangkat pengaman, seperti catu daya tak terputus atau kartu antarmuka manajemen untuk server.

Untuk informasi selengkapnya, lihat:

Pada waktu inisialisasi kluster, anggar dinonaktifkan jika tidak ada konfigurasi yang terdeteksi. Ini dapat diaktifkan nanti dengan menjalankan perintah berikut:

sudo crm configure property stonith-enabled=true

Penting

Menonaktifkan pagar hanya untuk tujuan pengujian. Jika Anda berencana menggunakan Pacemaker di lingkungan produksi, Anda harus merencanakan implementasi pagar tergantung pada lingkungan Anda dan mengaktifkannya. SUSE tidak menyediakan agen anggar untuk lingkungan cloud apa pun (termasuk Azure) atau Hyper-V. Akibatnya, vendor kluster tidak menawarkan dukungan untuk menjalankan kluster produksi di lingkungan ini. Kami sedang mengerjakan solusi untuk kesenjangan ini yang akan tersedia dalam rilis mendatang.

Mengonfigurasi sumber daya kluster untuk SQL Server

Referensi pada Panduan Administrasi SLES.

Aktifkan Pacemaker

Aktifkan Pacemaker sehingga secara otomatis dimulai.

Jalankan perintah berikut pada setiap simpul dalam kluster.

systemctl enable pacemaker

Membuat sumber daya grup ketersediaan

Perintah berikut membuat dan mengonfigurasi sumber daya grup ketersediaan untuk tiga replika grup ketersediaan [ag1]. Operasi monitor dan batas waktu perlu ditentukan secara jelas di SLES berdasarkan fakta bahwa batas waktu sangat bergantung pada beban kerja dan perlu disesuaikan dengan hati-hati untuk setiap implementasi. Jalankan perintah pada salah satu node di kluster:

Jalankan crm configure untuk membuka perintah crm:
```
sudo crm configure
```

Di perintah crm, jalankan perintah berikut untuk mengonfigurasi properti sumber daya.

primitive ag_cluster \
   ocf:mssql:ag \
   params ag_name="ag1" \
   meta failure-timeout=60s \
   op start timeout=60s \
   op stop timeout=60s \
   op promote timeout=60s \
   op demote timeout=10s \
   op monitor timeout=60s interval=10s \
   op monitor timeout=60s interval=11s role="Master" \
   op monitor timeout=60s interval=12s role="Slave" \
   op notify timeout=60s
ms ms-ag_cluster ag_cluster \
   meta master-max="1" master-node-max="1" clone-max="3" \
  clone-node-max="1" notify="true" \
commit

Catatan

Membuat sumber daya IP virtual

Jika Anda tidak membuat sumber daya IP virtual saat menjalankan ha-cluster-init, Anda dapat membuat sumber daya ini sekarang. Perintah berikut membuat sumber daya IP virtual. Ganti <0.0.0.0> dengan alamat yang tersedia dari jaringan Anda dan <24> dengan jumlah bit di subnet mask CIDR. Jalankan pada satu simpul.

crm configure \
primitive admin_addr \
   ocf:heartbeat:IPaddr2 \
   params ip=<0.0.0.0> \
      cidr_netmask=<24>

Menambahkan batasan kolokasi

Hampir setiap keputusan dalam kluster Pacemaker, seperti memilih tempat sumber daya harus dijalankan, dilakukan dengan membandingkan skor. Skor dihitung per sumber daya, dan manajer sumber daya kluster memilih simpul dengan skor tertinggi untuk sumber daya tertentu. (Jika simpul memiliki skor negatif untuk sumber daya, sumber daya tidak dapat berjalan pada simpul tersebut.) Kita dapat memanipulasi keputusan kluster dengan batasan. Batasan memiliki nilai. Jika batasan memiliki skor yang lebih rendah dari INFINITY, itu hanya rekomendasi. Skor INFINITY berarti itu suatu keharusan. Kami ingin memastikan bahwa primer grup ketersediaan dan sumber daya ip virtual dijalankan pada host yang sama, jadi kami menentukan batasan kolokasi dengan skor INFINITY.

Untuk mengatur batasan kolokasi agar IP virtual berjalan pada simpul yang sama dengan simpul utama, jalankan perintah berikut pada satu simpul:

crm configure
colocation vip_on_master inf: \
    admin_addr ms-ag_cluster:Master
commit

Menambahkan batasan pemesanan

Batasan kolokasi memiliki batasan pengurutan implisit. Ini memindahkan sumber daya IP virtual sebelum memindahkan sumber daya grup ketersediaan. Secara default urutan peristiwa adalah:

Pengguna mengeluarkan perintah resource migrate ke grup ketersediaan utama dari node1 ke node2.
Sumber daya IP virtual berhenti pada simpul 1.
Sumber daya IP virtual dimulai pada simpul 2. Saat ini, alamat IP sementara menunjuk ke simpul 2, sedangkan simpul 2 masih merupakan sekunder sebelum failover.
Pengendali utama grup ketersediaan pada simpul 1 diturunkan.
Grup ketersediaan pada simpul 2 dinaikkan menjadi master.

Untuk mencegah alamat IP sementara menunjuk ke node dengan konfigurasi sekunder sebelum failover, tambahkan batasan urutan dengan perintah berikut pada satu node:

sudo crm configure \
   order ag_first inf: ms-ag_cluster:promote admin_addr:start

Penting

Failover grup ketersediaan secara manual dengan menggunakan crm. Jangan memulai failover dengan Transact-SQL. Untuk informasi selengkapnya, lihat Failover.

Untuk informasi selengkapnya, lihat:

Pemindahan otomatis grup ketersediaan Always On di Linux

Peta Strategi

Panduan instalasi untuk SQL Server di Linux.
Konfigurasikan grup ketersediaan SQL Server untuk ketersediaan tinggi di Linux.
Konfigurasikan manajer sumber daya kluster, seperti Pacemaker. Instruksi ini ada di artikel ini.

Cara mengonfigurasi manajer sumber daya kluster tergantung pada distribusi Linux tertentu.

Penting

Lingkungan produksi memerlukan agen pembatas untuk ketersediaan tinggi. Contoh dalam artikel ini tidak menggunakan agen pengaman. Mereka hanya untuk pengujian dan validasi.

Kluster Linux menggunakan pengamanan untuk mengembalikan kluster ke status yang dikenal. Cara mengonfigurasi fencing tergantung pada distribusi dan lingkungan. Saat ini, anggar tidak tersedia di beberapa lingkungan cloud.

Fencing biasanya diterapkan pada sistem operasi dan bergantung pada lingkungan. Temukan instruksi untuk pagar dalam dokumentasi distributor sistem operasi.
Tambahkan grup ketersediaan sebagai sumber daya di kluster.

Menginstal dan mengonfigurasi Pacemaker pada setiap node kluster

Pada semua simpul, buka port firewall. Buka port untuk layanan ketersediaan tinggi Pacemaker, instance SQL Server, dan titik akhir grup ketersediaan. Port TCP default untuk server yang menjalankan SQL Server adalah 1433.
```
sudo ufw allow 2224/tcp
sudo ufw allow 3121/tcp
sudo ufw allow 21064/tcp
sudo ufw allow 5405/udp

sudo ufw allow 1433/tcp # Replace with TDS endpoint
sudo ufw allow 5022/tcp # Replace with DATA_MIRRORING endpoint

sudo ufw reload
```
Atau, Anda dapat menonaktifkan firewall, tetapi ini tidak disarankan di lingkungan produksi:
```
sudo ufw disable
```
Instal paket Pacemaker. Pada semua simpul, jalankan perintah berikut untuk Ubuntu 20.04. Untuk informasi selengkapnya tentang menginstal pada versi sebelumnya, lihat Ubuntu HA - MS SQL Server di Azure.
```
sudo apt-get install -y pacemaker pacemaker-cli-utils crmsh resource-agents fence-agents corosync python3-azure
```
Atur kata sandi untuk pengguna default yang dibuat saat menginstal paket Pacemaker dan Corosync. Gunakan kata sandi yang sama pada semua simpul.
```
sudo passwd hacluster
```

Membuat kluster

Sebelum membuat kluster, Anda harus membuat kunci autentikasi di server utama, dan menyalinnya ke server lain yang berpartisipasi dalam AG.

Gunakan skrip berikut untuk membuat kunci autentikasi di server utama:
```
sudo corosync-keygen
```
Anda dapat menggunakan scp untuk menyalin kunci yang dihasilkan ke server lain:
```
sudo scp /etc/corosync/authkey dbadmin@server-02:/etc/corosync
sudo scp /etc/corosync/authkey dbadmin@server-03:/etc/corosync
```

Untuk membuat kluster, edit /etc/corosync/corosync.conf file di server utama:

sudo vim /etc/corosync/corosync.conf

File corosync.conf terlihat mirip dengan contoh berikut:

totem {
    version: 2
    cluster_name: agclustername
    transport: udpu
    crypto_cipher: none
    crypto_hash: none
}
logging {
    fileline: off
    to_stderr: yes
    to_logfile: yes
    logfile: /var/log/corosync/corosync.log
    to_syslog: yes
    debug: off
    logger_subsys {
        subsys: QUORUM
        debug: off
    }
}
quorum {
    provider: corosync_votequorum
}
nodelist {
    node {
        name: server-01
        nodeid: 1
        ring0_addr: 10.0.0.4
    }
    node {
        name: server-02
        nodeid: 2
        ring0_addr: 10.0.0.5
    }
        node {
        name: server-03
        nodeid: 3
        ring0_addr: 10.0.0.6
    }
}

corosync.conf Ganti file pada simpul lain:

sudo scp /etc/corosync/corosync.conf dbadmin@server-02:/etc/corosync
sudo scp /etc/corosync/corosync.conf dbadmin@server-03:/etc/corosync

Mulai ulang layanan pacemaker dan corosync.

sudo systemctl restart pacemaker corosync

Konfirmasi status kluster dan verifikasi konfigurasi:

sudo pcs status

Pertimbangan untuk beberapa antarmuka jaringan (NIC)

Saat menyiapkan ketersediaan tinggi dengan server yang memiliki beberapa NIC, ikuti saran berikut:

Pastikan file hosts dikonfigurasi agar alamat IP server dari beberapa antarmuka jaringan dipetakan ke nama host server Linux pada setiap simpul.
Saat menyiapkan klaster menggunakan Pacemaker, penggunaan nama host server seharusnya mengonfigurasi Corosync untuk mengatur semua NIC. Kami hanya ingin komunikasi Pacemaker/Corosync melalui satu NIC. Setelah kluster Pacemaker dikonfigurasi, ubah konfigurasi dalam corosync.conf file, dan perbarui alamat IP untuk NIC khusus yang ingin Anda gunakan untuk komunikasi Pacemaker/Corosync.
Yang <hostname> yang diberikan dalam file corosync.conf harus sama dengan output yang dihasilkan saat melakukan pencarian terbalik (ping -a <ip_address>), dan itu harus merupakan nama pendek yang dikonfigurasi pada host. Pastikan hosts file juga mewakili alamat IP yang tepat untuk resolusi nama.

Perubahan pada contoh file corosync.conf disorot di bawah ini:

  nodelist {
    node {
        ring0_addr: <ip_address_of_node1_NIC1>
        name: <hostname_of_node1>
        nodeid: 1
    }
    node {
        ring0_addr: <ip_address_of_node2_NIC1>
        name: <hostname_of_node2>
        nodeid: 2
    }
    node {
        ring0_addr: <ip_address_of_node3_NIC1>
        name: <hostname_of_node3>
        nodeid: 3
    }
  }

Mengonfigurasi perangkat pembatas

Pemagaran tingkat sumber daya memastikan bahwa tidak ada kerusakan data yang terjadi jika ada pemadaman. Anda dapat menggunakan pembatasan tingkat sumber daya, misalnya, dengan DRBD (Perangkat Blok Terdistribusi Yang Direplikasi) untuk menandai disk pada simpul sebagai kedaluarsa saat tautan komunikasi terputus.

Pengamanan tingkat node memastikan bahwa node tidak mengoperasikan sumber daya apa pun. Ini dilakukan dengan mengatur ulang simpul, dan implementasi Pacemaker disebut STONITH. Pacemaker mendukung berbagai macam perangkat pembatas, misalnya, catu daya tak terputus atau kartu antarmuka manajemen untuk server.

Untuk informasi selengkapnya, lihat Kluster Pacemaker dari Scratch dan Fencing dan Stonith.

Karena konfigurasi fencing tingkat node sangat bergantung pada lingkungan Anda, kami menonaktifkannya untuk tutorial ini (dapat dikonfigurasi nanti). Jalankan skrip berikut pada simpul utama:

sudo pcs property set stonith-enabled=false

Dalam contoh ini, menonaktifkan fencing hanya untuk tujuan pengujian. Jika Anda berencana menggunakan Pacemaker di lingkungan produksi, Anda harus merencanakan implementasi pagar tergantung pada lingkungan Anda dan mengaktifkannya. Hubungi vendor distribusi sistem operasi untuk informasi tentang agen pembatas untuk distribusi tertentu.

Atur properti kluster interval pemeriksaan ulang

Properti cluster-recheck-interval menunjukkan interval polling di mana kluster memeriksa perubahan parameter sumber daya, batasan, atau opsi kluster lainnya. Jika replika mengalami kegagalan, kluster mencoba menghidupkan ulang replika dalam interval yang ditentukan oleh nilai failure-timeout dan nilai cluster-recheck-interval. Misalnya, jika failure-timeout diatur ke 60 detik dan cluster-recheck-interval diatur ke 120 detik, mulai ulang dicoba pada interval yang lebih besar dari 60 detik tetapi kurang dari 120 detik. Anda harus mengatur failure-timeout ke 60 detik, dan cluster-recheck-interval ke nilai yang lebih besar dari 60 detik. Pengaturan cluster-recheck-interval ke nilai yang lebih kecil tidak disarankan.

Untuk memperbarui nilai properti, jalankan: 2 minutes

sudo pcs property set cluster-recheck-interval=2min

Selain itu, sumber daya AG perlu diperbarui untuk menyertakan properti failure-timeout.

Untuk memperbarui nilai properti, jalankan: true

sudo pcs property set start-failure-is-fatal=true

Perbarui properti sumber daya AG yang sudah ada agar menjalankan failure-timeout (ganti 60s dengan nama sumber daya grup ketersediaan Anda):

sudo pcs resource meta ag_cluster failure-timeout=60s

Menginstal agen sumber daya SQL Server untuk integrasi dengan Pacemaker

Jalankan perintah berikut pada semua simpul.

sudo apt-get install mssql-server-ha

Perhatian

Pada semua instans SQL Server, buat login server untuk Pacemaker.

Transact-SQL berikut ini membuat login. Ganti <password> dengan kata sandi kompleks Anda sendiri.
```
USE [master];
GO

CREATE LOGIN [pacemakerLogin]
    WITH PASSWORD = N'<password>';

ALTER SERVER ROLE [sysadmin] ADD MEMBER [pacemakerLogin];
```
Pada saat pembuatan grup ketersediaan, pengguna Pacemaker memerlukan izin ALTER, CONTROL, dan VIEW DEFINITION pada grup tersebut, setelah grup dibuat tetapi sebelum node ditambahkan ke dalamnya.

Pada semua instans SQL Server, simpan kredensial untuk login SQL Server.

Ganti <password> dengan kata sandi kompleks Anda sendiri.

echo 'pacemakerLogin' >> ~/pacemaker-passwd
echo '<password>' >> ~/pacemaker-passwd
sudo mv ~/pacemaker-passwd /var/opt/mssql/secrets/passwd
sudo chown root:root /var/opt/mssql/secrets/passwd
sudo chmod 400 /var/opt/mssql/secrets/passwd # Only readable by root

Membuat sumber daya grup ketersediaan

Sumber daya AG yang Anda buat adalah jenis sumber daya yang disebut kloning. Sumber daya AG memiliki salinan pada setiap simpul, dan satu sumber daya pengontrol yang disebut master. Master dikaitkan dengan server yang menghosting replika utama. Sumber daya lain menghosting replika sekunder (reguler atau hanya untuk konfigurasi) dan dapat dipromosikan menjadi master dalam failover.

Agen Pacemaker HA v2 (pratinjau)

Di SQL Server 2025 (17.x) dengan Pembaruan Kumulatif (CU) 3 dan versi yang lebih baru, agen Pacemaker HA baru v2 (mssql-server-ha) tersedia.

Agen Pacemaker HA versi 2 memperkenalkan peningkatan keandalan dan kinerja dibandingkan agen sebelumnya, termasuk:

Peningkatan performa failover untuk mengurangi waktu failover yang direncanakan dan tidak direncanakan.
Dukungan untuk kebijakan failover otomatis yang fleksibel, termasuk konfigurasi batas waktu pemeriksaan kesehatan dan tingkat kondisi kegagalan.
Dukungan untuk TLS 1.3 untuk komunikasi antara kluster Pacemaker dan SQL Server.

Agen Pacemaker HA v2 saat ini berada dalam tahap eksperimental. Agen Pacemaker HA (v1) yang ada masih didukung sepenuhnya untuk implementasi produksi.

Buat sumber daya AG di Pacemaker menggunakan agen Pacemaker HA yang ada (v1):
```
sudo pcs resource create <NameForAGResource> ocf:mssql:ag ag_name=<AGName> meta failure-timeout=30s promotable notify=true
```
Dalam contoh ini, NameForAGResource adalah nama unik yang Anda berikan ke sumber daya kluster ini untuk AG, dan AGName merupakan nama AG yang Anda buat.

Untuk menggunakan agen Pacemaker HA v2, buat sumber daya AG menggunakan agv2 agen sumber daya:
```
sudo pcs resource create <NameForAGResource> ocf:mssql:agv2 ag_name=<AGName> meta failure-timeout=30s promotable notify=true
```
Penyebaran baru pada SQL Server 2025 (17.x) dapat mengevaluasi agen HA Pacemaker v2. Penyebaran produksi yang ada harus ditingkatkan jika sesuai.

Saat meng-upgrade atau menyebarkan Pacemaker HA agent v2, buat AG resource baru menggunakan agen agv2 daripada agen yang lama ag. Jika Anda sudah mengonfigurasi sumber daya AG yang ada, hapus dan buat sumber daya baru menggunakan agv2:
```
sudo pcs resource delete <NameForAGResource>
```
Operasi ini menghentikan sementara sinkronisasi AG saat sumber daya sedang dibuat ulang. Menghapus dan membuat ulang sumber daya Pacemaker AG tidak menghapus AG. Setelah sumber daya dibuat ulang, Pacemaker melanjutkan manajemen dan sinkronisasi AG secara otomatis.

Catatan

Membuat sumber daya IP virtual

Untuk membuat sumber daya alamat IP virtual, jalankan perintah berikut pada satu simpul. Gunakan alamat IP statis yang tersedia dari jaringan. Sebelum Anda menjalankan skrip, ganti nilai antara < ... > dengan alamat IP yang valid.

sudo pcs resource create virtualip ocf:heartbeat:IPaddr2 ip=10.128.16.240

Tidak ada nama server virtual yang setara di Pacemaker. Untuk menggunakan string koneksi yang menunjuk ke nama server string dan tidak menggunakan alamat IP, daftarkan alamat sumber daya IP dan nama server virtual yang diinginkan di DNS. Untuk konfigurasi DR, daftarkan nama server virtual dan alamat IP yang diinginkan dengan server DNS di situs utama dan DR.

Menambahkan batasan kolokasi

Gunakan batasan untuk mengonfigurasi keputusan kluster. Batasan memiliki nilai. Jika batasan memiliki skor yang lebih rendah dari INFINITY, itu hanya rekomendasi. Skor INFINITY berarti itu wajib.

Untuk memastikan bahwa replika utama dan sumber daya ip virtual berada di host yang sama, tentukan batasan kolokasi dengan skor INFINITY. Untuk menambahkan batasan kolokasi, jalankan perintah berikut pada satu simpul.

Ubuntu 20.04

sudo pcs constraint colocation add virtualip with master AGResource INFINITY

Ubuntu 22.04 dan versi yang lebih baru

sudo pcs constraint colocation add virtualip with promoted <NameForAGResource> INFINITY

Menambahkan batasan pemesanan

Batasan kolokasi memiliki batasan pengurutan implisit. Ini memindahkan sumber daya IP virtual sebelum memindahkan sumber daya grup ketersediaan. Secara default urutan peristiwa adalah:

Pengguna mengeluarkan pcs resource move ke grup ketersediaan utama dari node1 ke node2.
Sumber daya IP virtual berhenti pada node1.
Sumber daya IP virtual dimulai pada node2.

Pada titik ini, alamat IP sementara diarahkan ke node2 sementara node2 masih merupakan sekunder sebelum failover.
Grup ketersediaan primer pada node1 diturunkan menjadi sekunder.
Grup ketersediaan sekunder di node2 dipromosikan menjadi primer.

Untuk mencegah alamat IP menunjuk sementara ke simpul dengan sekunder sebelum failover, tambahkan kendala pengurutan.

Untuk menambahkan batasan pengurutan, jalankan perintah berikut pada satu simpul:

Ubuntu 20.04

sudo crm configure order ag-before-listener Mandatory: ms-ag1:promote virtualip-group:start

Ubuntu 22.04 dan versi yang lebih baru

sudo pcs constraint order promote <NameForAGResource> then start virtualip kind=Mandatory

Pemindahan otomatis grup ketersediaan Always On di Linux

Saran dan Komentar

Apakah halaman ini membantu?

Last updated on 2026-03-24

Mengonfigurasi kluster Pacemaker untuk grup ketersediaan SQL Server

Peta Strategi

Mengonfigurasi ketersediaan tinggi untuk RHEL

Mengaktifkan langganan ketersediaan tinggi untuk RHEL

Mengonfigurasi Pacemaker

Pertimbangan untuk beberapa antarmuka jaringan (NIC)

Mengonfigurasi perangkat pembatas

Atur properti kluster interval pemeriksaan ulang

Membuat data masuk SQL Server untuk Pacemaker

Membuat sumber daya grup ketersediaan

Agen Pacemaker HA v2 (pratinjau)

RHEL 7

RHEL 8 dan versi yang lebih baru

Membuat sumber daya IP virtual

Menambahkan batasan kolokasi

RHEL 7

RHEL 8

RHEL 9 dan versi yang lebih baru

Menambahkan batasan pemesanan

RHEL 7

RHEL 8 dan versi yang lebih baru

Konten terkait

Saran dan Komentar

Sumber Daya Tambahan: