Bagikan melalui


Instans kluster failover AlwaysOn (SQL Server)

Berlaku untuk:SQL Server

Instans kluster failover AlwaysOn SQL Server menggunakan Windows Server Failover Clustering (WSFC) untuk memberikan ketersediaan tinggi lokal. Instans kluster failover (FCI) berlebihan di tingkat instans server. FCI adalah satu instans SQL Server yang diinstal di seluruh node kluster Windows Server dan, mungkin, di beberapa subnet. Pada jaringan, FCI muncul sebagai instans SQL Server yang berjalan pada satu komputer, tetapi FCI menyediakan failover dari satu simpul WSFC ke node lainnya jika simpul saat ini menjadi tidak tersedia.

FCI dapat menggunakan grup ketersediaan AlwaysOn untuk menyediakan pemulihan bencana jarak jauh di tingkat database. Untuk informasi selengkapnya, lihat Pengklusteran Failover dan Grup Ketersediaan AlwaysOn (SQL Server).

Instans kluster failover SQL Server mendukung Storage Spaces Direct (S2D) untuk sumber daya penyimpanan kluster, yang diperkenalkan dalam edisi Pusat Data Windows Server 2016. Untuk informasi selengkapnya, lihat Storage Spaces Direct di Windows Server.

Instans kluster failover juga mendukung volume bersama (CSV) berkluster. Untuk informasi selengkapnya, lihat Memahami volume bersama kluster dalam kluster failover.

Manfaat instans kluster failover

Ketika terjadi kegagalan perangkat keras atau perangkat lunak pada server, aplikasi atau klien yang terhubung ke server mengalami waktu henti. Simpul redundan melindungi ketersediaan instans SQL Server ketika digunakan sebagai FCI, bukan sebagai instans mandiri. Hanya salah satu simpul dalam FCI yang memiliki grup sumber daya WSFC pada satu waktu. Jika kegagalan terjadi (seperti kegagalan perangkat keras, kegagalan sistem operasi, kegagalan aplikasi atau layanan), atau selama peningkatan yang direncanakan, kluster memindahkan kepemilikan grup sumber daya ke simpul WSFC lain. Proses ini transparan untuk klien atau aplikasi yang terhubung ke SQL Server. Ini meminimalkan waktu henti yang dialami aplikasi atau klien selama kegagalan. Berikut ini mencantumkan beberapa manfaat utama yang disediakan instans kluster failover SQL Server:

  • Perlindungan pada tingkat instans melalui redundansi.

  • Failover otomatis jika terjadi kegagalan (kegagalan perangkat keras, kegagalan sistem operasi, atau kegagalan aplikasi dan layanan).

    Penting

    Dalam grup ketersediaan, failover otomatis dari FCI ke node lain dalam grup ketersediaan tidak didukung. Ini berarti bahwa FCI dan node mandiri tidak boleh digabungkan dalam grup ketersediaan jika failover otomatis adalah komponen penting dalam solusi ketersediaan tinggi Anda. Namun, kopling ini dapat dibuat untuk solusi pemulihan bencana Anda.

  • Dukungan untuk berbagai solusi penyimpanan, termasuk disk kluster WSFC (iSCSI, Fiber Channel, dan sebagainya) dan berbagi file blok pesan server (SMB).

  • Pemulihan bencana menggunakan FCI multi-subnet atau menjalankan database yang dihosting FCI di dalam grup ketersediaan. Dengan dukungan multi-subnet baru di Microsoft SQL Server 2012 (11.x), FCI multi-subnet tidak lagi memerlukan LAN virtual, meningkatkan pengelolaan dan keamanan FCI multi-subnet.

  • Tidak ada konfigurasi ulang aplikasi dan klien selama failover.

  • Kebijakan failover yang fleksibel untuk peristiwa pemicu terperinci untuk failover otomatis.

  • Failover yang andal melalui deteksi kesehatan berkala dan terperinci menggunakan koneksi khusus dan bertahan.

  • Konfigurasi dan prediksi dalam waktu failover melalui titik pemeriksaan latar belakang tidak langsung.

  • Penggunaan sumber daya yang dibatasi selama failover.

Rekomendasi

Di lingkungan produksi, gunakan alamat IP statis bersama dengan alamat IP virtual dari instans kluster failover.

Jangan gunakan DHCP di lingkungan produksi. Jika waktu henti, jika sewa IP DHCP kedaluwarsa, waktu tambahan diperlukan untuk mendaftarkan ulang alamat IP DHCP baru yang terkait dengan nama DNS.

Gambaran umum contoh kluster failover

FCI berjalan dalam grup sumber daya WSFC dengan satu atau beberapa simpul WSFC. Ketika FCI dimulai, salah satu simpul mengasumsikan kepemilikan grup sumber daya dan membawa instans SQL Server-nya secara online. Sumber daya yang dimiliki oleh simpul ini meliputi:

  • Nama jaringan
  • Alamat IP
  • Disk Bersama
  • Layanan Mesin Database SQL Server
  • Layanan SQL Server Agent
  • Layanan SQL Server Analysis Services, jika diinstal
  • Satu sumber daya berbagi file, jika fitur FILESTREAM diinstal

Kapan saja, hanya pemilik grup sumber daya (dan tidak ada simpul lain dalam FCI) yang menjalankan layanan SQL Server masing-masing dalam grup sumber daya. Ketika failover terjadi, apakah itu failover otomatis atau failover yang direncanakan, urutan peristiwa berikut terjadi:

  1. Kecuali terjadi kegagalan perangkat keras atau sistem, semua halaman kotor dalam cache buffer ditulis ke disk.

  2. Semua layanan SQL Server masing-masing dalam grup sumber daya dihentikan pada simpul aktif.

  3. Kepemilikan grup sumber daya ditransfer ke simpul lain di FCI.

  4. Pemilik grup sumber daya baru memulai layanan SQL Server-nya.

  5. Permintaan koneksi aplikasi klien secara otomatis diarahkan ke simpul aktif baru menggunakan nama jaringan virtual (VNN) yang sama.

FCI online selama kluster WSFC yang mendasarnya berada dalam kondisi kuorum yang baik (sebagian besar node WSFC kuorum tersedia sebagai target failover otomatis). Ketika kluster WSFC kehilangan kuorumnya, baik karena perangkat keras, perangkat lunak, kegagalan jaringan, atau konfigurasi kuorum yang tidak tepat, seluruh kluster WSFC, bersama dengan FCI, dibawa offline. Intervensi manual kemudian diperlukan dalam skenario failover yang tidak direncanakan ini untuk membangun kembali kuorum di node yang tersedia yang tersisa untuk membawa kluster WSFC dan FCI kembali online. Untuk informasi selengkapnya, lihat Mode Kuorum WSFC dan Konfigurasi Pemungutan Suara (SQL Server).

Waktu failover yang dapat diprediksi

Bergantung pada kapan instans SQL Server Anda terakhir kali melakukan operasi titik pemeriksaan, mungkin ada sejumlah besar halaman kotor di cache buffer. Akibatnya, failover berlangsung selama yang diperlukan untuk menulis halaman kotor yang tersisa ke disk, yang dapat menyebabkan waktu failover yang panjang dan tidak dapat diprediksi. Dimulai dengan Microsoft SQL Server 2012 (11.x), FCI dapat menggunakan titik pemeriksaan tidak langsung untuk membatasi jumlah halaman kotor yang disimpan dalam cache buffer. Meskipun ini mengonsumsi lebih banyak sumber daya di bawah beban kerja reguler, itu membuat waktu failover lebih dapat diprediksi serta lebih dapat dikonfigurasi. Ini berguna ketika perjanjian tingkat layanan di organisasi Anda menentukan tujuan waktu pemulihan (RTO) untuk solusi ketersediaan tinggi Anda. Untuk informasi selengkapnya tentang titik pemeriksaan tidak langsung, lihat Titik Pemeriksaan Tidak Langsung.

Pemantauan kesehatan yang andal dan kebijakan failover yang fleksibel

Setelah FCI berhasil dimulai, layanan WSFC memantau kesehatan kluster WSFC yang mendasar, dan kesehatan instans SQL Server. Dimulai dengan Microsoft SQL Server 2012 (11.x), layanan WSFC menggunakan koneksi khusus untuk melakukan polling instans SQL Server aktif untuk diagnostik komponen terperinci melalui prosedur tersimpan sistem. Implikasi dari ini adalah tiga kali lipat:

  • Koneksi khusus ke instans SQL Server memungkinkan polling dengan andal untuk diagnostik komponen sepanjang waktu, bahkan ketika FCI berada di bawah beban berat. Hal ini memungkinkan untuk membedakan antara sistem yang berada di bawah beban berat dan sistem yang benar-benar memiliki kondisi kegagalan, sehingga mencegah masalah seperti failover palsu.

  • Diagnostik komponen terperinci memungkinkan untuk mengonfigurasi kebijakan failover yang lebih fleksibel, di mana Anda dapat memilih kondisi kegagalan apa yang memicu failover dan kondisi kegagalan mana yang tidak.

  • Diagnostik komponen terperinci juga memungkinkan pemecahan masalah failover otomatis yang lebih baik secara retroaktif. Informasi diagnostik disimpan ke file log, yang dikolokasikan dengan log kesalahan SQL Server. Anda dapat memuatnya ke dalam Penampil File Log untuk memeriksa status komponen menjelang kemunculan failover untuk menentukan penyebab failover tersebut.

Untuk informasi selengkapnya, lihat Kebijakan Failover untuk Instans Kluster Failover.

Elemen instans kluster failover

FCI terdiri dari sekumpulan server fisik (node) yang berisi konfigurasi perangkat keras serupa serta konfigurasi perangkat lunak identik yang mencakup versi sistem operasi dan tingkat patch, dan versi SQL Server, tingkat patch, komponen, dan nama instans. Konfigurasi perangkat lunak yang identik diperlukan untuk memastikan bahwa FCI dapat berfungsi penuh karena gagal di antara simpul.

Grup sumber daya WSFC

SQL Server FCI berjalan dalam grup sumber daya WSFC. Setiap simpul dalam grup sumber daya mempertahankan salinan pengaturan konfigurasi yang disinkronkan dan kunci registri check-point untuk memastikan fungsionalitas penuh FCI setelah failover, dan hanya salah satu simpul dalam kluster yang memiliki grup sumber daya pada satu waktu (simpul aktif). Layanan WSFC mengelola kluster server, konfigurasi kuorum, kebijakan failover, dan operasi failover, serta VNN dan alamat IP virtual untuk FCI. Jika terjadi kegagalan (kegagalan perangkat keras, kegagalan sistem operasi, atau kegagalan aplikasi dan layanan) atau peningkatan yang direncanakan, kepemilikan grup sumber daya dipindahkan ke simpul lain di FCI. Jumlah simpul yang didukung dalam grup sumber daya WSFC bergantung pada edisi SQL Server Anda. Selain itu, kluster WSFC yang sama dapat menjalankan beberapa FCI (beberapa grup sumber daya), tergantung pada kapasitas perangkat keras Anda, seperti CPU, memori, dan jumlah disk.

Berkas biner SQL Server

Biner produk dipasang secara lokal pada setiap simpul FCI, proses yang mirip dengan penginstalan mandiri SQL Server. Namun, selama startup, layanan tidak dimulai secara otomatis, tetapi dikelola oleh WSFC.

Penyimpanan

Bertentangan dengan grup ketersediaan, FCI harus menggunakan penyimpanan bersama antara semua simpul FCI untuk database dan penyimpanan log. Penyimpanan bersama dapat berupa disk kluster WSFC, disk pada SAN, Storage Spaces Direct (S2D), atau berbagi file pada SMB. Dengan cara ini, semua simpul dalam FCI memiliki tampilan data instans yang sama setiap kali failover terjadi. Namun, ini berarti bahwa penyimpanan bersama memiliki potensi menjadi titik kegagalan tunggal, dan FCI tergantung pada solusi penyimpanan yang mendasar untuk memastikan perlindungan data.

Nama jaringan

VNN untuk FCI menyediakan titik koneksi terpadu untuk FCI. Ini memungkinkan aplikasi untuk terhubung ke VNN tanpa perlu mengetahui simpul yang saat ini aktif. Ketika failover terjadi, VNN didaftarkan ke simpul aktif baru setelah dimulai. Proses ini transparan bagi klien atau aplikasi yang terhubung ke SQL Server dan ini meminimalkan waktu henti yang dialami aplikasi atau klien selama kegagalan.

IP virtual

Dalam kasus FCI multi-subnet, alamat IP virtual ditetapkan ke setiap subnet di FCI. Selama failover, VNN di server DNS diperbarui untuk menunjuk ke alamat IP virtual untuk subnet masing-masing. Aplikasi dan klien kemudian dapat terhubung ke FCI menggunakan VNN yang sama setelah failover multi-subnet.

Konsep dan tugas failover SQL Server

Konsep dan tugas Artikel
Menjelaskan mekanisme deteksi kegagalan dan kebijakan failover yang fleksibel. Kebijakan Failover untuk Instans Kluster Failover
Menjelaskan konsep dalam administrasi dan pemeliharaan FCI. Administrasi dan Pemeliharaan Instans Kluster Failover
Menjelaskan konfigurasi dan konsep multi-subnet Pengklusteran Multi-Subnet SQL Server (SQL Server)

Konfigurasi yang didukung SQL Server FCI pada Windows Server Failover Cluster (WSFC)

Microsoft mendukung FCI SQL Server berdasarkan WSFC dalam produk berikut:

  • Windows Server 2012
  • Windows Server 2012 R2
  • Edisi Standar dan Pusat Data Windows Server 2016
  • Edisi Standar dan Pusat Data Windows Server 2019
  • Edisi Standar dan Pusat Data Windows Server 2022

Catatan

Untuk Windows Server 2012 dan Windows Server 2012 R2, lihat Kebijakan dukungan Microsoft untuk kluster failover Windows Server.

Windows Server menyediakan dua jenis layanan pengklusteran:

Hanya solusi Kluster Server yang dapat digunakan bersama dengan SQL Server untuk ketersediaan tinggi jika node hilang atau jika ada masalah dengan instans SQL Server. Penyeimbangan Beban Jaringan dapat digunakan dalam beberapa kasus bersama dengan penginstalan SQL Server yang baca-saja berdiri sendiri.

Setiap FCI SQL Server memerlukan:

  • Grup kluster khusus dengan huruf drive disk yang ditetapkan secara unik.
  • Setidaknya satu alamat IP unik.
  • Nama server virtual dan instans yang unik dalam domain.

Dukungan solusi kluster pihak ketiga

SQL Server dikembangkan dan diuji dengan Pengklusteran Microsoft Server. Saat menggunakan produk pengklusteran pihak ketiga, kontak dukungan utama Anda untuk masalah penginstalan, performa, atau perilaku kluster harus menjadi penyedia solusi pihak ketiga. Microsoft menawarkan dukungan yang wajar secara komersial untuk penginstalan kluster pihak ketiga, mirip dengan dukungan untuk penyebaran SQL Server yang berdiri sendiri.

Jumlah simpul yang didukung

Untuk informasi tentang jumlah maksimum simpul yang didukung untuk instans kluster failover Always On, lihat:

Sistem operasi yang didukung

Untuk sistem operasi yang didukung untuk Pengklusteran Failover SQL Server, lihat Memverifikasi sistem operasi Anda sebelum menginstal Pengklusteran Failover.

Drive yang dipasang

Penggunaan drive yang dipasang tidak didukung pada kluster yang menyertakan penginstalan SQL Server. Untuk informasi selengkapnya, lihat Dukungan SQL Server untuk volume yang dipasang.

Volume Bersama Kluster (CSV)

SQL Server 2012 (11.x) dan versi yang lebih lama tidak mendukung penggunaan CSV untuk SQL Server dalam kluster failover.

Untuk menggunakan CSV dengan SQL Server 2014 (12.x) atau versi yang lebih baru, tinjau sumber daya berikut:

Pembatasan pengendali domain

Instans kluster failover SQL Server tidak didukung pada node yang dikonfigurasi sebagai pengendali domain.

Pertimbangan migrasi domain

SQL Server 2005 (9.x) dan versi yang lebih baru tidak dapat dimigrasikan ke domain baru. Anda perlu men-uninstal dan menginstal ulang komponen cluster failover. Untuk informasi selengkapnya tentang cara memindahkan kluster Windows Server dari satu domain ke domain lain, lihat Memindahkan kluster Windows Server dari satu domain ke domain lainnya.

Sebelum menghapus instalan SQL Server, langkah-langkah berikut harus diambil:

  • Atur SQL Server untuk menggunakan keamanan mode campuran atau tambahkan akun domain baru ke login SQL Server.

  • Ganti nama folder DATA yang berisi database sistem sehingga dapat ditukar kembali setelah penginstalan ulang untuk mengurangi waktu henti.

  • Jangan hapus salah satu komponen berikut: File dukungan SQL Server, Klien Asli SQL Server, Layanan Integrasi, atau Komponen Stasiun Kerja, kecuali Anda membangun kembali seluruh simpul.

Peringatan

Jika kesalahan terjadi selama proses pembatalan penginstalan, Anda mungkin perlu membangun kembali simpul agar berhasil menginstal SQL Server lagi.