Prosedur pemeliharaan kluster failover

Berlaku untuk: Azure Stack HCI, versi 22H2 dan 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Artikel ini mengasumsikan bahwa Anda perlu mematikan server fisik untuk melakukan pemeliharaan, atau memulai ulang karena alasan yang lain. Untuk menginstal pembaruan pada kluster Azure Stack HCI tanpa menjadikan server offline, lihat Memperbarui kluster Azure Stack HCI.

Menjadikan server offline untuk pemeliharaan memerlukan pengambilan sebagian dari penyimpanan menjadi offline yang dibagi di semua server dalam kluster failover. Langkah ini memerlukan penjedaan server yang ingin Anda jadikan offline, menempatkan disk server dalam mode pemeliharaan, memindahkan peran berkluster dan mesin virtual (VM) ke server lain di kluster, dan memverifikasi bahwa semua data tersedia di server lain pada kluster. Proses ini memastikan bahwa data tetap aman dan dapat diakses selama periode pemeliharaan.

Anda dapat menggunakan Pusat Admin Windows atau PowerShell guna menjadikan server offline untuk pemeliharaan. Topik ini mencakup kedua metode tersebut.

Menjadikan server offline menggunakan Pusat Admin Windows

Cara termudah untuk mempersiapkan diri guna menjadikan server offline adalah menggunakan Pusat Admin Windows.

Memastikan aman untuk menjadikan server offline

  1. Menggunakan Pusat Admin Windows, sambungkan ke server yang ingin Anda jadikan offline. Pilih Penyimpanan > Disk dari menu Alat, dan verifikasi bahwa kolom Status untuk setiap disk virtual menunjukkan Online.

  2. Kemudian, pilih Penyimpanan > Volume dan verifikasi bahwa kolom Kesehatan untuk setiap volume menunjukkan Sehat dan kolom Status untuk setiap volume menunjukkan OK.

Menjeda dan mengosongkan server

Sebelum mematikan atau menghidupkan ulang server, Anda harus menjeda server dan mengosongkan (memindahkan) peran berkluster seperti mesin virtual yang berjalan di atasnya. Selalu jeda dan kosongkan server berkluster sebelum menjadikannya offline untuk pemeliharaan.

  1. Menggunakan Pusat Admin Windows, sambungkan ke kluster lalu pilih Komputasi > Server dari menu Alat di Pengelola Kluster.

  2. Pilih Inventaris. Klik pada nama server yang ingin Anda jeda dan kosongkan, lalu pilih Jeda. Anda akan melihat permintaan berikut:

    Menjeda server untuk pemeliharaan: Apakah Anda yakin ingin menjeda server? Langkah ini memindahkan beban kerja, seperti mesin virtual, ke server lain pada kluster.

  3. Pilih ya untuk menjeda server dan memulai proses pengosongan. Status server akan ditampilkan sebagai Dalam pemeliharaan, Pengosongan, dan peran seperti Hyper-V dan mesin virtual akan segera mulai bermigrasi secara langsung ke server lain pada kluster. Proses ini memerlukan waktu beberapa menit. Tidak ada peran yang dapat ditambahkan ke server sampai server dilanjutkan. Ketika proses pengosongan selesai, status server akan ditampilkan sebagai Dalam pemeliharaan, Pengosongan selesai. Sistem operasi melakukan pemeriksaan keamanan otomatis untuk memastikan aman untuk melanjutkan. Jika terdapat volume yang tidak sehat, sistem akan berhenti, dan mengingatkan Anda bahwa tidak aman untuk melanjutkan.

Mematikan server

Setelah server selesai dikosongkan, Anda dapat mematikannya dengan aman untuk pemeliharaan atau memulai ulang.

Peringatan

Jika server menjalankan Azure Stack HCI, versi 20H2, Windows Server 2019, atau Windows Server 2016, Anda harus menempatkan disk dalam mode pemeliharaan sebelum mematikan server dan mengeluarkan disk dari mode pemeliharaan sebelum melanjutkan server ke dalam kluster.

Melanjutkan server

Ketika Anda siap untuk membuat server mulai meng-hosting peran berkluster dan mesin virtual lagi, cukup nyalakan server, tunggu hingga menyala, dan lanjutkan server menggunakan langkah-langkah berikut.

  1. Di Pengelola Kluster, pilih Komputasi > Server dari menu Alat di sebelah kiri.

  2. Pilih Inventaris. Klik pada nama server yang ingin Anda lanjutkan, lalu klik Lanjutkan.

Mesin virtual dan peran berkluster akan segera mulai bermigrasi secara langsung kembali ke server. Proses ini memerlukan waktu beberapa menit.

Tunggu penyimpanan untuk disinkronkan kembali

Ketika server dilanjutkan, setiap penulisan baru yang terjadi saat server tidak tersedia perlu disinkronkan kembali. Hal ini terjadi secara otomatis, menggunakan pelacakan perubahan cerdas. Tidak perlu semua data dipindai atau disinkronkan; hanya perubahan. Proses ini dibatasi untuk mengurangi dampak terhadap beban kerja produksi. Tergantung pada berapa lama server dijeda dan berapa banyak data baru yang ditulis, mungkin perlu beberapa menit untuk menyelesaikannya.

Penting

Anda harus menunggu sinkronisasi ulang selesai sebelum menjadikan server lain pada kluster offline.

Untuk memeriksa apakah sinkronisasi ulang penyimpanan selesai:

  1. Sambungkan ke kluster menggunakan Windows Admin Center dan pilih Volume Penyimpanan>.
  2. Pilih Inventaris.
  3. Periksa kolom Status untuk setiap volume. Jika menunjukkan OK, sinkronisasi ulang penyimpanan selesai. Sekarang aman untuk mengambil server lain di kluster offline.

Menjadikan server offline menggunakan PowerShell

Gunakan prosedur berikut untuk menjeda, mengosongkan, dan melanjutkan server dengan benar di kluster failover menggunakan PowerShell.

Memastikan aman untuk menjadikan server offline

Untuk memverifikasi bahwa semua volume Anda sehat, jalankan cmdlet berikut sebagai administrator:

Get-VirtualDisk

Berikut adalah contoh seperti apa outputnya:

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

Pastikan bahwa properti HealthStatus untuk setiap volume Sehat dan OperationalStatus menunjukkan OK.

Untuk melakukannya menggunakan Pengelola Kluster Failover, buka Penyimpanan>Disk.

Menjeda dan mengosongkan server

Jalankan cmdlet berikut sebagai administrator untuk menjeda dan mengosongkan server:

Suspend-ClusterNode -Drain

Untuk melakukannya di Pengelola Kluster Failover, buka Node, klik kanan node, lalu pilih Jeda>Kosongkan Peran.

Jika server menjalankan Azure Stack HCI, versi 21H2 atau Windows Server 2022, menjeda dan mengosongkan server juga akan menempatkan disk server ke dalam mode pemeliharaan. Jika server menjalankan Azure Stack HCI, versi 20H2, Windows Server 2019, atau Windows Server 2016, Anda harus melakukannya secara manual (lihat langkah selanjutnya).

Menempatkan disk dalam mode pemeliharaan

Di Azure Stack HCI, versi 20H2, Windows Server 2019, dan Windows Server 2016, menempatkan disk server dalam mode pemeliharaan memberi Ruang Penyimpanan Langsung kesempatan untuk menghapus dan menerapkan data dengan baik guna memastikan bahwa mematikan server tidak memengaruhi status aplikasi. Segera setelah disk masuk ke mode pemeliharaan, disk tidak akan lagi memungkinkan penulisan. Untuk meminimalkan waktu sinkronisasi penyimpanan, sebaiknya posisikan disk ke mode pemeliharaan tepat sebelum mulai ulang dan keluarkan disk dari mode pemeliharaan segera setelah sistem hidup kembali.

Catatan

Jika server menjalankan Azure Stack HCI, versi 21H2 atau Windows Server 2022, Anda dapat melewati langkah ini karena disk secara otomatis ditempatkan ke dalam mode pemeliharaan ketika server dijeda dan dikosongkan. Sistem operasi ini memiliki fitur perbaikan granular yang membuat sinkronisasi ulang lebih cepat dan kurang berdampak pada sumber daya sistem juga jaringan, sehingga memungkinkan untuk melakukan pemeliharaan penyimpanan dan server bersama-sama.

Jika server menjalankan Windows Server 2019 atau Azure Stack HCI, versi 20H2, jalankan cmdlet berikut sebagai administrator:

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

Jika server menjalankan Windows Server 2016, gunakan sintaks berikut sebagai gantinya:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

Mematikan server

Setelah server selesai dikosongkan, server akan ditampilkan sebagai Dijeda di PowerShell dan Pengelola Kluster Failover.

Anda sekarang dapat mematikan server dengan aman atau menghidupkan ulang menggunakan cmdlet PowerShell Stop-Computer atau Restart-Computer, atau menggunakan Pengelola Kluster Failover.

Catatan

Saat menjalankan perintah Get-VirtualDisk pada server yang mematikan atau memulai/menghentikan layanan kluster, Status Operasional server dapat dilaporkan tidak lengkap atau terdegradasi, dan kolom Status Kesehatan dapat mencantumkan peringatan. Hal ini normal dan seharusnya tidak menimbulkan kekhawatiran. Semua volume Anda tetap online dan dapat diakses.

Mengeluarkan disk dari mode pemeliharaan

Jika server menjalankan Azure Stack HCI, versi 20H2, Windows Server 2019, atau Windows Server 2016, Anda harus menonaktifkan mode pemeliharaan penyimpanan pada disk sebelum melanjutkan server ke dalam kluster. Untuk meminimalkan waktu sinkronisasi penyimpanan, sebaiknya keluarkan disk dari mode pemeliharaan segera setelah sistem hidup kembali.

Catatan

Jika server menjalankan Azure Stack HCI, versi 21H2 atau Windows Server 2022, Anda dapat melewati langkah ini karena disk akan secara otomatis dikeluarkan dari mode pemeliharaan saat server dilanjutkan.

Jika server menjalankan Windows Server 2019 atau Azure Stack HCI, versi 20H2, jalankan cmdlet berikut sebagai administrator untuk menonaktifkan mode pemeliharaan penyimpanan:

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

Jika server menjalankan Windows Server 2016, gunakan sintaks berikut sebagai gantinya:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

Melanjutkan server

Lanjutkan server ke dalam kluster. Untuk mengembalikan mesin virtual dan peran berkluster yang sebelumnya berjalan di server, gunakan bendera -Failback opsional:

Resume-ClusterNode –Failback Immediate

Untuk melakukannya di Pengelola Kluster Failover, buka Node, klik kanan node, lalu pilih Lanjutkan>Peran Fail kembali.

Setelah server dilanjutkan, server akan muncul sebagai Hidup di PowerShell dan Pengelola Kluster Failover.

Tunggu penyimpanan untuk disinkronkan kembali

Ketika server dilanjutkan, Anda harus menunggu sinkronisasi ulang selesai sebelum menjadikan server lain pada kluster offline.

Jalankan cmdlet berikut sebagai administrator untuk memantau kemajuan:

Get-StorageJob

Jika sinkronisasi ulang telah selesai, Anda tidak akan mendapatkan output apa pun.

Berikut adalah beberapa contoh output yang menunjukkan pekerjaan sinkronisasi ulang (perbaikan) masih berjalan:

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

Kolom BytesTotal menunjukkan berapa banyak penyimpanan yang perlu disinkronkan kembali. Kolom PercentComplete menampilkan kemajuan.

Peringatan

Tidak aman untuk menjadikan server lain offline sampai pekerjaan perbaikan ini selesai.

Selama waktu ini, di bagian HealthStatus, volume Anda akan terus ditampilkan sebagai Peringatan, yang mana normal.

Misalnya, jika Anda menggunakan cmdlet Get-VirtualDisk saat penyimpanan disinkronkan ulang, Anda mungkin melihat output berikut:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

Setelah pekerjaan selesai, verifikasi bahwa volume menunjukkan Sehat kembali menggunakan cmdlet Get-VirtualDisk. Berikut adalah beberapa contoh output:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

Sekarang aman untuk menjeda dan menghidupkan ulang server lain pada klaster.

Langkah berikutnya

Untuk informasi terkait, lihat juga: