Prosedur pemeliharaan kluster failover
Berlaku untuk: Azure Stack HCI, versi 22H2 dan 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016
Artikel ini mengasumsikan bahwa Anda perlu mematikan server fisik untuk melakukan pemeliharaan, atau memulai ulang karena alasan yang lain. Untuk menginstal pembaruan pada kluster Azure Stack HCI tanpa menjadikan server offline, lihat Memperbarui kluster Azure Stack HCI.
Menjadikan server offline untuk pemeliharaan memerlukan pengambilan sebagian dari penyimpanan menjadi offline yang dibagi di semua server dalam kluster failover. Langkah ini memerlukan penjedaan server yang ingin Anda jadikan offline, menempatkan disk server dalam mode pemeliharaan, memindahkan peran berkluster dan mesin virtual (VM) ke server lain di kluster, dan memverifikasi bahwa semua data tersedia di server lain pada kluster. Proses ini memastikan bahwa data tetap aman dan dapat diakses selama periode pemeliharaan.
Anda dapat menggunakan Pusat Admin Windows atau PowerShell guna menjadikan server offline untuk pemeliharaan. Topik ini mencakup kedua metode tersebut.
Menjadikan server offline menggunakan Pusat Admin Windows
Cara termudah untuk mempersiapkan diri guna menjadikan server offline adalah menggunakan Pusat Admin Windows.
Memastikan aman untuk menjadikan server offline
Menggunakan Pusat Admin Windows, sambungkan ke server yang ingin Anda jadikan offline. Pilih Penyimpanan > Disk dari menu Alat, dan verifikasi bahwa kolom Status untuk setiap disk virtual menunjukkan Online.
Kemudian, pilih Penyimpanan > Volume dan verifikasi bahwa kolom Kesehatan untuk setiap volume menunjukkan Sehat dan kolom Status untuk setiap volume menunjukkan OK.
Menjeda dan mengosongkan server
Sebelum mematikan atau menghidupkan ulang server, Anda harus menjeda server dan mengosongkan (memindahkan) peran berkluster seperti mesin virtual yang berjalan di atasnya. Selalu jeda dan kosongkan server berkluster sebelum menjadikannya offline untuk pemeliharaan.
Menggunakan Pusat Admin Windows, sambungkan ke kluster lalu pilih Komputasi > Server dari menu Alat di Pengelola Kluster.
Pilih Inventaris. Klik pada nama server yang ingin Anda jeda dan kosongkan, lalu pilih Jeda. Anda akan melihat permintaan berikut:
Menjeda server untuk pemeliharaan: Apakah Anda yakin ingin menjeda server? Langkah ini memindahkan beban kerja, seperti mesin virtual, ke server lain pada kluster.
Pilih ya untuk menjeda server dan memulai proses pengosongan. Status server akan ditampilkan sebagai Dalam pemeliharaan, Pengosongan, dan peran seperti Hyper-V dan mesin virtual akan segera mulai bermigrasi secara langsung ke server lain pada kluster. Proses ini memerlukan waktu beberapa menit. Tidak ada peran yang dapat ditambahkan ke server sampai server dilanjutkan. Ketika proses pengosongan selesai, status server akan ditampilkan sebagai Dalam pemeliharaan, Pengosongan selesai. Sistem operasi melakukan pemeriksaan keamanan otomatis untuk memastikan aman untuk melanjutkan. Jika terdapat volume yang tidak sehat, sistem akan berhenti, dan mengingatkan Anda bahwa tidak aman untuk melanjutkan.
Mematikan server
Setelah server selesai dikosongkan, Anda dapat mematikannya dengan aman untuk pemeliharaan atau memulai ulang.
Peringatan
Jika server menjalankan Azure Stack HCI, versi 20H2, Windows Server 2019, atau Windows Server 2016, Anda harus menempatkan disk dalam mode pemeliharaan sebelum mematikan server dan mengeluarkan disk dari mode pemeliharaan sebelum melanjutkan server ke dalam kluster.
Melanjutkan server
Ketika Anda siap untuk membuat server mulai meng-hosting peran berkluster dan mesin virtual lagi, cukup nyalakan server, tunggu hingga menyala, dan lanjutkan server menggunakan langkah-langkah berikut.
Di Pengelola Kluster, pilih Komputasi > Server dari menu Alat di sebelah kiri.
Pilih Inventaris. Klik pada nama server yang ingin Anda lanjutkan, lalu klik Lanjutkan.
Mesin virtual dan peran berkluster akan segera mulai bermigrasi secara langsung kembali ke server. Proses ini memerlukan waktu beberapa menit.
Tunggu penyimpanan untuk disinkronkan kembali
Ketika server dilanjutkan, setiap penulisan baru yang terjadi saat server tidak tersedia perlu disinkronkan kembali. Hal ini terjadi secara otomatis, menggunakan pelacakan perubahan cerdas. Tidak perlu semua data dipindai atau disinkronkan; hanya perubahan. Proses ini dibatasi untuk mengurangi dampak terhadap beban kerja produksi. Tergantung pada berapa lama server dijeda dan berapa banyak data baru yang ditulis, mungkin perlu beberapa menit untuk menyelesaikannya.
Penting
Anda harus menunggu sinkronisasi ulang selesai sebelum menjadikan server lain pada kluster offline.
Untuk memeriksa apakah sinkronisasi ulang penyimpanan selesai:
- Sambungkan ke kluster menggunakan Windows Admin Center dan pilih Volume Penyimpanan>.
- Pilih Inventaris.
- Periksa kolom Status untuk setiap volume. Jika menunjukkan OK, sinkronisasi ulang penyimpanan selesai. Sekarang aman untuk mengambil server lain di kluster offline.
Menjadikan server offline menggunakan PowerShell
Gunakan prosedur berikut untuk menjeda, mengosongkan, dan melanjutkan server dengan benar di kluster failover menggunakan PowerShell.
Memastikan aman untuk menjadikan server offline
Untuk memverifikasi bahwa semua volume Anda sehat, jalankan cmdlet berikut sebagai administrator:
Get-VirtualDisk
Berikut adalah contoh seperti apa outputnya:
FriendlyName ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus Size FootprintOnPool StorageEfficiency
------------ --------------------- --------------------- ----------------- ------------ ---- --------------- -----------------
Mirror II Mirror 1 OK Healthy 4 TB 8.01 TB 49.99%
Mirror-accelerated parity OK Healthy 1002 GB 1.96 TB 49.98%
Mirror Mirror 1 OK Healthy 1 TB 2 TB 49.98%
ClusterPerformanceHistory Mirror 1 OK Healthy 24 GB 49 GB 48.98%
Pastikan bahwa properti HealthStatus untuk setiap volume Sehat dan OperationalStatus menunjukkan OK.
Untuk melakukannya menggunakan Pengelola Kluster Failover, buka Penyimpanan>Disk.
Menjeda dan mengosongkan server
Jalankan cmdlet berikut sebagai administrator untuk menjeda dan mengosongkan server:
Suspend-ClusterNode -Drain
Untuk melakukannya di Pengelola Kluster Failover, buka Node, klik kanan node, lalu pilih Jeda>Kosongkan Peran.
Jika server menjalankan Azure Stack HCI, versi 21H2 atau Windows Server 2022, menjeda dan mengosongkan server juga akan menempatkan disk server ke dalam mode pemeliharaan. Jika server menjalankan Azure Stack HCI, versi 20H2, Windows Server 2019, atau Windows Server 2016, Anda harus melakukannya secara manual (lihat langkah selanjutnya).
Menempatkan disk dalam mode pemeliharaan
Di Azure Stack HCI, versi 20H2, Windows Server 2019, dan Windows Server 2016, menempatkan disk server dalam mode pemeliharaan memberi Ruang Penyimpanan Langsung kesempatan untuk menghapus dan menerapkan data dengan baik guna memastikan bahwa mematikan server tidak memengaruhi status aplikasi. Segera setelah disk masuk ke mode pemeliharaan, disk tidak akan lagi memungkinkan penulisan. Untuk meminimalkan waktu sinkronisasi penyimpanan, sebaiknya posisikan disk ke mode pemeliharaan tepat sebelum mulai ulang dan keluarkan disk dari mode pemeliharaan segera setelah sistem hidup kembali.
Catatan
Jika server menjalankan Azure Stack HCI, versi 21H2 atau Windows Server 2022, Anda dapat melewati langkah ini karena disk secara otomatis ditempatkan ke dalam mode pemeliharaan ketika server dijeda dan dikosongkan. Sistem operasi ini memiliki fitur perbaikan granular yang membuat sinkronisasi ulang lebih cepat dan kurang berdampak pada sumber daya sistem juga jaringan, sehingga memungkinkan untuk melakukan pemeliharaan penyimpanan dan server bersama-sama.
Jika server menjalankan Windows Server 2019 atau Azure Stack HCI, versi 20H2, jalankan cmdlet berikut sebagai administrator:
Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode
Jika server menjalankan Windows Server 2016, gunakan sintaks berikut sebagai gantinya:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode
Mematikan server
Setelah server selesai dikosongkan, server akan ditampilkan sebagai Dijeda di PowerShell dan Pengelola Kluster Failover.
Anda sekarang dapat mematikan server dengan aman atau menghidupkan ulang menggunakan cmdlet PowerShell Stop-Computer
atau Restart-Computer
, atau menggunakan Pengelola Kluster Failover.
Catatan
Saat menjalankan perintah Get-VirtualDisk
pada server yang mematikan atau memulai/menghentikan layanan kluster, Status Operasional server dapat dilaporkan tidak lengkap atau terdegradasi, dan kolom Status Kesehatan dapat mencantumkan peringatan. Hal ini normal dan seharusnya tidak menimbulkan kekhawatiran. Semua volume Anda tetap online dan dapat diakses.
Mengeluarkan disk dari mode pemeliharaan
Jika server menjalankan Azure Stack HCI, versi 20H2, Windows Server 2019, atau Windows Server 2016, Anda harus menonaktifkan mode pemeliharaan penyimpanan pada disk sebelum melanjutkan server ke dalam kluster. Untuk meminimalkan waktu sinkronisasi penyimpanan, sebaiknya keluarkan disk dari mode pemeliharaan segera setelah sistem hidup kembali.
Catatan
Jika server menjalankan Azure Stack HCI, versi 21H2 atau Windows Server 2022, Anda dapat melewati langkah ini karena disk akan secara otomatis dikeluarkan dari mode pemeliharaan saat server dilanjutkan.
Jika server menjalankan Windows Server 2019 atau Azure Stack HCI, versi 20H2, jalankan cmdlet berikut sebagai administrator untuk menonaktifkan mode pemeliharaan penyimpanan:
Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode
Jika server menjalankan Windows Server 2016, gunakan sintaks berikut sebagai gantinya:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode
Melanjutkan server
Lanjutkan server ke dalam kluster. Untuk mengembalikan mesin virtual dan peran berkluster yang sebelumnya berjalan di server, gunakan bendera -Failback opsional:
Resume-ClusterNode –Failback Immediate
Untuk melakukannya di Pengelola Kluster Failover, buka Node, klik kanan node, lalu pilih Lanjutkan>Peran Fail kembali.
Setelah server dilanjutkan, server akan muncul sebagai Hidup di PowerShell dan Pengelola Kluster Failover.
Tunggu penyimpanan untuk disinkronkan kembali
Ketika server dilanjutkan, Anda harus menunggu sinkronisasi ulang selesai sebelum menjadikan server lain pada kluster offline.
Jalankan cmdlet berikut sebagai administrator untuk memantau kemajuan:
Get-StorageJob
Jika sinkronisasi ulang telah selesai, Anda tidak akan mendapatkan output apa pun.
Berikut adalah beberapa contoh output yang menunjukkan pekerjaan sinkronisasi ulang (perbaikan) masih berjalan:
Name IsBackgroundTask ElapsedTime JobState PercentComplete BytesProcessed BytesTotal
---- ---------------- ----------- -------- --------------- -------------- ----------
Repair True 00:06:23 Running 65 11477975040 17448304640
Repair True 00:06:40 Running 66 15987900416 23890755584
Repair True 00:06:52 Running 68 20104802841 22104819713
Kolom BytesTotal menunjukkan berapa banyak penyimpanan yang perlu disinkronkan kembali. Kolom PercentComplete menampilkan kemajuan.
Peringatan
Tidak aman untuk menjadikan server lain offline sampai pekerjaan perbaikan ini selesai.
Selama waktu ini, di bagian HealthStatus, volume Anda akan terus ditampilkan sebagai Peringatan, yang mana normal.
Misalnya, jika Anda menggunakan cmdlet Get-VirtualDisk
saat penyimpanan disinkronkan ulang, Anda mungkin melihat output berikut:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror InService Warning True 1 TB
MyVolume2 Mirror InService Warning True 1 TB
MyVolume3 Mirror InService Warning True 1 TB
Setelah pekerjaan selesai, verifikasi bahwa volume menunjukkan Sehat kembali menggunakan cmdlet Get-VirtualDisk
. Berikut adalah beberapa contoh output:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror OK Healthy True 1 TB
MyVolume2 Mirror OK Healthy True 1 TB
MyVolume3 Mirror OK Healthy True 1 TB
Sekarang aman untuk menjeda dan menghidupkan ulang server lain pada klaster.
Langkah berikutnya
Untuk informasi terkait, lihat juga: