Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Azure VMware Solution melakukan pemeliharaan berkala cloud privat. Pemeliharaan ini mencakup patch keamanan, pembaruan kecil dan utama untuk tumpukan perangkat lunak VMware. Halaman ini menjelaskan pemantauan host, remediasi, dan langkah-langkah wajib yang menjaga cloud privat tetap siap untuk pemeliharaan.
Pemeliharaan host dan manajemen siklus hidup
Salah satu manfaat cloud privat Azure VMware Solution adalah platform ini dipertahankan untuk Anda. Microsoft bertanggung jawab atas manajemen siklus hidup perangkat lunak VMware (ESXi, vCenter Server, dan vSAN) dan appliance NSX. Microsoft juga bertanggung jawab untuk melakukan bootstrap konfigurasi jaringan, seperti membuat gateway Tier-0 dan mengaktifkan perutean Utara-Selatan. Anda bertanggung jawab atas konfigurasi NSX SDN: segmen jaringan, aturan firewall terdistribusi, gateway Tingkat 1, dan penyeimbang beban.
Nota
Gateway T0 dibuat dan dikonfigurasi sebagai bagian dari penyebaran cloud privat. Setiap modifikasi pada router logis atau VM simpul tepi NSX dapat memengaruhi konektivitas ke cloud privat Anda dan harus dihindari.
Microsoft bertanggung jawab untuk menerapkan patch, pembaruan, atau peningkatan apa pun ke ESXi, vCenter Server, vSAN, dan NSX di cloud privat Anda. Dampak patch, pembaruan, dan peningkatan pada ESXi, vCenter Server, dan NSX memiliki pertimbangan berikut:
ESXi - Tidak ada dampak pada beban kerja yang berjalan di cloud privat Anda. Akses ke vCenter Server dan NSX tidak diblokir selama waktu ini. Selama waktu ini, kami sarankan Anda tidak merencanakan aktivitas lain seperti: meningkatkan cloud privat, menjadwalkan, atau memulai migrasi HCX aktif, membuat perubahan konfigurasi HCX, dan sebagainya, di cloud privat Anda.
vCenter Server - Tidak ada dampak terhadap beban kerja yang berjalan di cloud privat Anda. Selama waktu ini, vCenter Server tidak tersedia dan Anda tidak dapat mengelola VM (hentikan, mulai, buat, atau hapus). Kami sarankan Anda tidak merencanakan aktivitas lain seperti meningkatkan cloud privat, membuat jaringan baru, dan sebagainya, di cloud privat Anda. Saat Anda menggunakan antarmuka pengguna VMware Site Recovery Manager atau vSphere Replication, kami sarankan Anda tidak melakukan salah satu tindakan: mengonfigurasi Replikasi vSphere, dan mengonfigurasi atau menjalankan rencana pemulihan situs selama peningkatan vCenter Server.
NSX - Beban kerja terpengaruh. Ketika host tertentu sedang ditingkatkan, VM pada host tersebut mungkin kehilangan konektivitas dari 2 detik menjadi 1 menit dengan salah satu gejala berikut:
Kesalahan ping
Kehilangan paket
Pesan kesalahan (misalnya, Host Tujuan Tidak Dapat Dijangkau dan Net tidak dapat dijangkau)
Selama jendela peningkatan ini, semua akses ke bidang manajemen NSX diblokir. Anda tidak dapat membuat perubahan konfigurasi pada lingkungan NSX selama durasi tersebut. Beban kerja Anda terus berjalan seperti biasa, tunduk pada dampak peningkatan yang sebelumnya dirinci.
Selama waktu peningkatan, kami sarankan Anda tidak merencanakan aktivitas lain seperti, meningkatkan cloud privat, dan sebagainya, di cloud privat Anda. Aktivitas lain dapat mencegah peningkatan dimulai atau dapat berdampak buruk pada peningkatan dan lingkungan.
Anda diberi tahu melalui Azure Service Health yang menyertakan garis waktu peningkatan. Pemberitahuan ini juga menyediakan detail tentang komponen yang ditingkatkan, efeknya pada beban kerja, akses cloud privat, dan layanan Azure lainnya. Anda dapat menjadwalkan ulang peningkatan sesuai kebutuhan.
Pembaruan perangkat lunak mencakup:
Patch - Patch keamanan atau perbaikan bug yang dirilis oleh VMware
Pembaruan - Perubahan versi minor komponen tumpukan VMware
Peningkatan - Perubahan versi utama komponen tumpukan VMware
Nota
Microsoft menguji patch keamanan yang penting segera setelah tersedia dari VMware.
Solusi VMware yang didokumentasikan diterapkan sebagai pengganti pemasangan patch yang sesuai hingga pembaruan terjadwal berikutnya diterapkan.
Pemantauan dan remediasi host
Azure VMware Solution terus memantau kesehatan komponen VMware dan underlay. Saat Azure VMware Solution mendeteksi kegagalan, diperlukan tindakan untuk memperbaiki komponen yang gagal. Saat Azure VMware Solution mendeteksi degradasi atau kegagalan pada simpul Azure VMware Solution, hal ini akan memicu proses remediasi host.
Remediasi host melibatkan penggantian node yang rusak dengan node sehat baru dalam kluster. Kemudian, jika memungkinkan, host yang rusak ditempatkan dalam mode pemeliharaan VMware vSphere. VMware vSphere vMotion memindahkan VM dari host yang rusak ke server lain yang tersedia di kluster, berpotensi memungkinkan waktu henti nol untuk migrasi langsung beban kerja. Jika host yang rusak tidak dapat ditempatkan dalam mode pemeliharaan, host akan dihapus dari kluster. Sebelum host yang rusak dihapus, beban kerja pelanggan dimigrasikan ke host yang baru ditambahkan.
Tip
Komunikasi pelanggan: Email dikirim ke alamat email pelanggan sebelum penggantian dimulai dan sekali lagi setelah penggantian berhasil.
Untuk menerima email yang terkait dengan penggantian host, Anda perlu ditambahkan ke salah satu peran Azure Role-Based Access Control (RBAC) berikut dalam langganan: 'ServiceAdmin', 'CoAdmin', 'Owner', 'Contributor'.
Azure VMware Solution memantau kondisi berikut pada host:
- Status prosesor
- Status memori
- Koneksi dan status daya
- Status kipas perangkat keras
- Hilangnya konektivitas jaringan
- Status papan sistem perangkat keras
- Kesalahan terjadi pada satu atau beberapa disk host vSAN
- Tegangan perangkat keras
- Status suhu perangkat keras
- Status daya perangkat keras
- Status penyimpanan
- Kegagalan koneksi
Tindakan untuk memastikan cloud privat siap untuk pemeliharaan
Tindakan berikut diperlukan untuk memastikan operasi pemeliharaan host berhasil dilakukan:
- Pemanfaatan penyimpanan vSAN: Untuk mempertahankan Perjanjian Tingkat Layanan (SLA), pastikan bahwa pemanfaatan ruang penyimpanan kluster vSphere Anda tetap di bawah 75%. Jika pemanfaatan melebihi 75%, peningkatan mungkin memakan waktu lebih lama dari yang diharapkan atau gagal sepenuhnya. Jika pemanfaatan penyimpanan Anda melebihi 75%, pertimbangkan untuk menambahkan node untuk memperluas kluster dan mencegah potensi downtime selama upgrade.
- Aturan Distributed Resource Scheduler (DRS): DRS VM-VM aturan anti-afinitas harus dikonfigurasi dengan cara untuk memiliki setidaknya (N+1) host di kluster, di mana N adalah jumlah VM bagian dari aturan DRS.
- Kegagalan Untuk Mentolerir pelanggaran (FTT): Untuk mencegah kehilangan data, ubah VM yang dikonfigurasi dengan kebijakan penyimpanan vSAN untuk Kegagalan Toleransi (FTT) 0 ke kebijakan penyimpanan vSAN yang mematuhi Microsoft SLA (FTT=1 hingga lima host dalam kluster dan FTT=2 untuk enam host atau lebih dalam kluster) dan pastikan operasi pemeliharaan host dapat dilakukan dengan mulus.
- Hapus pemasangan VM CD-ROM: VM yang dipasang dengan "mode emulasi" CD-ROMs memblokir pemeliharaan host. Pastikan CD-ROMs dipasang dalam "Mode passthrough".
- Port serial/paralel atau perangkat eksternal: Jika Anda menggunakan file gambar (ISO, FLP, dll.), pastikan file tersebut dapat diakses dari semua host ESXi di kluster. Simpan file di datastore yang dibagi antara semua Server ESXi yang berpartisipasi dalam proses vMotion pada komputer virtual. Untuk informasi selengkapnya, lihat artikel Broadcom KB.
- VM Yatim: Dalam kasus mesin virtual yatim, Mesin Virtual (VM) harus didaftarkan ulang jika memungkinkan (jika belum dihapus) atau dihapus dari inventaris. Untuk informasi selengkapnya, lihat artikel Broadcom KB.
- Pengontrol bersama SCSI: Saat menggunakan berbagi bus SCSI, gunakan dengan jenis bus sebagai "Fisik" untuk VM. VM yang terhubung ke pengontrol Virtual SCSI akan dimatikan. Untuk informasi selengkapnya, lihat artikel Broadcom KB.
-
VM & aplikasi pihak ketiga: Untuk VM & aplikasi pihak ketiga:
- Pastikan bahwa solusi pihak ketiga yang disebarkan di Azure VMware Solution sesuai dan tidak mengganggu operasi pemeliharaan.
- Pastikan bahwa VM tidak diinstal dengan aturan DRS VM-Host "Harus dijalankan". Selain itu, pastikan bahwa aplikasi ini kompatibel dengan versi stack teknologi VMware yang akan datang.
- Konsultasikan dengan vendor solusi Anda dan perbarui terlebih dahulu jika perlu untuk mempertahankan kompatibilitas pasca-peningkatan.
Penting
Jika salah satu konfigurasi pemblokiran pemeliharaan ini ada di host Azure VMware Solution, Anda akan menerima pemberitahuan di dasbor Resource Health for AVS Anda. Untuk memastikan host yang tidak sehat diganti dan peningkatan berhasil, konfigurasi pemblokiran tersebut akan dimitigasi dengan mengambil langkah-langkah remediasi yang sesuai untuk menjaga ketersediaan cloud privat Anda. Dalam beberapa kasus, langkah-langkah remediasi ini akan mencakup mematikan VM dan memigrasikannya ke host lain dan kemudian menyalakannya, yang mungkin secara singkat mengganggu aplikasi yang berjalan di VM
Kode Pemberitahuan dan Tabel Remediasi
| Kode Kesalahan | Rincian Kesalahan | Tindakan yang Direkomendasikan |
|---|---|---|
| EPC_CDROM_EMULATEMODE | Kesalahan ini ditemui ketika CD-ROM pada Komputer Virtual menggunakan mode emulasi, yang gambar ISO-nya tidak dapat diakses. | Ikuti artikel KB ini untuk menghapus CDROM apa pun yang dipasang pada beban kerja pelanggan Virtual Machines dalam mode emulasi atau melepaskan ISO. Disarankan untuk menggunakan "Mode passthrough" untuk memasang CD-ROM apa pun. |
| EPC_DRSOVERRIDERULE | Kesalahan ini terjadi ketika ada Mesin Virtual dengan penggantian DRS diatur ke mode "Dinonaktifkan". | VM tidak boleh memblokir vMotion saat menempatkan host ke dalam pemeliharaan. Tetapkan aturan DRS yang sebagian otomatis untuk VM. Lihat dokumen ini untuk mengetahui selengkapnya tentang kebijakan penempatan VM. |
| EPC_SCSIDEVICE_SHARINGMODE | Kesalahan ini ditemui ketika Komputer Virtual dikonfigurasi untuk menggunakan pengontrol SCSI dengan berbagi bus dalam mode "virtual". | Ikuti artikel KB ini untuk menghapus pengontrol SCSI apa pun yang terlibat dalam berbagi bus dalam mode virtual dilampirkan ke VM. |
| EPC_DATASTORE_INACCESSIBLE | Kesalahan ini ditemui ketika datastore eksternal apa pun yang dilampirkan ke AVS Private Cloud menjadi tidak dapat diakses. | Ikuti artikel ini untuk menghapus Datastore basi apa pun yang dilampirkan ke kluster |
| EPC_NWADAPTER_STALE | Kesalahan ini ditemui ketika antarmuka Jaringan yang terhubung pada Komputer Virtual menggunakan adaptor jaringan, yang menjadi tidak dapat diakses. | Ikuti artikel KB ini untuk menghapus adaptor N/W basi yang dilampirkan ke Virtual Machines. |
| EPC_SERIAL_PORT | Kesalahan ini ditemui ketika port serial Komputer Virtual terhubung ke perangkat yang tidak dapat diakses pada host tujuan. | Jika Anda menggunakan file gambar (ISO, FLP, dan sebagainya), pastikan file tersebut dapat diakses dari semua server ESXi di kluster. Simpan file di penyimpanan data yang dibagikan antara semua server ESXi yang berpartisipasi dalam vMotion komputer virtual. Lihat artikel KB ini dari Broadcom untuk informasi selengkapnya. |
| Perangkat Keras EPC_DEVICE | Kesalahan ini ditemui ketika Port paralel Komputer Virtual/Perangkat USB terhubung ke perangkat tidak dapat diakses di host tujuan. | Jika Anda menggunakan file gambar (ISO, FLP, dan sebagainya), pastikan file tersebut dapat diakses dari semua server ESXi kluster. Simpan file di penyimpanan data yang dibagikan antara semua server ESXi yang berpartisipasi dalam vMotion komputer virtual. Lihat artikel KB ini dari Broadcom untuk informasi selengkapnya. |
| EPC_INVALIDVM /EPC_ORPHANVM | Kesalahan ini ditemui ketika ada VM yang terputus atau tidak valid dalam inventori. | Pastikan semua Komputer Virtual Anda dapat diakses oleh vCenter Server. Lihat artikel KB ini untuk informasi selengkapnya. |
| EPC_VMHOSTDRSRULE | Kesalahan ini ditemui ketika ada Mesin Virtual dengan aturan DRS afinitas/anti-afinitas host. | VM tidak boleh memblokir VMware vMotion saat menempatkan host ke dalam mode pemeliharaan. Atur "aturan yang disarankan" untuk afinitas VM-Host. Lihat dokumen ini untuk informasi selengkapnya. |
| EPC_FTT_ZERO | Kesalahan ini ditemui ketika mesin virtual memiliki "Batas Kegagalan yang Dapat Ditolerir" sebesar 0 atau "tidak ada redundansi data". | Ikuti artikel KB ini untuk mengonfigurasi FTT sebagai 1 atau 2 untuk Komputer Virtual. |
| EPC_FTTVIOLATION | Kesalahan ini ditemui ketika kluster tidak memiliki jumlah minimum host yang dibutuhkan kebijakan penyimpanan. | Tambahkan host sesuai kebutuhan oleh kebijakan penyimpanan atau ubah kebijakan FTT VM untuk mendukung menempatkan host ke mode pemeliharaan. Lihat artikel KB ini untuk mengetahui lebih lanjut tentang kebijakan FTT. |
| ERECOMMENDATION_CLUSTER_SIZE | Rekomendasi ini menunjukkan kluster di cloud privat memiliki 14 host atau lebih. AVS mendukung maksimum 16 host dalam kluster. | Buat kluster baru untuk host baru yang mungkin diperlukan. |
| ERECOMMENDATION_PRIVATECLOUD_SIZE | Rekomendasi ini menunjukkan cloud privat memiliki 90 host atau lebih. AVS mendukung maksimum 96 host di cloud privat. | Pertimbangkan untuk membuat cloud privat baru untuk host baru dan distribusikan host di seluruh cloud privat seperlunya. |
Nota
Admin penyewa Azure VMware Solution tidak boleh mengedit atau menghapus alarm VMware vCenter Server yang ditentukan sebelumnya karena dikelola oleh sarana kontrol Azure VMware Solution di vCenter Server. Alarm ini digunakan oleh pemantauan Azure VMware Solution untuk memicu proses remediasi host Azure VMware Solution.
Langkah selanjutnya
Sekarang setelah Anda mempelajari cara memastikan pemeliharaan cloud privat Azure VMware Solution yang lancar, Anda mungkin ingin mempelajari tentang: