Failover dan pembaruan patch untuk Azure Cache for Redis

Berlaku untuk: ✅ Azure Cache for Redis

Penting

Azure Cache for Redis mengumumkan garis waktu penghentiannya untuk semua SKU. Sebaiknya pindahkan instans Azure Cache for Redis yang ada ke Azure Managed Redis sesegera mungkin.

Untuk informasi lebih lanjut tentang pengakhiran layanan:

Untuk membangun aplikasi klien yang tangguh dan sukses, sangat penting untuk memahami failover di layanan Azure Cache for Redis. Failover dapat menjadi bagian dari operasi manajemen yang direncanakan, atau mungkin disebabkan oleh kegagalan perangkat keras atau jaringan yang tidak direncanakan. Penggunaan umum failover cache terjadi ketika layanan manajemen memperbarui Azure Cache for Redis binaries.

Dalam artikel ini, Anda menemukan informasi ini:

Apa itu failover?
Bagaimana failover terjadi selama patching.
Cara membangun aplikasi klien yang tangguh.

Apa itu failover?

Mari kita mulai dengan gambaran umum failover untuk Azure Cache for Redis.

Ikhtisar singkat arsitektur cache

Cache dibangun dari beberapa komputer virtual dengan alamat IP terpisah dan privat. Setiap mesin virtual, juga dikenal sebagai node, terhubung ke pengimbang muatan bersama dengan satu alamat IP virtual. Setiap simpul menjalankan proses server Redis dan dapat diakses dengan menggunakan nama host dan port Redis. Setiap simpul dianggap sebagai simpul utama atau replika. Ketika aplikasi klien terhubung ke cache, lalu lintasnya melewati load balancer ini dan secara otomatis dirutekan ke simpul utama.

Dalam cache Dasar, simpul tunggal selalu menjadi yang utama. Dalam cache Standar atau Premium, ada dua simpul: satu dipilih sebagai yang utama dan yang lainnya adalah replika. Karena cache Standar dan Premium memiliki beberapa simpul, satu simpul mungkin tidak tersedia sementara yang lain terus memproses permintaan. Cache berkluster terbuat dari banyak pecahan, masing-masing dengan node primer dan replika yang berbeda. Satu pecahan mungkin tidak berfungsi sementara yang lain tetap tersedia.

Nota

Cache Dasar tidak memiliki beberapa simpul dan tidak menawarkan perjanjian tingkat layanan (SLA) untuk ketersediaannya. Cache dasar direkomendasikan hanya untuk tujuan pengembangan dan pengujian. Gunakan cache Standar atau Premium dalam penerapan multi-simpul guna meningkatkan ketersediaan.

Penjelasan tentang failover

Failover terjadi ketika node replika mempromosikan dirinya sendiri untuk menjadi node utama, dan node utama lama menutup koneksi yang ada. Setelah node utama kembali berfungsi, ia menyadari perubahan peran dan mendemoskan dirinya sendiri untuk menjadi replika. Kemudian terhubung ke primer baru dan menyinkronkan data. Failover mungkin terencana atau tidak terencana.

Failover yang direncanakan terjadi selama dua waktu berbeda:

Pembaruan sistem, seperti patching Redis atau peningkatan OS.
Operasi manajemen, seperti penskalaan dan reboot.

Karena simpul menerima pemberitahuan terlebih dahulu tentang pembaruan, mereka dapat secara kooperatif menukar peran dan dengan cepat memperbarui penyeimbang beban perubahan. Failover yang direncanakan biasanya selesai dalam waktu kurang dari 1 detik.

Kegagalan yang tidak direncanakan mungkin terjadi karena kegagalan perangkat keras, kegagalan jaringan, atau pemadaman tak terduga lainnya ke simpul utama. Simpul replika mempromosikan dirinya ke primer, tetapi prosesnya membutuhkan waktu lebih lama. Simpul replika harus terlebih dahulu mendeteksi node utamanya tidak tersedia sebelum dapat memulai proses failover. Simpul replika juga harus memverifikasi kegagalan yang tidak direncanakan ini bukan hanya berlangsung sementara atau bersifat lokal, untuk menghindari failover yang tidak diperlukan. Penundaan deteksi ini berarti failover yang tidak direncanakan biasanya selesai dalam waktu 10 hingga 15 detik.

Bagaimana proses patching terjadi?

Layanan Azure Cache for Redis secara teratur memperbarui cache Anda dengan fitur dan perbaikan platform terbaru. Untuk menambal cache, layanan mengikuti langkah-langkah berikut:

Layanan ini menambal simpul replika terlebih dahulu.
Replika yang telah diperbarui secara kooperatif mempromosikan dirinya menjadi pengendali utama. Promosi ini dianggap sebagai failover yang direncanakan.
Node utama sebelumnya melakukan boot ulang untuk mengambil perubahan baru dan muncul kembali sebagai simpul replika.
Simpul replika tersambung ke simpul utama dan menyinkronkan data.
Ketika sinkronisasi data selesai, proses patching berulang untuk node yang tersisa.

Karena patching adalah failover yang direncanakan, simpul replika dengan cepat mempromosikan dirinya untuk menjadi primer. Kemudian, simpul mulai melayani permintaan dan koneksi baru. Cache dasar tidak memiliki simpul replika dan tidak tersedia hingga pembaruan selesai. Setiap pecahan cache berkluster di-patch secara terpisah dan tidak menutup koneksi ke shard lain.

Penting

Simpul diperbarui satu per satu untuk mencegah kehilangan data. Cache dasar akan kehilangan data. Cache terkluster diperbarui satu shard pada satu waktu.

Beberapa cache dalam grup sumber daya dan wilayah yang sama juga di-patch satu per satu. Cache yang berada di grup sumber daya yang berbeda atau wilayah yang berbeda mungkin di-patch secara bersamaan.

Karena sinkronisasi data penuh terjadi sebelum proses berulang, kehilangan data tidak mungkin terjadi saat Anda menggunakan cache Standar atau Premium. Anda dapat lebih melindungi dari kehilangan data dengan mengekspor data dan mengaktifkan persistensi.

Beban cache tambahan

Setiap kali failover terjadi, cache Standar dan Premium perlu mereplikasi data dari satu simpul ke simpul lainnya. Replikasi ini menyebabkan beberapa peningkatan beban dalam memori server dan CPU. Jika instans cache sudah banyak dimuat, aplikasi klien mungkin mengalami peningkatan latensi. Dalam kasus ekstrem, aplikasi klien mungkin menerima pengecualian waktu habis. Untuk membantu mengurangi efek beban yang lebih banyak, konfigurasikan pengaturan cache maxmemory-reserved .

Bagaimana failover memengaruhi aplikasi klien saya?

Aplikasi klien dapat menerima beberapa kesalahan dari Azure Cache For Redis mereka. Jumlah kesalahan yang dilihat oleh aplikasi klien tergantung pada berapa banyak operasi yang tertunda pada koneksi tersebut pada saat failover. Setiap koneksi yang dirutekan melalui simpul yang menutup koneksinya akan mengalami kesalahan.

Banyak pustaka klien dapat melemparkan berbagai jenis kesalahan saat koneksi terputus, termasuk:

Pengecualian waktu habis
Ketidaknormalan koneksi
Pengecualian soket

Jumlah dan jenis pengecualian tergantung pada di mana permintaan berada di jalur kode saat cache menutup koneksinya. Misalnya, operasi yang mengirim permintaan tetapi belum menerima respons ketika failover terjadi mungkin mendapatkan pengecualian waktu habis. Permintaan baru pada objek koneksi tertutup menerima pengecualian koneksi hingga koneksi ulang berhasil terjadi.

Sebagian besar pustaka klien mencoba menyambungkan kembali ke cache jika dikonfigurasi untuk melakukannya. Namun, bug yang tidak terduga kadang-kadang dapat menempatkan objek pustaka ke dalam keadaan yang tidak dapat dipulihkan. Jika kesalahan bertahan lebih lama dari jumlah waktu yang telah dikonfigurasi sebelumnya, objek koneksi harus dibuat ulang. Dalam Microsoft.NET dan bahasa berorientasi objek lainnya, membuat ulang koneksi tanpa memulai ulang aplikasi dapat dicapai dengan menggunakan pola ForceReconnect.

Dapatkah saya diberi tahu sebelum pemeliharaan?

Azure Cache for Redis menerbitkan pemberitahuan pemeliharaan runtime pada saluran publikasi/berlangganan (pub/sub) yang disebut AzureRedisEvents. Banyak pustaka klien Redis populer mendukung berlangganan ke saluran pub/sub. Menerima pemberitahuan dari AzureRedisEvents saluran biasanya merupakan tambahan sederhana untuk aplikasi klien Anda. Untuk informasi selengkapnya tentang peristiwa pemeliharaan, lihat AzureRedisEvents.

Nota

Saluran AzureRedisEvents ini bukan mekanisme yang dapat memberi tahu Anda hari atau jam sebelumnya. Saluran dapat memberi tahu klien tentang peristiwa pemeliharaan server mendatang yang mungkin memengaruhi ketersediaan server. AzureRedisEvents hanya tersedia untuk tingkat Dasar, Standar, dan Premium.

Apa saja pembaruan yang disertakan dalam pemeliharaan?

Pemeliharaan mencakup pembaruan ini:

Pembaruan Redis Server: Setiap pembaruan atau patch biner server Redis.
Pembaruan komputer virtual (VM): Pembaruan apa pun dari komputer virtual yang menghosting layanan Redis. Pembaruan VM mencakup menambal komponen perangkat lunak di lingkungan hosting, memperbarui komponen jaringan, atau menonaktifkannya.

Apakah pemeliharaan muncul di kesehatan layanan di portal Microsoft Azure sebelum patch?

Tidak, pemeliharaan tidak muncul di mana pun di bawah kesehatan layanan di portal atau tempat lain.

Berapa banyak waktu yang dapat saya dapatkan pemberitahuan sebelum pemeliharaan terencana?

Saat menggunakan jalur AzureRedisEvents, Anda akan diberi tahu 15 menit sebelum pemeliharaan dimulai.

Perubahan konfigurasi jaringan klien

Perubahan konfigurasi jaringan sisi klien tertentu dapat memicu Tidak ada koneksi yang tersedia. Perubahan tersebut mungkin mencakup:

Menukar alamat IP virtual aplikasi klien antara slot staging dan slot produksi.
Menskalakan ukuran atau jumlah instans aplikasi Anda.

Perubahan tersebut dapat menyebabkan masalah konektivitas yang biasanya berlangsung kurang dari satu menit. Aplikasi klien Anda mungkin kehilangan koneksinya ke sumber daya jaringan eksternal lainnya, tetapi juga ke layanan Azure Cache for Redis.

Membangun ketahanan

Anda tidak dapat menghindari failover sepenuhnya. Sebagai gantinya, tulis aplikasi klien Anda agar tahan terhadap pemutusan koneksi dan permintaan yang gagal. Sebagian besar pustaka klien secara otomatis terhubung kembali ke titik akhir cache, tetapi hanya sedikit yang mencoba memproses ulang permintaan yang gagal. Tergantung pada skenario aplikasi, mungkin masuk akal untuk menggunakan logika pengulangan dengan penundaan.

Bagaimana cara membuat aplikasi saya tangguh?

Lihat pola desain ini untuk membangun klien tangguh, terutama pemutus sirkuit dan pola coba lagi:

Untuk menguji ketahanan aplikasi klien, gunakan boot ulang sebagai pemicu manual untuk pemutusan koneksi.

Selain itu, kami sarankan Anda menggunakan pembaruan terjadwal untuk memilih saluran pembaruan dan jendela pemeliharaan untuk cache Anda untuk menerapkan patch runtime Redis selama jendela mingguan tertentu. Jendela ini biasanya merupakan periode ketika lalu lintas aplikasi klien rendah, untuk menghindari potensi insiden. Untuk informasi selengkapnya, lihat Memperbarui saluran dan Menjadwalkan pembaruan.

Untuk informasi selengkapnya, lihat Ketahanan koneksi.

Memperbarui saluran dan Menjadwalkan pembaruan
Menguji ketahanan aplikasi dengan menggunakan boot ulang
Konfigurasi reservasi dan kebijakan memori

Saran dan Komentar

Apakah halaman ini membantu?

Last updated on 2025-10-09