Menskalakan Application Gateway v2 dan WAF v2

Application Gateway dan WAF dapat dikonfigurasi untuk menskala dalam dua mode:

  • Autoscaling - Dengan autoscaling diaktifkan, Application Gateway dan WAF v2 SKU menskalakan keluar atau masuk berdasarkan persyaratan lalu lintas aplikasi. Mode ini menawarkan elastisitas yang lebih baik untuk aplikasi Anda, sehingga tidak perlu menebak ukuran gateway aplikasi atau jumlah instans. Mode ini juga memungkinkan Anda menghemat biaya dengan tidak memerlukan gateway untuk berjalan pada kapasitas yang disediakan puncak untuk beban lalu lintas maksimum yang diharapkan. Anda harus menentukan jumlah instans minimum dan maksimum (opsional). Kapasitas minimum memastikan bahwa Application Gateway dan WAF v2 tidak berada di bawah jumlah instans minimum yang ditentukan, bahkan tanpa lalu lintas. Setiap instans kira-kira setara dengan 10 Unit Kapasitas yang dipesan lebih banyak. Nol menandakan tidak ada kapasitas yang dipesan dan murni bersifat autoscaling. Anda juga dapat menentukan jumlah instans maksimum secara opsional untuk memastikan Application Gateway tidak menskalakan melebihi jumlah instans yang ditentukan. Anda hanya ditagih untuk jumlah lalu lintas yang dilayani oleh Gateway. Jumlah instans dapat berkisar antara 0 hingga 125. Nilai default untuk jumlah instans maksimum adalah 10 jika tidak ditentukan.

Catatan

Jika jumlah instans maksimum diperbarui ke nilai yang kurang dari jumlah instans saat ini, pengaturan baru tidak akan langsung berpengaruh. Maksimum yang baru diperbarui hanya akan diberlakukan setelah operasi penyempurnaan skala membawa jumlah saat ini di bawah jumlah maksimum yang baru diperbarui. Jika operasi penyempitan skala tidak terjadi karena skala autoscaling dalam ambang tidak terpenuhi, pengaturan maksimum baru tidak akan diterapkan.

  • Manual - Anda juga dapat memilih Mode manual di mana gateway tidak diskalakan otomatis. Dalam mode ini, jika ada lebih banyak lalu lintas daripada yang dapat ditangani Application Gateway atau WAF, itu dapat mengakibatkan kehilangan lalu lintas. Dengan mode manual, Anda harus menentukan jumlah instans. Jumlah instans dapat bervariasi, mulai 1 sampai 125.

Catatan

Mode penskalaan ini tidak berlaku untuk Application Gateway Basic. Application Gateway Basic secara otomatis menskalakan hingga perkiraan 200 koneksi per detik, berdasarkan sertifikat TLS kunci RSA 2048-bit.

Autoscaling dan Ketersediaan Tinggi

Azure Application Gateways selalu sebarkan dengan ketersediaan yang tinggi. Layanan ini terdiri dari beberapa instans yang dibuat sebagai dikonfigurasi jika penskalaan otomatis dinonaktifkan, atau diperlukan oleh beban aplikasi jika penskalaan otomatis diaktifkan. Dari perspektif pengguna, Anda tidak selalu memiliki visibilitas ke masing-masing instans, tetapi hanya ke dalam layanan Application Gateway secara keseluruhan. Jika instans tertentu memiliki masalah dan berhenti berfungsi, Azure Application Gateway secara transparan membuat instans baru.

Bahkan jika Anda mengonfigurasi autoscaling dengan nol instans minimum, layanan masih sangat tersedia, yang selalu disertakan dengan harga tetap.

Namun, membuat instans baru dapat memakan waktu sekitar enam atau tujuh menit. Jika Anda tidak ingin memiliki waktu henti ini, Anda dapat mengonfigurasi jumlah instans minimum dua, idealnya dengan dukungan Zona Ketersediaan. Dengan cara ini Anda memiliki setidaknya dua instans di Azure Application Gateway Dalam keadaan normal. Jadi jika salah satu dari mereka memiliki masalah, yang lain mencoba menangani lalu lintas saat instans baru sedang dibuat. Instans Azure Application Gateway dapat mendukung sekitar 10 Unit Kapasitas. Bergantung pada berapa banyak lalu lintas yang biasanya Anda miliki, Anda mungkin ingin mengonfigurasi pengaturan penskalakan otomatis instans minimum Anda ke nilai yang lebih tinggi dari dua.

Untuk peristiwa penyempitan skala, Application Gateway menguras koneksi yang ada selama 5 menit pada instans yang tunduk pada penghapusan. Setelah 5 menit, koneksi yang ada ditutup dan instans dihapus. Setiap koneksi baru selama atau setelah waktu penyempitan skala 5 menit dibuat ke instans lain yang ada di gateway yang sama.

Langkah berikutnya