Kapasitas instans Azure API Management

Kapasitas adalah metrik Azure Monitor yang paling penting untuk membuat keputusan yang tepat apakah akan menskalakan atau meningkatkan instans API Management untuk mengakomodasi lebih banyak beban. Konstruksinya kompleks dan memaksakan perilaku tertentu.

Artikel ini menjelaskan apa itu kapasitas dan bagaimana perilakunya. Ini menunjukkan cara mengakses metrik kapasitas di portal Microsoft Azure dan menyarankan kapan harus mempertimbangkan penskalaan atau peningkatan instans API Management Anda.

Penting

Artikel ini membahas bagaimana Anda dapat memantau dan menskalakan instans Azure API Management Anda berdasarkan metrik kapasitasnya. Namun, sama pentingnya untuk memahami apa yang terjadi ketika instans API Management individu benar-benar telah mencapai kapasitasnya. Azure API Management tidak akan menerapkan pembatasan tingkat layanan apa pun untuk mencegah kelebihan fisik instans. Ketika sebuah instans mencapai kapasitas fisiknya, ia akan berperilaku serupa dengan server web yang kelebihan beban yang tidak dapat memproses permintaan masuk: latensi akan meningkat, koneksi akan terputus, kesalahan waktu habis akan terjadi, dan seterusnya. Ini berarti bahwa klien API harus siap untuk menangani kemungkinan ini seperti yang mereka lakukan dengan layanan eksternal lainnya (misalnya, dengan menerapkan kebijakan coba lagi).

Prasyarat

Untuk mengikuti langkah-langkah dalam artikel ini, Anda harus memiliki:

Ketersediaan

Penting

Fitur ini tersedia di tingkat Premium, Standar, Dasar, dan Pengembang API Management.

Apa itu kapasitas

Diagram yang menjelaskan metrik Kapasitas.

Kapasitas adalah indikator beban pada instans API Management. Hal ini mencerminkan penggunaan sumber daya (CPU, memori) dan panjang antrean jaringan. Penggunaan CPU dan memori mengungkapkan konsumsi sumber daya dengan:

  • Layanan bidang data API Management, seperti pemrosesan permintaan, yang dapat mencakup permintaan penerusan atau menjalankan kebijakan.
  • Layanan bidang manajemen API Management, seperti tindakan manajemen yang diterapkan melalui portal Microsoft Azure atau Azure Resource Manager, atau beban yang berasal dari portal pengembang.
  • Proses sistem operasi yang dipilih, termasuk proses yang melibatkan biaya handshake TLS pada koneksi baru.
  • Pembaruan platform, seperti pembaruan OS pada sumber daya komputasi yang mendasar untuk instans.

Total kapasitas adalah rata-rata nilainya sendiri dari setiap unit instans API Management.

Meskipun metrik kapasitas dirancang untuk menampakkan masalah pada instans API Management Anda, ada beberapa kasus ketika masalah tidak akan tercermin dalam perubahan metrik kapasitas.

Perilaku metrik kapasitas

Karena konstruksinya, dalam kehidupan nyata kapasitas dapat terpengaruh oleh banyak variabel, misalnya:

  • pola koneksi (koneksi baru berdasarkan permintaan versus menggunakan kembali koneksi yang ada)
  • ukuran permintaan dan respons
  • kebijakan yang dikonfigurasi pada setiap API atau jumlah klien yang mengirimkan permintaan.

Semakin kompleks operasi pada permintaan, semakin tinggi konsumsi kapasitas akan terjadi. Misalnya, kebijakan transformasi yang kompleks mengkonsumsi lebih banyak CPU daripada penerusan permintaan sederhana. Respons layanan backend yang lambat juga akan meningkatkannya.

Penting

Kapasitas bukanlah ukuran langsung dari jumlah permintaan yang sedang diproses.

Lonjakan metrik kapasitas

Kapasitas juga dapat melonjak terputus-putus atau lebih besar dari nol meskipun tidak ada permintaan yang sedang diproses. Itu terjadi karena tindakan sistem atau platform-spesifik dan tidak boleh dipertimbangkan ketika memutuskan apakah akan menskalakan instans.

Metrik kapasitas rendah tidak selalu berarti bahwa instans API Management Anda tidak mengalami masalah apa pun.

Menggunakan portal Microsoft Azure untuk memeriksa kapasitas

Metrik kapasitas

  1. Navigasikan ke instans API Management Anda di portal Microsoft Azure.

  2. Di menu sebelah kiri, di bagian Pemantauan, pilih Metrik.

  3. Pilih metrik Kapasitas dari metrik yang tersedia dan biarkan agregasi Rata-rata default.

    Tip

    Jika Anda telah menyebarkan instans ke beberapa lokasi, Anda harus selalu melihat perincian metrik kapasitas per lokasi untuk menghindari interpretasi yang salah.

  4. Untuk membagi metrik menurut lokasi, dari bagian di atas, pilih Terapkan pemisahan lalu pilih Lokasi.

  5. Pilih jangka waktu yang diinginkan dari bilah atas bagian.

    Anda dapat mengatur peringatan metrik untuk memberi tahu Anda ketika sesuatu yang tidak terduga terjadi. Misalnya, dapatkan notifikasi saat instans API Management Anda telah melebihi kapasitas puncak yang diharapkan selama lebih dari 20 menit.

    Tip

    Anda dapat mengonfigurasi peringatan untuk memberi tahu Anda saat layanan Anda kehabisan kapasitas atau menggunakan penskalaan otomatis Azure Monitor untuk menambahkan unit Azure API Management secara otomatis. Operasi penskalaan dapat memakan waktu sekitar 30 menit, jadi Anda harus merencanakan aturan Anda sesuai.
    Hanya penskalaan lokasi utama yang diperbolehkan.

Gunakan kapasitas untuk penskalaan keputusan

Kapasitas adalah metrik untuk membuat keputusan apakah akan menskalakan instans API Management untuk mengakomodasi lebih banyak beban. Berikut ini adalah pertimbangan umumnya:

  • Melihat kecenderungan jangka panjang dan rata-rata.
  • Mengabaikan lonjakan mendadak yang kemungkinan besar tidak terkait dengan peningkatan beban (lihat bagian Perilaku metrik kapasitas untuk penjelasan).
  • Sebagai aturan umum, tingkatkan atau skalakan instans Anda ketika nilai kapasitas melebihi 60% - 70% untuk jangka waktu yang lama (misalnya, 30 menit). Nilai yang berbeda mungkin bekerja lebih baik untuk layanan atau skenario Anda.
  • Jika instans Anda dikonfigurasi hanya dengan 1 unit, tingkatkan atau skalakan instans Anda saat nilai kapasitas melebihi 40% untuk jangka waktu yang lama. Rekomendasi ini didasarkan pada kebutuhan untuk memesan kapasitas pembaruan OS tamu di platform layanan yang mendasarinya.

Tip

Jika Anda dapat memperkirakan lalu lintas Anda sebelumnya, uji instans API Management Anda pada beban kerja yang Anda harapkan. Anda dapat meningkatkan beban permintaan pada penyewa Anda secara bertahap dan memantau nilai metrik kapasitas apa yang sesuai dengan beban puncak Anda. Ikuti langkah-langkah dari bagian sebelumnya untuk menggunakan portal Microsoft Azure untuk memahami berapa banyak kapasitas yang digunakan pada waktu tertentu.

Langkah berikutnya