Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
BERLAKU UNTUK: Pengembang | Dasar | Dasar v2 | Standar | Standar v2 | Premium | Premium v2
API Management menyediakan metrik Azure Monitor untuk mendeteksi penggunaan kapasitas sistem, membantu Anda memecahkan masalah gateway dan membuat keputusan berdasarkan informasi apakah akan menskalakan atau meningkatkan instans API Management untuk mengakomodasi lebih banyak beban.
Artikel ini menjelaskan metrik kapasitas dan perilakunya, menunjukkan cara mengakses metrik kapasitas di portal Azure, dan menyarankan kapan harus mempertimbangkan untuk menskalakan atau meningkatkan instans API Management Anda.
Penting
Artikel ini memperkenalkan cara memantau dan menskalakan instans Azure API Management Anda berdasarkan metrik kapasitas. Namun, ketika instans mencapai kapasitasnya, instans tersebut tidak akan membatasi untuk mencegah kelebihan beban. Sebaliknya, ini akan bertindak seperti server web yang kelebihan beban: peningkatan latensi, koneksi yang terputus, dan kesalahan waktu habis. Klien API harus siap untuk menangani masalah ini seperti yang mereka lakukan dengan layanan eksternal lainnya, misalnya dengan menggunakan kebijakan coba lagi.
Petunjuk
Tim API dapat menggunakan fitur ini di ruang kerja. Ruang kerja menyediakan akses administratif terisolasi ke API dan lingkungan runtime API mereka sendiri.
Prasyarat
Untuk mengikuti langkah-langkah dalam artikel ini, Anda harus memiliki instans API Management di salah satu tingkatan yang mendukung metrik kapasitas. Untuk informasi selengkapnya, lihat Membuat instans Azure API Management.
Metrik kapasitas yang tersedia
Metrik kapasitas yang berbeda tersedia di tingkat layanan v2, tingkat klasik, dan gateway ruang kerja.
Di tingkat v2, metrik berikut tersedia:
Persentase CPU Gateway - Persentase kapasitas CPU yang digunakan oleh unit gateway.
Persentase Memori Gateway - Persentase kapasitas memori yang digunakan oleh unit gateway.
Agregasi yang tersedia untuk metrik ini adalah sebagai berikut.
- Rata-rata - Persentase kapasitas rata-rata yang digunakan di seluruh proses gateway di setiap unit suatu instans API Management.
- Maksimum - Persentase kapasitas dalam proses gateway dengan konsumsi terbesar.
Penggunaan CPU dan memori mengungkapkan konsumsi sumber daya dengan:
- Layanan lapisan data API Management, seperti pemrosesan permintaan, yang dapat mencakup meneruskan permintaan atau menjalankan kebijakan.
- Layanan bidang manajemen API Management, seperti tindakan manajemen yang diterapkan melalui portal Microsoft Azure atau Azure Resource Manager, atau beban yang berasal dari portal pengembang.
- Proses sistem operasi yang dipilih, termasuk proses yang melibatkan biaya handshake TLS pada koneksi baru.
- Pembaruan platform, seperti pembaruan OS pada sumber daya komputasi yang mendasari instans.
- Jumlah API-API yang diterapkan, terlepas dari aktivitas, yang dapat menghabiskan kapasitas tambahan.
Perilaku metrik kapasitas
Dalam metrik kapasitas kehidupan nyata dapat dipengaruhi oleh banyak variabel, misalnya:
- pola koneksi (koneksi baru berdasarkan permintaan versus menggunakan kembali koneksi yang ada)
- ukuran permintaan dan respons
- kebijakan yang dikonfigurasi pada setiap API atau jumlah klien yang mengirimkan permintaan.
Semakin kompleks operasi pada permintaan, semakin tinggi konsumsi kapasitas. Misalnya, kebijakan transformasi yang kompleks mengkonsumsi lebih banyak CPU daripada penerusan permintaan sederhana. Respons layanan backend yang lambat juga meningkatkannya.
Penting
Metrik kapasitas bukan ukuran langsung dari jumlah permintaan yang sedang diproses.
Metrik kapasitas juga dapat melonjakan secara terputus-putus atau lebih besar dari nol bahkan jika tidak ada permintaan yang diproses. Itu terjadi karena tindakan spesifik sistem atau platform dan tidak boleh dipertimbangkan ketika memutuskan apakah akan meningkatkan skala instans.
Meskipun metrik kapasitas dirancang untuk menampilkan masalah dengan instans API Management Anda (atau gateway ruang kerja), ada kasus ketika masalah tidak akan tercermin dalam perubahan dalam metrik ini. Selain itu, metrik kapasitas rendah tidak selalu berarti bahwa instans API Management Anda tidak mengalami masalah apa pun.
Gunakan portal Azure untuk memeriksa metrik kapasitas
Akses metrik di portal untuk memahami berapa banyak kapasitas yang digunakan dari waktu ke waktu.
- Navigasikan ke instans API Management Anda di portal Microsoft Azure.
- Di menu sebelah kiri, di bagian Pemantauan, pilih Metrik.
- Pilih metrik Persentase CPU Gateway atau Persentase Memori dari Gateway dari metrik yang tersedia. Pilih agregasi Rata-rata default atau pilih agregasi Maks untuk melihat penggunaan puncak.
- Pilih jangka waktu yang diinginkan dari bilah atas bagian.
Penting
Saat ini, metrik Kapasitas juga muncul di portal untuk instans di tingkat v2. Namun, ini tidak didukung untuk digunakan dalam tingkat v2 dan menunjukkan nilai 0.
Catatan
Anda dapat mengatur peringatan metrik untuk memberi tahu Anda ketika sesuatu yang tidak terduga terjadi. Misalnya, dapatkan pemberitahuan ketika instans API Management Anda telah melebihi penggunaan CPU atau Memori puncak yang diharapkan selama lebih dari 20 menit.
Gunakan kapasitas untuk penskalaan keputusan
Gunakan metrik kapasitas untuk membuat keputusan apakah akan menskalakan instans API Management (atau gateway ruang kerja) untuk mengakomodasi lebih banyak beban. Berikut ini adalah pertimbangan umumnya:
- Melihat kecenderungan jangka panjang dan rata-rata.
- Mengabaikan lonjakan mendadak yang kemungkinan besar tidak terkait dengan peningkatan beban (lihat bagian Perilaku metrik kapasitas untuk penjelasan).
- Sebagai aturan umum, tingkatkan atau skalakan instans Anda ketika nilai metrik kapasitas melebihi 60% - 70% untuk jangka waktu yang lama (misalnya, 30 menit). Nilai yang berbeda mungkin bekerja lebih baik untuk layanan atau skenario Anda.
- Jika instans atau gateway ruang kerja Anda dikonfigurasi hanya dengan 1 unit, tingkatkan atau skalakan saat nilai metrik kapasitas melebihi 40% untuk jangka panjang. Rekomendasi ini didasarkan pada kebutuhan untuk memesan kapasitas pembaruan OS tamu di platform layanan yang mendasarinya.
- Gunakan diagnostik yang tersedia untuk memantau waktu respons panggilan API. Pertimbangkan untuk menyesuaikan ambang penskalaan jika Anda melihat waktu respons yang terdegradasi dengan peningkatan nilai metrik kapasitas.
Petunjuk
Jika Anda dapat memperkirakan lalu lintas sebelumnya, uji instans API Management atau gateway ruang kerja pada beban kerja yang Anda harapkan. Anda dapat meningkatkan beban permintaan secara bertahap dan memantau nilai metrik kapasitas yang sesuai dengan beban puncak Anda. Ikuti langkah-langkah dari bagian sebelumnya untuk menggunakan portal Microsoft Azure untuk memahami berapa banyak kapasitas yang digunakan pada waktu tertentu.
Penting
Saat menentukan aturan penskalaan otomatis, pastikan untuk menghindari peningkatan dan penurunan penskalaan otomatis yang akan menyebabkan perulangan skala masuk/skala keluar. Untuk mempelajari lebih lanjut, sebaiknya baca panduan Azure Monitor Autoscale seputar flapping.