Batas pembatasan komputasi
Berlaku untuk: ✔️ Mesin virtual Linux ✔️ Mesin virtual Windows ✔️ Set skala fleksibel ✔️ Set skala seragam
Microsoft Compute menerapkan mekanisme pembatasan untuk membantu performa keseluruhan layanan dan memberikan pengalaman yang konsisten kepada pelanggan. Permintaan API yang melebihi batas maksimum yang diizinkan dibatasi dan pengguna mendapatkan kesalahan HTTP 429. Semua kebijakan pembatasan komputasi diterapkan berdasarkan per wilayah.
Bagaimana cara kerja kebijakan pembatasan?
Microsoft Compute menerapkan kebijakan pembatasan yang membatasi jumlah permintaan API yang dibuat per sumber daya dan per langganan per wilayah per menit. Jika jumlah permintaan API melebihi batas ini, permintaan akan dibatasi. Berikut cara kerja batas ini:
Per Batas Sumber Daya – Setiap sumber daya, seperti komputer virtual (VM), memiliki batas khusus untuk permintaan API. Misalnya, mari kita asumsikan bahwa pengguna membuat 10 VM dalam langganan. Pengguna dapat memanggil hingga 12 permintaan pembaruan untuk setiap VM dalam satu menit. Jika pengguna melebihi batas untuk VM, permintaan API akan dibatasi. Batas ini memastikan bahwa beberapa sumber daya tidak menggunakan batas tingkat langganan dan membatasi sumber daya lain.
Batas Langganan – Selain batas sumber daya, ada batas menyeluruh pada jumlah permintaan API di semua sumber daya dalam langganan. Setiap permintaan API di luar batas ini dibatasi, terlepas dari apakah batas untuk sumber daya individu telah tercapai. Misalnya, mari kita asumsikan bahwa pengguna memiliki 200 VM dalam langganan. Meskipun pengguna berhak memulai hingga 12 permintaan VM Pembaruan untuk setiap VM, batas agregat untuk permintaan Update VM API dibatasi pada 1500 per menit. Setiap permintaan Api VM Pembaruan untuk langganan yang melebihi 1500 dibatasi.
Bagaimana Microsoft Compute menentukan batas pembatasan?
Untuk menentukan batas untuk setiap sumber daya dan langganan, Microsoft Compute menggunakan Algoritma Wadah Token. Algoritma ini membuat wadah untuk setiap batas dan menyimpan sejumlah token tertentu di setiap wadah. Jumlah token dalam wadah mewakili batas pembatasan pada menit tertentu.
Pada awal jendela pembatasan, saat sumber daya dibuat, wadah diisi ke Kapasitas Maksimumnya. Setiap permintaan API yang dimulai oleh pengguna menggunakan satu token. Ketika jumlah token menipis menjadi nol, permintaan API berikutnya dibatasi. Bucket diisi ulang dengan token baru setiap menit dengan tarif konsisten yang disebut Bucket Refill Rate untuk sumber daya dan langganan.
Misalnya: Mari kita pertimbangkan 'kebijakan pembatasan untuk API Pembaruan VM' yang menetapkan Laju Isi Ulang Bucket empat token per menit, dan Kapasitas Bucket Maksimum 12 token. Pengguna memanggil permintaan Update VM API untuk komputer virtual (VM) sesuai tabel berikut. Awalnya, wadah diisi dengan 12 token di awal jendela pembatasan. Pada menit keempat, pengguna menggunakan semua 12 token, membiarkan wadah kosong. Pada menit kelima, wadah diisi ulang dengan empat token baru sesuai dengan Bucket Refill Rate. Jadi, empat permintaan API dapat dibuat pada menit kelima, sementara Microsoft Compute membatasi satu permintaan API karena token yang tidak mencukupi.
(min) | 1st | Ke-2 | Ke-3 | Ke-4 | Ke-5 | Ke-6 |
---|---|---|---|---|---|---|
Jumlah token di awal (A) | 12 | 12 | 8 | 12 | 4 | 4 |
Permintaan per menit (B) | 0 | 8 | 0 | 13 | 5 | 0 |
Permintaan yang dibatasi (C) | 0 | 0 | 0 | 1 | 1 | 0 |
Token yang tersisa pada akhir periode D = Maks(A-B, 0) |
12 | 4 | 8 | 0 | 0 | 4 |
Proses serupa diikuti untuk menentukan batas pembatasan di tingkat langganan. Bagian berikut merinci laju isi ulang Bucket dan kapasitas wadah maksimum yang digunakan untuk menentukan batas pembatasan untuk Komputer Virtual, Virtual Machine Scale Sets, dan Virtual Machines Scale Set VM.
Batas pembatasan untuk Komputer Virtual
Permintaan API untuk Komputer Virtual dikategorikan ke dalam tujuh kebijakan yang berbeda. Setiap kebijakan memiliki batasnya sendiri, tergantung pada seberapa intensif sumber daya permintaan API berdasarkan kebijakan tersebut. Tabel berikut berisi daftar komprehensif kebijakan ini, REST API yang sesuai, dan batas pembatasan masing-masing:
Kategori kebijakan | REST API | Tingkat Sumber Daya | Tingkat Sumber Daya | Tingkat langganan | Tingkat langganan |
---|---|---|---|---|---|
Laju isi ulang wadah (Per Min) | Kapasitas Bucket Maksimum (Per Menit) |
Laju isi ulang wadah (Per Menit) |
Kapasitas Bucket Maksimum (Per Menit) |
||
Letakkan VM (Buat VM baru) |
Buat | 4 | 12 | 500 | 1.500 |
Memperbarui VM (Perbarui VM yang ada) |
Pembaruan Terapkan ulang Mulai Ulang Matikan Daya Mulai Generalisasi Konversi Ke Disk Terkelola Menyebarkan ulang Lakukan Pemeliharaan Tangkap Jalankan Perintah Buat atau Perbarui Ekstensi - Pembaruan Ekstensi - Hapus Citrakan ulang Pembaruan Jalankan Perintah - Perbarui Jalankan Perintah - Hapus Jalankan Perintah - Buat Atau Perbarui |
4 | 12 | 500 | 1.500 |
Menghapus komputer virtual (Hapus VM) |
Hapus Simulasi Pengeluaran Batalkan Alokasi |
4 | 12 | 500 | 1.500 |
Low Cost Get VM (Dapatkan informasi tentang VM tunggal) |
Dapatkan Tampilan Instans Ekstensi - Dapatkan Cantumkan Ukuran yang Tersedia Mengambil Data Diagnostik Boot Jalankan Perintah - Get By Virtual Machine Jalankan Perintah - Daftar Menurut Komputer Virtual |
12 | 36 | 8.000 | 24.000 |
Biaya Tinggi Dapatkan VM1 (Dapatkan informasi tentang beberapa VM) |
Daftar Daftar Semua Daftar Menurut Lokasi |
NA | NA | 300 | 900 |
Dapatkan Operasi (Dapatkan informasi tentang operasi VM asinkron) |
Status operasi asinkron | 15 | 45 | 5\.000 | 15.000 |
Operasi Patch Tamu VM (Menilai &menginstal patch tamu) |
Menilai Patch Menginstal Patch |
2 | 6 | 200 | 600 |
1 Hanya kebijakan tingkat langganan yang berlaku.
Batas pembatasan untuk Virtual Machine Scale Sets
Permintaan API untuk Virtual Machine Scale Set (Uniform & Flex) dikategorikan ke dalam 5 kebijakan yang berbeda. Setiap kebijakan memiliki batasnya sendiri, tergantung pada seberapa intensif sumber daya permintaan API berdasarkan kebijakan tersebut. Kebijakan ini berlaku untuk mode orkestrasi Flex dan Uniform. Tabel berikut berisi daftar komprehensif kebijakan ini, REST API yang sesuai, dan batas pembatasan masing-masing:
Kategori kebijakan | REST API | Tingkat Sumber Daya | Tingkat Sumber Daya | Tingkat langganan | Tingkat langganan |
---|---|---|---|---|---|
Laju isi ulang wadah (Per Menit) |
Kapasitas Bucket Maksimum (Per Menit) |
Laju isi ulang wadah (Per Min) | Kapasitas Bucket Maksimum (Per Menit) |
||
Put (Buat set skala baru) |
Buat | 4 | 12 | 125 | 375 |
Pembaruan (Perbarui set skala yang ada) |
Pembaruan Mulai2 Mulai ulang2 Sebarkan ulang2 Melakukan Pemeliharaan2 Reimage2 Gambar ulang Semua2 Buat atau Perbarui Peningkatan Bergulir - Batal Ekstensi - Buat Ekstensi - Pembaruan Ekstensi - Hapus Memaksa Platform Service Fabric Pemulihan Memperbarui Domain Walk Mengonversi Ke Grup Penempatan Tunggal Mengatur Status Layanan Orkestrasi |
4 | 12 | 500 | 1.500 |
Hapus (Hapus set skala) |
Hapus Matikan2 Batalkan Alokasi |
4 | 12 | 175 | 525 |
Biaya Rendah Dapatkan (Dapatkan informasi tentang set skala tunggal) |
Dapatkan Daftar Sku Peningkatan Bergulir - Dapatkan Terbaru Dapatkan Riwayat Peningkatan OS |
12 | 36 | 800 | 2.400 |
Biaya Tinggi Dapatkan (Dapatkan informasi intensif sumber daya) |
Dapatkan Tampilan Instans Daftar2 Daftar Semua2 Daftar Menurut Lokasi2 |
10 | 30 | 360 | 1,080 |
2 Hanya kebijakan tingkat langganan yang berlaku.
Batas pembatasan untuk Virtual Machine Scale Set Virtual Machines
Permintaan API untuk Virtual Machine Scale Set Virtual Machines dikategorikan ke dalam 3 kebijakan yang berbeda. Setiap kebijakan memiliki batasnya sendiri, tergantung pada seberapa intensif sumber daya permintaan API berdasarkan kebijakan tersebut. Tabel berikut berisi daftar komprehensif kebijakan ini, REST API yang sesuai, dan batas pembatasan masing-masing:
Kategori kebijakan | REST API | Tingkat Sumber Daya | Tingkat Sumber Daya | Tingkat langganan | Tingkat langganan |
---|---|---|---|---|---|
Laju isi ulang wadah (Per Menit) |
Kapasitas Bucket Maksimum (Per Menit) |
Laju isi ulang wadah (Per Menit) |
Kapasitas Bucket Maksimum (Per Menit) |
||
Memperbarui VM set skala (Perbarui VM yang ada dalam set skala) |
Mulai Hidupkan Ulang Citrakan ulang ReimageAll Pembaruan SimulateEviction Ekstensi- Buat Atau Perbarui RunCommands - Buat Atau Perbarui RunCommands - Pembaruan |
4 | 12 | 500 | 1.500 |
Menghapus VM set skala (Hapus VM set skala) |
Hapus PowerOff Batalkan Alokasi Ekstensi- Hapus RunCommands - Hapus |
4 | 12 | 500 | 1.500 |
Mendapatkan VM set skala (Dapatkan informasi tentang VM set skala) |
Dapatkan Tampilan GetInstance Ekstensi- Dapatkan RunCommands - Dapatkan Mengambil Data Diagnostik RetrieveBoot |
12 | 36 | 2.000 | 6.000 |
Panduan pemecahan masalah
Jika pengguna masih menghadapi tantangan karena pembatasan Komputasi, lihat Pemecahan masalah kesalahan pembatasan di Azure - Virtual Machines. Ini memiliki detail tentang cara memecahkan masalah pembatasan, dan praktik terbaik untuk menghindari pembatasan.
Tanya Jawab Umum
Apakah ada tindakan yang diperlukan dari pengguna?
Pengguna tidak perlu mengubah apa pun dalam konfigurasi atau beban kerja mereka. Semua API yang ada terus berfungsi apa adanya.
Manfaat apa yang diberikan kebijakan pembatasan?
Kebijakan pembatasan menawarkan beberapa manfaat:
Semua sumber daya Komputasi memiliki jendela seragam 1 menit. Pengguna dapat berhasil memanggil panggilan API, 1 menit setelah dibatasi.
Tidak ada sumber daya tunggal yang dapat menggunakan semua batas di bawah langganan karena batasan ditentukan pada tingkat sumber daya.
Microsoft Compute memperkenalkan algoritma baru, Algoritma Wadah Token, untuk menentukan batas. Algoritma ini menyediakan buffer tambahan kepada pelanggan, sekaligus membuat jumlah permintaan API yang tinggi.
Apakah pelanggan mendapatkan pemberitahuan saat mereka akan mencapai batas pembatasan mereka?
Sebagai bagian dari setiap respons, Microsoft Compute mengembalikan x-ms-ratelimit-remaining-resource yang dapat digunakan untuk menentukan batas pembatasan terhadap kebijakan. Daftar kebijakan pembatasan yang berlaku dikembalikan sebagai respons terhadap header informasi laju panggilan.