Bagikan melalui


Profil beban kerja di Azure Container Apps

Profil beban kerja menentukan jenis dan jumlah sumber daya komputasi dan memori yang tersedia untuk aplikasi kontainer yang disebarkan di lingkungan Azure Container Apps. Anda dapat mengonfigurasi profil yang berbeda agar sesuai dengan berbagai kebutuhan aplikasi Anda.

Jenis profil

Azure Container Apps mendukung tiga jenis profil beban kerja: Konsumsi, Khusus, dan Flex.

Setiap tipe profil menentukan bagaimana aplikasi Anda melakukan penskalaan, tingkat isolasi sumber daya, dan metode penagihan Anda.

  • Profil konsumsi menggunakan arsitektur tanpa server. Aplikasi di profil ini secara otomatis menskalakan masuk dan keluar sesuai permintaan dan secara opsional menskalakan ke nol saat diam. Anda hanya membayar sumber daya yang digunakan aplikasi yang sedang berjalan. Penagihan berorientasi tanpa server juga berlaku untuk GPU tanpa server untuk beban kerja khusus. Karena Anda hanya membayar sumber daya yang digunakan aplikasi Anda, profil Konsumsi sangat cocok untuk aplikasi yang mengalami ledakan besar permintaan atau skenario di mana tingkat beban kerja tidak dapat diprediksi.

  • Profil dedikasi berjalan pada sumber daya komputasi khusus yang direservasi di pool khusus yang didedikasikan Anda sendiri. Anda memilih ukuran dan jenis mesin virtual, menerapkan beberapa aplikasi per profil, dan membayar biaya per instans profil. Profil khusus dapat lebih hemat biaya untuk beban kerja yang stabil dan mendukung tujuan umum, memori yang dioptimalkan, dan kasus penggunaan GPU.

  • Profil fleksibel (pratinjau) memadukan kesederhanaan penagihan dan penyiapan profil Konsumsi dengan banyak karakteristik performa profil Khusus. Profil fleksibel ditagih seperti profil Konsumsi ditambah biaya manajemen khusus, dijalankan di kumpulan komputasi penyewa tunggal, menawarkan jendela pemeliharaan terencana, dan jaringan khusus dan akses ke ukuran replika yang lebih besar. Profil fleksibel memerlukan subnet setidaknya /25. Aplikasi yang berjalan di profil Fleksibel tidak dapat menskalakan ke nol.

Setiap lingkungan Container Apps menyertakan profil Konsumsi default. Anda dapat menambahkan profil GPU Khusus atau Konsumsi dan, jika tersedia, profil Fleksibel untuk memenuhi kebutuhan aplikasi Anda.

Catatan

Profil Fleksibel saat ini hanya tersedia di wilayah berikut: Australia Timur, Brasil Selatan, Kanada Tengah, Kanada Timur, India Tengah, Asia Timur, Jerman Barat Tengah, Korea Tengah, Eropa Utara, Asia Tenggara, Swedia Tengah, UK Barat, US Tengah Barat, dan US Barat 3.

Faktor formulir profil beban kerja

Jenis profil beban kerja yang berbeda menawarkan faktor bentuk yang berbeda seperti tujuan umum, dioptimalkan memori, GPU, atau campuran.

Jenis profil Faktor bentuk Deskripsi Potensi penggunaan
Konsumsi Tujuan umum Secara otomatis ditambahkan ke lingkungan baru dan berjalan pada infrastruktur Konsumsi tanpa server. Aplikasi yang tidak memerlukan persyaratan perangkat keras tertentu.
Konsumsi GPU (Unit Pemrosesan Grafis) GPU tanpa server skala ke nol tersedia di wilayah seperti US Barat, Australia Timur, dan Swedia Tengah. Untuk melihat daftar lengkap wilayah yang tersedia, lihat wilayah yang didukung GPU tanpa server Aplikasi yang memerlukan akselerasi GPU.
Didedikasikan Tujuan umum Profil dengan keseimbangan sumber daya CPU dan memori. Aplikasi yang memerlukan CPU atau memori dalam jumlah yang lebih besar.
Didedikasikan Memori Dioptimalkan Profil dengan peningkatan sumber daya memori untuk data berbasis memori atau model pembelajaran mesin. Aplikasi dengan persyaratan memori tinggi.
Didedikasikan GPU (Unit Pemrosesan Grafis) Profil dengan komputasi berkemampuan GPU hanya tersedia di wilayah tertentu. Profil Terdedikasi yang diaktifkan GPU harus dikonfigurasi saat membuat lingkungan kerja. Aplikasi yang memerlukan akselerasi GPU dan perangkat keras khusus.

Catatan

Saat menggunakan profil berkemampuan GPU, pastikan aplikasi Anda menjalankan cuda versi terbaru.

Rincian Profil

Tabel berikut ini meringkas profil beban kerja yang tersedia menurut jenis profil, mengelompokkan ukuran serupa bersama-sama untuk membantu Anda memutuskan opsi mana yang terbaik untuk Anda. Bidang vCPU dan memori menunjukkan rentang sumber daya di seluruh ukuran profil.

Detail profil konsumsi

Nama profil Rentang vCPU Rentang memori Jenis GPU Wilayah Alokasi
Konsumsi 0.25-4 0,5-8 GiB Semua wilayah yang didukung per replika
Konsumsi-GPU-NC24-A100, Konsumsi-GPU-NC8as-T4 8–24 56–220 GiB NVIDIA T4, A100 Untuk melihat daftar lengkap wilayah yang tersedia, lihat wilayah yang didukung GPU tanpa server per replika

Semua profil konsumsi mendukung skala tanpa server dan ditagih berdasarkan penggunaan setiap replika.

Detil profil khusus

Classification Nama profil Rentang vCPU Rentang memori Jenis GPU Wilayah Alokasi
General Purpose D4, D8, D16, D32 4–32 16–128 GiB None Semua wilayah yang didukung per simpul
Memory Optimized E4, E8, E16, E32 4–32 32–256 GiB None Semua wilayah yang didukung per simpul
Komputasi Rahasia DC4, DC8, DC16, DC32, DC48, DC64, DC96 4-96 16-384 GiB None UAENorth per simpul
GPU (Unit Pemrosesan Grafis) NC24-A100, NC48-A100, NC96-A100 24–96 220–880 GiB A100 US Barat 3, Eropa Utara per simpul

Catatan

Profil khusus yang didedikasikan berkemampuan GPU mengalokasikan kapasitas berdasarkan kasus per kasus. Anda harus mengirimkan tiket dukungan untuk meminta kapasitas yang diperlukan.

Rincian profil fleksibel (pratinjau)

Nama profil Rentang vCPU Rentang memori Wilayah Alokasi
Flexibel 0.25-4 0,5-16 GiB Australia Timur, Brasil Selatan, Kanada Tengah, Kanada Timur, India Tengah, Asia Timur, Jerman Barat Tengah, Korea Tengah, Eropa Utara, Asia Tenggara, Swedia Tengah, UK Barat, US Tengah Barat, US Barat 3 per replika

Konsumsi dan penskalakan sumber daya

Anda dapat membatasi penggunaan memori dan CPU untuk setiap aplikasi dalam profil beban kerja. Karena beberapa aplikasi dapat berbagi satu instans profil, Anda mungkin perlu menyesuaikan pengaturan memori profil untuk memastikan sumber daya yang memadai untuk semua aplikasi.

Perlu diingat bahwa total sumber daya yang tersedia untuk aplikasi Anda sedikit lebih sedikit dari yang dialokasikan dalam profil, karena runtime menyisihkan beberapa sumber daya komputasi. Ketika permintaan meningkat di luar sumber daya yang tersedia, sistem secara otomatis menambahkan instans profil tambahan. Ketika permintaan menurun, sistem menghapus instance. Anda dapat mengontrol penskalakan dengan mengatur jumlah instans minimum dan maksimum. Penagihan didasarkan pada jumlah instans profil yang sedang berjalan.

Jaringan

Lingkungan profil beban kerja mengekspos fitur jaringan tambahan, seperti rute yang ditentukan pengguna, untuk mengamankan lalu lintas masuk dan keluar. Lihat dokumentasi jaringan untuk detailnya.

Langkah berikutnya