Mengelola dan meningkatkan kuota sumber daya menggunakan Microsoft Foundry (proyek Foundry)

Kuota memberikan fleksibilitas untuk secara aktif mengelola alokasi batas tarif di seluruh penyebaran dalam langganan Anda. Azure menetapkan kuota per langganan, per wilayah, dan per model dalam satuan token per menit (TPM). Jenis penyebaran yang berbeda, seperti Standar dan Disediakan, memiliki mekanisme kuota yang berbeda. Untuk detail lengkap tentang batas default dan tingkat kuota, lihat kuota dan batas Azure OpenAI.

Artikel ini menjelaskan proses pengelolaan kuota untuk Model Foundry Microsoft Anda yang disebarkan dalam proyek Foundry, termasuk cara melihat alokasi saat ini dan peningkatan permintaan.

Prasyarat

  • Langganan Azure. Buat satu secara gratis.
  • Proyek Foundry.
  • Peran Pembaca Data Penggunaan Cognitive Services di tingkat langganan, untuk melihat alokasi kuota.
  • Peran Pemilik atau Kontributor pada langganan, untuk meminta penambahan kuota.
  • Peran Kontributor Cognitive Services dikombinasikan dengan Pembaca Penggunaan Cognitive Services, untuk mengedit alokasi kuota di portal Foundry.

Kuota bersama Foundry

Foundry menyediakan kumpulan kuota bersama yang dapat digunakan pengguna yang berbeda di berbagai wilayah secara bersamaan. Bergantung pada ketersediaan, pengguna dapat mengakses kuota untuk sementara waktu dari kumpulan bersama dan menggunakan kuota untuk melakukan pengujian untuk waktu yang terbatas. Durasi waktu tertentu tergantung pada kasus penggunaan. Dengan menggunakan kuota untuk sementara waktu dari kumpulan kuota, Anda tidak perlu lagi mengajukan tiket dukungan untuk penambahan kuota jangka pendek atau menunggu permintaan kuota Anda disetujui sebelum Anda dapat melanjutkan beban kerja Anda.

Anda dapat menggunakan kumpulan kuota bersama untuk menguji inferensi untuk Model Foundry dari katalog model. Gunakan kuota bersama hanya untuk membuat titik akhir pengujian sementara, bukan titik akhir produksi. Untuk titik akhir dalam produksi, Anda harus meminta kuota khusus. Penagihan untuk kuota bersama berbasis penggunaan.

Menampilkan dan meminta kuota di portal Foundry

Gunakan kuota untuk mengelola alokasi kuota model antara beberapa proyek Foundry dalam langganan yang sama.

  1. Masuk ke Microsoft Foundry. Pastikan tombol New Foundry aktif. Langkah-langkah ini mengacu pada Foundry (baru).

  2. Proyek membantu mengatur pekerjaan Anda. Proyek yang sedang Anda kerjakan muncul di sudut kiri atas. Jika Anda ingin membuat proyek baru, pilih nama proyek, lalu Buat proyek baru.

  3. Pilih Operasikan dari navigasi kanan atas.

  4. Pilih Kuota dari panel kiri untuk masuk ke panel Kuota . Tampilan kuota memiliki dua tab:

    • Token per menit — Melihat dan mengelola alokasi kuota token per menit (TPM) untuk penyebaran standar.
    • Unit throughput yang disediakan — Melihat dan mengelola alokasi unit throughput (PTU) yang disediakan untuk penyebaran yang disediakan, termasuk alat estimasi kapasitas.
  5. Pilih salah satu penyebaran dalam daftar untuk membuka panel detailnya di sisi kanan. Panel rincian menampilkan alokasi kuota penyebaran saat ini, penggunaan, dan penyebaran terkait.

  6. Pada panel detail penyebaran, buka bagian Penyebaran terafiliasi menggunakan kuota bersama . Pilih ikon pensil di kolom Tindakan tabel untuk mengedit alokasi kuota untuk penyebaran dan membebaskan kuota yang tidak digunakan atau meningkatkan alokasi sesuai kebutuhan.

  7. Pilih tombol Minta kuota di sudut kanan atas untuk meminta peningkatan kuota untuk jenis penyebaran standar.

Catatan

Setelah Anda mengedit alokasi kuota atau mengirimkan permintaan, izinkan hingga 15 menit agar perubahan disebarluaskan. Refresh halaman Kuota untuk memverifikasi alokasi yang diperbarui.

Pemecahan masalah

Jika Anda mengalami masalah saat melihat atau meminta kuota, coba solusi berikut:

Masalah Solusi
Halaman kuota kosong atau tidak menunjukkan alokasi Verifikasi bahwa Anda memiliki peran Pembaca Penggunaan Cognitive Services di tingkat langganan. Periksa apakah Anda menampilkan langganan yang benar di portal.
Tombol kuota permintaan dinonaktifkan Verifikasi bahwa Anda memiliki peran Pemilik atau Kontributor pada langganan. Beberapa kombinasi model dan wilayah mungkin tidak mendukung peningkatan kuota.
Perubahan kuota tidak tercermin setelah persetujuan Perubahan kuota dapat memakan waktu hingga 15 menit untuk disebarluaskan. Segarkan halaman Kuota. Jika masalah berlanjut setelah 24 jam, hubungi Azure support.
Tidak dapat menemukan kuota untuk model tertentu Periksa ketersediaan regional. Tidak semua model tersedia di semua wilayah. Lihat Dukungan wilayah.