Azure OpenAI Hizmeti kotaları ve sınırları
Bu makale, Azure AI hizmetlerinde Azure OpenAI için kotaların ve sınırların ayrıntılı bir açıklamasını ve hızlı başvuruyu içerir.
Kotalar ve limitler başvurusu
Aşağıdaki bölümlerde, Azure OpenAI için geçerli olan varsayılan kotalar ve sınırlar için hızlı bir kılavuz sağlanır:
Sınır Adı | Sınır Değeri |
---|---|
Azure aboneliği başına bölge başına OpenAI kaynakları | 30 |
Varsayılan DALL-E 2 kota sınırları | 2 eşzamanlı istek |
Varsayılan DALL-E 3 kota sınırları | 2 kapasite birimi (dakikada 6 istek) |
Varsayılan Fısıltı kota sınırları | Dakikada 3 istek |
İstek başına en fazla istem belirteci | Modele göre değişir. Daha fazla bilgi için bkz. Azure OpenAI Hizmeti modelleri |
En fazla ince ayarlı model dağıtımı | 5 |
Kaynak başına toplam eğitim işi sayısı | 100 |
Kaynak başına en fazla eşzamanlı çalışan eğitim işi | 1 |
Kuyruğa alınan en fazla eğitim işi | 20 |
Kaynak başına En Fazla Dosya (ince ayar) | 50 |
Kaynak başına tüm dosyaların toplam boyutu (ince ayar) | 1 GB |
En fazla eğitim işi süresi (aşılırsa iş başarısız olur) | 720 saat |
En fazla eğitim işi boyutu (eğitim dosyasındaki belirteçler) x (dönem sayısı) | 2 Milyar |
Karşıya yükleme başına tüm dosyaların en büyük boyutu (verilerinizde Azure OpenAI) | 16 MB |
Ile dizideki maksimum sayı veya giriş sayısı /embeddings |
2048 |
En fazla /chat/completions ileti sayısı |
2048 |
Maksimum işlev sayısı /chat/completions |
128 |
En fazla /chat completions araç sayısı |
128 |
Dağıtım başına sağlanan aktarım hızı birimi sayısı üst sınırı | 100.000 |
Yardımcı/iş parçacığı başına en fazla dosya | 20 |
Yardımcılar için en büyük dosya boyutu ve ince ayar | 512 MB |
Yardımcılar belirteci sınırı | 2.000.000 belirteç sınırı |
GPT-4o istek başına en fazla görüntü (ileti dizisinde/konuşma geçmişinde görüntü sayısı) | 10 |
GPT-4 vision-preview & GPT-4 turbo-2024-04-09 varsayılan maksimum belirteçler |
16 Kesilen max_tokens yanıtlardan kaçınmak için parametre değerini artırın. GPT-4o maksimum belirteçleri varsayılan olarak 4096'dır. |
Bölgesel kota sınırları
Bölge | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | gpt-4o | gpt-4o - GlobalStandard | GPT-35-Turbo | GPT-35-Turbo-Instruct | Metin Ekleme-Ada-002 | metin ekleme-3-küçük | metin ekleme-3-büyük | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-35-Turbo-0125 - finetune | GPT-4 - finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 K | 80 K | 80 K | 30 K | - | - | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
Güney Brezilya | - | - | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - |
canadaeast | 40 K | 80 K | 80 K | - | - | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
240 K | 240 K | 240 K | 350 K | 350 K | - | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | 350 K | 350 K | - | - | - | - | 250 K | 250 K | 250 K | - |
francecentral | 20 K | 60 K | 80 K | - | - | - | 240 K | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | - | - | 300 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K | 100 K |
Doğu Norveç | - | - | 150 K | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - |
Güney Afrika'nın Kuzeyi | - | - | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - |
Orta Güney ABD | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
240 K | - | 240 K | - | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | - | - | 300 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
Orta İsveç | 40 K | 80 K | 150 K | 30 K | 150 K 1 M |
- | 300 K | 240 K | 350 K | - | 350 K | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K | 100 K |
Kuzey İsviçre | 40 K | 80 K | - | 30 K | - | - | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
İsviçrewest | - | - | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | 250 K | - |
uksouth | - | - | 80 K | - | - | - | 240 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 K | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
westus3 | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
- | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
gpt-4o hız sınırları
gpt-4o
belirli müşteri türleri için daha yüksek sınırlara sahip hız sınırı katmanları ekler.
gpt-4o global standart
Not
Genel standart model dağıtım türü şu anda genel önizleme aşamasındadır.
Katman | Dakika başına belirteçlerde Kota Sınırı (TPM) | Dakika başına istek sayısı |
---|---|---|
Kurumsal anlaşma | 10 M | 60 K |
Varsayılan | 450 K | 2,7 K |
M = milyon | K = bin
gpt-4o standard
Katman | Dakika başına belirteçlerde Kota Sınırı (TPM) | Dakika başına istek sayısı |
---|---|---|
Kurumsal anlaşma | 1 M | 6 K |
Varsayılan | 150 K | 900 |
M = milyon | K = bin
Kullanım katmanları
Genel Standart dağıtımlar Azure'ın genel altyapısını kullanır ve müşteri trafiğini dinamik olarak veri merkezine yönlendirerek müşterinin çıkarım istekleri için en iyi kullanılabilirliği sağlar. Bu, düşük ve orta düzeyde trafiğe sahip müşteriler için daha tutarlı gecikme süresi sağlar. Kullanım düzeyi yüksek olan müşteriler yanıt gecikme süresinde daha fazla değişkenlik görebilir.
Kullanım Sınırı, müşterilerin yanıt gecikme süresinde daha büyük değişkenlik görebileceği kullanım düzeyini belirler. Müşterinin kullanımı model başına tanımlanır ve belirli bir kiracı için tüm bölgelerdeki tüm aboneliklerdeki tüm dağıtımlarda kullanılan toplam belirteçtir.
GPT-4o global standart & standart
Model | Aylık kullanım katmanları |
---|---|
GPT-4o |
1,5 Milyar belirteç |
Diğer teklif türleri
Azure aboneliğiniz belirli teklif türlerine bağlıysa maksimum kota değerleriniz yukarıdaki tablolarda belirtilen değerlerden daha düşüktür.
Katman | Dakika başına belirteçlerde Kota Sınırı (TPM) |
---|---|
Öğrenciler için Azure, Ücretsiz Denemeler | 1 K (tüm modeller) |
Aylık kredi kartı tabanlı hesaplar 1 | GPT 3.5 Turbo Serisi: 30 K GPT-4 serisi: 8 K |
1 Bu, şu anda 0003P teklif türü için geçerlidir
Azure portalında aboneliğinize gidip aboneliklere genel bakış bölmesini denetleyerek aboneliğinizle ilişkili teklif türünü görüntüleyebilirsiniz. Teklif türü, aboneliğe genel bakış bölümündeki plan alanına karşılık gelir.
Hız sınırları içinde kalmak için genel en iyi yöntemler
Hız sınırlarıyla ilgili sorunları en aza indirmek için aşağıdaki teknikleri kullanmak iyi bir fikirdir:
- Uygulamanıza yeniden deneme mantığı ekleyin.
- İş yükünde ani değişikliklerden kaçının. İş yükünü kademeli olarak artırın.
- Farklı yük artışı desenlerini test edin.
- Dağıtımınıza atanan kotayı artırın. Gerekirse kotayı başka bir dağıtımdan taşıyın.
Varsayılan kotalara ve sınırlara artış isteme
Kota artışı istekleri Azure OpenAI Studio'nun Kotalar sayfasından gönderilebilir. Yoğun talep nedeniyle kota artışı isteklerinin kabul edildiğini ve alındıkları sırayla doldurulacağını lütfen unutmayın. Mevcut kota ayırmayı kullanan trafik oluşturan müşterilere öncelik verilir ve bu koşul karşılanmazsa isteğiniz reddedilebilir.
Diğer fiyat sınırları için lütfen bir hizmet isteği gönderin.
Sonraki adımlar
Azure OpenAI dağıtımlarınız için kotayı yönetmeyi keşfedin. Azure OpenAI'yi destekleyen temel modeller hakkında daha fazla bilgi edinin.
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin