Model Sunma sınırları ve bölgeleri
Bu makalede Databricks Model Sunma ve desteklenen uç nokta türleri için sınırlamalar ve bölge kullanılabilirliği özetlenmektedir.
Sınırlamalar
Databricks Model Sunma, güvenilir performans sağlamak için varsayılan sınırlar uygular. Bu sınırlar hakkında geri bildiriminiz varsa lütfen Databricks hesap ekibinize ulaşın.
Aşağıdaki tabloda, uç noktaları sunan model için kaynak ve yük sınırlamaları özetlemektedir.
Özellik | Ayrıntı düzeyi | Sınır |
---|---|---|
Yük boyutu | İstek başına | 16MB |
Saniye başına sorgu sayısı (QPS) | Çalışma alanı başına | 200, ancak Databricks hesabınıza ulaşarak 3000 veya daha fazla 3000'e yükseltilebilir |
Model yürütme süresi | İstek başına | 120 saniye |
CPU uç noktası modeli bellek kullanımı | Uç nokta başına | 4 GB |
GPU uç nokta modeli bellek kullanımı | Uç nokta başına | Atanmış GPU belleğinden büyük veya buna eşit olan, GPU iş yükü boyutuna bağlıdır |
Sağlanan eşzamanlılık | Çalışma alanı başına | 200 eşzamanlılık. Databricks hesabınıza ulaşarak artırılabilir. |
Ek yük gecikmesi | İstek başına | 50 milisaniyeden az |
Temel Model API'leri (belirteç başına ödeme) hız sınırları | Çalışma alanı başına | Aşağıdaki sınırları artırmak için Databricks hesap ekibinize ulaşın. * DBRX Instruct modelinin saniyede 1 sorgu sınırı vardır. * Diğer sohbet ve tamamlama modellerinin varsayılan hız sınırı saniyede 2 sorgu olabilir. * Ekleme modellerinin saniyede varsayılan 300 ekleme girişi vardır. |
Temel Model API'leri (sağlanan aktarım hızı) hız sınırları | Çalışma alanı başına | Yukarıda listelenen Model Sunma QPS sınırıyla aynıdır. |
Model Sunma uç noktaları erişim denetimi tarafından korunur ve IP izin listeleri ve Özel Bağlantı gibi çalışma alanında yapılandırılan ağ ile ilgili giriş kurallarına uyar.
Ek sınırlamalar da vardır:
- Bir çalışma alanının desteklenen bir bölgeye dağıtılması mümkündür, ancak farklı bir bölgedeki bir denetim düzlemi tarafından kullanılabilir. Bu çalışma alanları Model Sunma'yi desteklemez ve çalışma alanınızın desteklenmediğini belirten bir hata iletisiyle sonuçlanır. Daha fazla bilgi için Azure Databricks hesap ekibinize ulaşın.
- Model Sunma, başlatma betiklerini desteklemez.
- Varsayılan olarak, Model Sunma dış uç noktalara (Azure OpenAI gibi) Özel Bağlantı desteklemez. Bu işleve yönelik destek, bölge bazında değerlendirilir ve uygulanır. Daha fazla bilgi için Azure Databricks hesap ekibinize ulaşın.
Temel Model API'leri sınırları
Not
Databricks, Temel Model API'lerini sağlamanın bir parçası olarak verilerinizi ilgili coğrafi konumun dışında değil, verilerinizin kaynaklandığı bölgenin dışında işleyebilirsiniz.
Temel Model API'leri iş yükleriyle ilgili sınırlar şunlardır:
- Sağlanan aktarım hızı HIPAA uyumluluk profilini destekler ve uyumluluk sertifikası gerektiren iş yükleri için kullanılmalıdır. Belirteç başına ödeme iş yükleri HIPAA veya uyumluluk güvenlik profiliyle uyumlu değildir .
- Temel Model API'leri uç noktaları için, hız sınırları gibi idare ayarlarını yalnızca çalışma alanı yöneticileri değiştirebilir. Hız sınırlarını değiştirmek için aşağıdaki adımları kullanın:
- Hizmet veren uç noktalarınızı görmek için çalışma alanınızda Sunma kullanıcı arabirimini açın.
- Düzenlemek istediğiniz Temel Model API'leri uç noktasındaki kebap menüsünden Ayrıntıları görüntüle'yi seçin.
- Uç nokta ayrıntıları sayfasının sağ üst kısmındaki kebap menüsünde Hız sınırını değiştir'i seçin.
- Sağlanan aktarım hızı iş yükü için DBRX model mimarisini kullanmak için, sunum uç noktanızın aşağıdaki bölgelerden birinde olması gerekir:
eastus
eastus2
westus
centralus
westeurope
northeurope
australiaeast
canadacentral
brazilsouth
Bölge kullanılabilirliği
Not
Desteklenmeyen bir bölgede uç noktaya ihtiyacınız varsa Azure Databricks hesap ekibinize ulaşın.
DBRX modellerini kullanan sağlanan aktarım hızı iş yükleri için bkz . Bölge kullanılabilirliği için Temel Model API'leri sınırları .
Bölge | Konum | Çekirdek Model Sunma özelliği * | Temel Model API'leri (genel olarak sağlanır) ** | Temel Model API'leri (belirteç başına ödeme) | Dış modeller |
---|---|---|---|---|---|
australiacentral |
Orta Avustralya | ||||
australiacentral2 |
Orta Avustralya 2 | ||||
australiaeast |
Doğu Avustralya | X | X | X | |
australiasoutheast |
Güneydoğu Avustralya | ||||
brazilsouth |
Güney Brezilya | X | X | X | |
canadacentral |
Orta Kanada | X | X | X | |
canadaeast |
Doğu Kanada | ||||
centralindia |
Orta Hindistan | X | X | X | |
centralus |
Orta ABD | X | X | X | X |
chinaeast2 |
Doğu Çin 2 | ||||
chinaeast3 |
Doğu Çin 3 | ||||
chinanorth2 |
Kuzey Çin 2 | ||||
chinanorth3 |
Kuzey Çin 3 | ||||
eastasia |
Doğu Asya | ||||
eastus |
Doğu ABD | X | X | X | X |
eastus2 |
Doğu ABD 2 | X | X | X | X |
eastus2euap |
Doğu ABD 2 EUAP | ||||
francecentral |
Orta Fransa | ||||
germanywestcentral |
Orta Batı Almanya | ||||
japaneast |
Doğu Japonya | ||||
japanwest |
Batı Japonya | ||||
koreacentral |
Güney Kore - Orta | ||||
northcentralus |
Orta Kuzey ABD | X | X | X | |
northeurope |
Kuzey Avrupa | X | X | X | |
norwayeast |
Norveç Doğu | ||||
qatarcentral |
Katar Merkezi | ||||
southafricanorth |
Güney Afrika - Kuzey | ||||
southcentralus |
Orta Güney ABD | ||||
southeastasia |
Güneydoğu Asya | X | X | ||
southindia |
Güney Hindistan | ||||
swedencentral |
Orta İsveç | ||||
switzerlandnorth |
Kuzey İsviçre | ||||
switzerlandwest |
Batı İsviçre | ||||
uaenorth |
Kuzey BAE | ||||
uksouth |
Güney Birleşik Krallık | ||||
ukwest |
Batı Birleşik Krallık | ||||
westcentralus |
Orta Batı ABD | ||||
westeurope |
West Europe | X | X | X | |
westindia |
Batı Hindistan | ||||
westus |
Batı ABD | X | X | X | X |
westus2 |
Batı ABD 2 | X | X | ||
westus3 |
Batı ABD 3 | X | X |
- yalnızca cpu işlem
** gpu desteği içerir
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin