Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu makalede, Azure Databricks Model Sunma ve desteklenen uç nokta türleri için sınırlamalar ve bölge kullanılabilirliği özetlenmektedir.
Kaynak ve yük sınırları
Model Sunma, güvenilir performans sağlamak için varsayılan sınırlar uygular. Bu sınırlar hakkında geri bildiriminiz varsa Databricks hesap ekibinize ulaşın.
Bu bölümdeki sınırlar yalnızca özel model ve yapay zeka aracısı uç noktaları için geçerlidir. Temel Model API'leri ve dış model kaynağı ve yük sınırları için bkz. Temel Model API'leri hız sınırları ve kotaları.
Özel modeller ve yapay zeka aracıları
| Özellik | Granülerlik | Sınır |
|---|---|---|
| Endpoints | Çalışma alanı başına | 1000. Artırmak için Databricks hesap ekibinize ulaşın. |
| Saniye başına sorgu sayısı (QPS) | Uç nokta başına | 300.000 rota iyileştirme kullanılarak optimize edildi. 1024 eşzamanlılığı yeterli değilse, artırmak için Databricks hesap ekibinize ulaşın. |
| Saniye başına sorgu sayısı (QPS) | Çalışma alanı başına | 300.000 rota iyileştirme kullanılarak optimize edildi. Rota optimize edilmemiş için 200, yalnızca küçük geliştirme senaryoları için önerilir. |
| Sağlanan eşzamanlılık | Model başına | Özel seçenek ve yol iyileştirme ile 1024. Artırmak için Databricks hesap ekibinize ulaşın. |
| Sağlanan eşzamanlılık | Çalışma alanı başına | 4096. Artırmak için Databricks hesap ekibinize ulaşın. |
| Oluşturma/güncelleştirme işlemleri | Çalışma alanı başına | 5 dakikada 50. |
| Yük boyutu | Talep üzerine | 16MB. Yapay zeka aracısı uç noktaları için sınır 4 MB'tır. |
| İstek/yanıt boyutu | Talep üzerine | 1 MB üzerindeki istek/yanıt günlüğe kaydedilmez. |
| Model yürütme süresi | Talep üzerine | 597 saniye |
| CPU uç noktası modeli bellek kullanımı | Model örneği başına | 4 GB |
| GPU uç nokta modeli bellek kullanımı | Uç nokta başına | GPU türüne bağlıdır |
| Ortam değişkenleri | Kullanılan model başına | 50. Artırmak için Databricks hesap ekibinize ulaşın. |
| Ek yük gecikmesi | Talep üzerine | Rota iyileştirme ile 20 milisaniyeden az. |
Ağ ve güvenlik sınırlamaları
- Model Sunma hizmeti uç noktaları erişim kontrolü tarafından korunur ve IP izin verilenler listeleri ve Private Link gibi çalışma alanında yapılandırılan ağ ile ilgili giriş kurallarına uyar.
- Özel bağlantı (Azure Private Link gibi), yalnızca sağlanan aktarım hızını veya özel modellere hizmet veren uç noktaları kullanan model sunma uç noktaları için desteklenir.
- Varsayılan olarak, Model Sunma dış uç noktalara (Azure OpenAI gibi) Private Link desteklemez. Bu işleve yönelik destek, bölge bazında değerlendirilir ve uygulanır. Daha fazla bilgi için Azure Databricks hesap ekibinize ulaşın.
- Model Sunma, üretim dağıtımlarında istikrarsızlaştırma riski nedeniyle mevcut model görüntülerine güvenlik yamaları sağlamaz. Yeni bir model sürümünden oluşturulan yeni model görüntüsü en son düzeltme eklerini içerir. Daha fazla bilgi için Databricks hesap ekibinize ulaşın.
Uyumluluk güvenlik profili standartları: CPU iş yükleri
Aşağıdaki tabloda, CPU iş yüklerinde temel Model Sunma işlevi için desteklenen uyumluluk güvenlik profili uyumluluk standartları listelenmektedir.
Not
Bu uyumluluk standartları, sunulan kapsayıcıların en son 30 gün içinde oluşturulmasını gerektirir. Databricks, eski kapsayıcıları sizin yerinize otomatik olarak yeniden oluşturur. Ancak bu otomatik iş başarısız olursa, aşağıdakine benzer bir olay günlüğü iletisi görüntülenir ve uç noktalarınızın uyumluluk gereksinimleri içinde kalmasını sağlama konusunda rehberlik sağlar:
"Databricks couldn't complete a scheduled compliance check for model $servedModelName. This can happen if the system can't apply a required update. To resolve, try relogging your model. If the issue persists, contact support@databricks.com."
| Bölge | Yer | HIPAA | HITRUST | PCI-DSS | IRAP | CCCS Medium (Korumalı B) | UK Cyber Essentials Plus |
|---|---|---|---|---|---|---|---|
australiacentral |
AustraliaCentral | ||||||
australiacentral2 |
AustraliaCentral2 | ||||||
australiaeast |
Avustralya Doğu | ✓ | ✓ | ✓ | |||
australiasoutheast |
Avustralya Güneydoğu | ||||||
brazilsouth |
Brezilya Güney | ✓ | ✓ | ✓ | |||
canadacentral |
CanadaCentral | ✓ | ✓ | ✓ | |||
canadaeast |
CanadaEast | ||||||
centralindia |
CentralIndia | ✓ | ✓ | ✓ | |||
centralus |
OrtaAmerikaBölgesi | ✓ | ✓ | ✓ | |||
chinaeast2 |
ÇinDoğu2 | ||||||
chinaeast3 |
ÇinDoğu3 | ||||||
chinanorth2 |
ÇinNorth2 | ||||||
chinanorth3 |
ÇinNorth3 | ||||||
eastasia |
EastAsia | ✓ | ✓ | ✓ | |||
eastus |
EastUS (ABD Doğu Bölgesi) | ✓ | ✓ | ✓ | |||
eastus2 |
EastUS2 | ✓ | ✓ | ✓ | |||
francecentral |
FranceCentral | ✓ | ✓ | ✓ | |||
germanywestcentral |
Almanya Batı Merkez | ✓ | ✓ | ✓ | |||
japaneast |
JapanEast | ✓ | ✓ | ✓ | |||
japanwest |
JapanWest | ||||||
koreacentral |
KoreMerkez | ✓ | ✓ | ✓ | |||
mexicocentral |
MexicoCentral | ||||||
northcentralus |
NorthCentralUS | ✓ | ✓ | ✓ | |||
northeurope |
NorthEurope | ✓ | ✓ | ✓ | |||
norwayeast |
Doğu Norveç | ||||||
qatarcentral |
KatarMerkez | ||||||
southafricanorth |
GüneyAfrikaKuzey | ||||||
southcentralus |
SouthCentralUS | ✓ | ✓ | ✓ | |||
southeastasia |
Güneydoğu Asya | ✓ | ✓ | ✓ | |||
southindia |
Güney Hindistan | ||||||
swedencentral |
SwedenCentral | ✓ | ✓ | ✓ | |||
switzerlandnorth |
İsviçre Kuzeyi | ✓ | ✓ | ✓ | |||
switzerlandwest |
İsviçreWest | ||||||
uaenorth |
UAENorth | ✓ | ✓ | ✓ | |||
uksouth |
UKSouth | ✓ | ✓ | ✓ | ✓ | ||
ukwest |
UKWest | ||||||
westcentralus |
WestCentralUS | ||||||
westeurope |
WestEurope | ✓ | ✓ | ✓ | |||
westindia |
WestIndia | ||||||
westus |
WestUS | ✓ | ✓ | ✓ | |||
westus2 |
WestUS2 | ✓ | ✓ | ✓ | |||
westus3 |
WestUS3 | ✓ | ✓ | ✓ |
Temel Model API'leri sınırları
Temel ve dış modeller için kaynak ve yük sınırları da dahil olmak üzere Temel Model API'leri hakkında ayrıntılı bilgi için bkz. Temel Model API'leri hız sınırları ve kotaları.
Bölge kullanılabilirliği
Not
Desteklenmeyen bir bölgede uç nokta gerekiyorsa Azure Databricks hesap ekibinize ulaşın.
Çalışma alanınız, model sunumunu destekleyen bir bölgede konuşlandırıldı ancak denetim düzlemi desteklenmeyen bir bölgeden sunuluyorsa, çalışma alanı model sunumunu desteklemez. Böyle bir çalışma alanında model sunma özelliğini kullanmayı denerseniz, çalışma alanınızın desteklenmediğini belirten bir hata iletisi görürsünüz. Daha fazla bilgi için Azure Databricks hesap ekibinize ulaşın.
Her Model Sunma özelliğinin bölgesel kullanılabilirliği hakkında daha fazla bilgi için bkz. Model sunma özellikleri kullanılabilirliği.
Databricks tarafından barındırılan temel model bölgesi kullanılabilirliği için bkz. Databricks'te barındırılan temel modeller.