Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Artikel ini merangkum batasan dan ketersediaan wilayah untuk Azure Databricks Model Serving dan jenis titik akhir yang didukung.
Batas sumber daya dan muatan data
Model Serving memberlakukan batas default untuk memastikan performa yang andal. Jika Anda memiliki umpan balik tentang batas ini, hubungi tim akun Databricks Anda.
Batas di bagian ini hanya berlaku untuk model kustom dan titik akhir agen AI . Untuk API Model Foundation dan sumber daya model eksternal dan batas payload, lihat Batas tarif dan kuota API Model Foundation.
Model kustom dan agen AI
| Fitur | Granularitas | Batas |
|---|---|---|
| Endpoints | Per ruang kerja | 1000. Hubungi tim akun Databricks Anda untuk meningkatkan. |
| Kueri per detik (QPS) | Per titik akhir | 300.000 menggunakan pengoptimalan rute. Jika tingkat konkurensi 1024 tidak cukup, hubungi tim akun Databricks Anda untuk meningkatkan batas itu. |
| Kueri per detik (QPS) | Per ruang kerja | 300.000 menggunakan pengoptimalan rute. 200 untuk yang tidak dioptimalkan rute, direkomendasikan hanya untuk skenario penggunaan pengembangan kecil. |
| Konkurensi yang Ditetapkan | Setiap model | 1024 dengan opsi kustom dan pengoptimalan rute. Hubungi tim akun Databricks Anda untuk meningkatkan. |
| Konkurensi yang Ditetapkan | Per ruang kerja | 4096. Hubungi tim akun Databricks Anda untuk meningkatkan. |
| Membuat/memperbarui operasi | Per ruang kerja | 50 dalam 5 menit. |
| Ukuran payload | Per permintaan | 16 MB. Untuk titik akhir agen AI , batasnya adalah 4 MB. |
| Ukuran permintaan/respons | Per permintaan | Setiap permintaan/respons lebih dari 1 MB tidak akan dicatat. |
| Durasi pelaksanaan model | Per permintaan | 597 detik |
| Penggunaan model memori titik akhir CPU | Per instans model | 4GB |
| Penggunaan memori model titik akhir GPU | Per titik akhir | Bergantung pada jenis GPU |
| Variabel lingkungan | Per model yang disediakan | 50. Hubungi tim akun Databricks Anda untuk meningkatkan. |
| Latensi akibat overhead | Per permintaan | Kurang dari 20 milidetik dengan pengoptimalan rute. |
Batasan jaringan dan keamanan
- Titik akhir Penyajian Model dilindungi oleh kontrol akses dan mematuhi aturan masuk terkait jaringan yang dikonfigurasi di ruang kerja, seperti daftar izinkan IP dan Private Link.
- Konektivitas privat (seperti Azure Private Link) hanya didukung untuk titik akhir penyajian model yang menggunakan throughput yang disediakan atau titik akhir yang melayani model kustom.
- Secara default, Model Serving tidak mendukung Private Link ke titik akhir eksternal (seperti, Azure OpenAI). Dukungan untuk fungsionalitas ini dievaluasi dan diimplementasikan per wilayah. Hubungi tim akun Azure Databricks Anda untuk informasi selengkapnya.
- Penyajian Model tidak menyediakan patch keamanan untuk citra model yang sudah ada karena risiko destabilisasi pada penerapan produksi. Gambar model baru yang dibuat dari versi model baru akan berisi patch terbaru. Hubungi tim akun Databricks Anda untuk informasi selengkapnya.
Standar profil keamanan kepatuhan: Beban kerja CPU
Tabel berikut mencantumkan standar kepatuhan profil keamanan yang didukung untuk fungsi inti Model Serving pada beban kerja CPU.
Catatan
Standar kepatuhan ini mengharuskan kontainer yang dilayani dibangun dalam 30 hari terakhir. Databricks secara otomatis membangun kembali kontainer yang kedaluarsa atas nama Anda. Namun, jika pekerjaan otomatis ini gagal, pesan log peristiwa seperti berikut muncul dan memberikan panduan tentang cara memastikan titik akhir Anda tetap dalam persyaratan kepatuhan:
"Databricks couldn't complete a scheduled compliance check for model $servedModelName. This can happen if the system can't apply a required update. To resolve, try relogging your model. If the issue persists, contact support@databricks.com."
| Wilayah | Lokasi | HIPAA | HITRUST | PCI-DSS | Program Penilaian dan Aksi Resiko (IRAP) | CCCS Sedang (Perlindungan B) | Cyber Essentials Plus Britania Raya |
|---|---|---|---|---|---|---|---|
australiacentral |
AustraliaCentral | ||||||
australiacentral2 |
AustraliaCentral2 | ||||||
australiaeast |
AustraliaEast | ✓ | ✓ | ✓ | |||
australiasoutheast |
Australia Tenggara | ||||||
brazilsouth |
Brasil Selatan | ✓ | ✓ | ✓ | |||
canadacentral |
KanadaCentral | ✓ | ✓ | ✓ | |||
canadaeast |
Kanada Timur | ||||||
centralindia |
CentralIndia | ✓ | ✓ | ✓ | |||
centralus |
Amerika Serikat Tengah | ✓ | ✓ | ✓ | |||
chinaeast2 |
ChinaEast2 | ||||||
chinaeast3 |
ChinaEast3 | ||||||
chinanorth2 |
ChinaNorth2 | ||||||
chinanorth3 |
ChinaNorth3 | ||||||
eastasia |
EastAsia | ✓ | ✓ | ✓ | |||
eastus |
EASTUS | ✓ | ✓ | ✓ | |||
eastus2 |
EastUS2 | ✓ | ✓ | ✓ | |||
francecentral |
FranceCentral | ✓ | ✓ | ✓ | |||
germanywestcentral |
Jerman Barat Tengah | ✓ | ✓ | ✓ | |||
japaneast |
JepangEast | ✓ | ✓ | ✓ | |||
japanwest |
JepangWest | ||||||
koreacentral |
KoreaCentral | ✓ | ✓ | ✓ | |||
mexicocentral |
MexicoCentral | ||||||
northcentralus |
NorthCentralUS | ✓ | ✓ | ✓ | |||
northeurope |
NorthEurope | ✓ | ✓ | ✓ | |||
norwayeast |
Norwegia Timur | ||||||
qatarcentral |
QatarCentral | ||||||
southafricanorth |
Afrika Selatan Utara | ||||||
southcentralus |
SouthCentralUS | ✓ | ✓ | ✓ | |||
southeastasia |
Asia Tenggara | ✓ | ✓ | ✓ | |||
southindia |
India Selatan | ||||||
swedencentral |
SwedenCentral | ✓ | ✓ | ✓ | |||
switzerlandnorth |
Swiss Utara | ✓ | ✓ | ✓ | |||
switzerlandwest |
SwissWest | ||||||
uaenorth |
UAENorth | ✓ | ✓ | ✓ | |||
uksouth |
UKSouth | ✓ | ✓ | ✓ | ✓ | ||
ukwest |
UKWest | ||||||
westcentralus |
WestCentralUS | ||||||
westeurope |
WestEurope | ✓ | ✓ | ✓ | |||
westindia |
WestIndia | ||||||
westus |
WestUS | ✓ | ✓ | ✓ | |||
westus2 |
WestUS2 | ✓ | ✓ | ✓ | |||
westus3 |
WestUS3 | ✓ | ✓ | ✓ |
Batas API pada Model Dasar
Untuk informasi terperinci tentang API Model Foundation, termasuk batas sumber daya dan payload untuk fondasi dan model eksternal, lihat Batas tarif dan kuota API Model Foundation.
Ketersediaan wilayah
Catatan
Jika Anda memerlukan titik akhir di wilayah yang tidak didukung, hubungi tim akun Azure Databricks Anda.
Jika ruang kerja Anda disebarkan di wilayah yang mendukung penyajian model tetapi dilayani oleh sarana kontrol di wilayah yang tidak didukung, ruang kerja tidak mendukung penyajian model. Jika Anda mencoba menggunakan model serving di ruang kerja tersebut, akan muncul pesan kesalahan yang menyatakan bahwa ruang kerja Anda tidak didukung. Hubungi tim akun Azure Databricks Anda untuk informasi selengkapnya.
Untuk informasi selengkapnya tentang ketersediaan regional setiap fitur Model Serving, lihat Ketersediaan fitur penyajian model.
Untuk ketersediaan wilayah model fondasi yang di-host oleh Databricks, lihat Model fondasi yang di-host oleh Databricks.