模型服務限制和區域

本文總結了 Azure Databricks 模型服務及支援端點類型的限制與區域可用性。

資源和承載限制

模型服務設定預設限制以確保效能可靠。如果您對於這些限制有意見，請聯絡您的 Databricks 帳戶團隊。

本節的限制僅適用於自訂模型及 AI 代理端點。關於基礎模型 API 及外部模型資源與有效載荷限制，請參見基礎模型 API 速率限制與配額。

自訂模型與 AI 代理

功能	粒度	限制
端點	每個工作區	如需提高 1000 的配額，請聯絡你的 Databricks 帳戶團隊。
每秒查詢數 (QPS)	每個端點	30萬，採用路線優化。如果 1024 並行度不夠，請聯繫您的 Databricks 帳戶團隊以增加並行限制。
每秒查詢數 (QPS)	每個工作區	30萬，採用路線優化。 200 美元用於非路由優化，僅建議小型開發者使用。
佈建的預置平行處理	每個模型	1024 有自訂選項和路線優化。聯絡你的 Databricks 帳戶團隊以增加配額。
佈建的預置平行處理	每個工作區	4096。聯絡你的Databricks帳戶團隊以增加。
建立/更新操作	每個工作區	5分鐘內50。
承載大小	依據要求	16 MB。 AI 代理端點的限制為 4 MB。
要求/回應大小	依據要求	不會記錄超過 1 MB 的任何要求/回應。
模型執行持續時間	依據要求	597秒
CPU 端點模型記憶體使用量	每個模型實例	4GB
GPU 端點模型記憶體使用量	每個端點	這要看顯示卡的類型
環境變數	每個服務模型	50. 聯絡你的 Databricks 帳戶團隊以增加收益。
額外負荷延遲	依據要求	經過路線優化後，時間不到 20 毫秒。

網路和安全性限制

模型服務端點由存取控制保護，並遵守工作區中設定的網路相關入口規則，如 IP 允許清單及 Private Link。
私有連線（如 Azure Private Link）僅支援使用預建吞吐量的模型服務端點，或提供自訂模型的端點。
預設情況下，Model Serving 不支援與外部端點（例如 Azure OpenAI）的 Private Link。這項功能的支援會根據每個區域進行評估和實作。請聯繫您的 Azure Databricks 帳戶團隊以獲得更多資訊。
模型服務功能不會提供現有模型映像的安全性修補程式，因為這樣可能會導致生產部署的不穩定性風險。從新模型版本建立的新模型映像會包含最新的更新檔。如需詳細資訊，請連絡 Databricks 客戶團隊。

合規性安全性配置文件標準：CPU 工作負載

下表列出 CPU 工作負載上核心模型服務功能支援的合規性安全性配置檔合規性標準。

注意

這些合規性標準要求服務容器在最近 30 天內建置。 Databricks 會代表您自動重建過時的容器。不過，如果此自動化作業失敗，則會出現如下的事件記錄訊息，並提供如何確保您的端點保持在合規性需求內的指引：

"Databricks couldn't complete a scheduled compliance check for model $servedModelName. This can happen if the system can't apply a required update. To resolve, try relogging your model. If the issue persists, contact support@databricks.com."

區域	地點	HIPAA	HITRUST	PCI-DSS	英國 Cyber Essentials Plus
`australiacentral`	AustraliaCentral
`australiacentral2`	AustraliaCentral2
`australiaeast`	澳大利亞東部	✓	✓	✓
`australiasoutheast`	澳大利亞東南部
`brazilsouth`	巴西南部	✓	✓	✓
`canadacentral`	CanadaCentral	✓	✓	✓
`canadaeast`	CanadaEast
`centralindia`	CentralIndia	✓	✓	✓
`centralus`	美國中部地区	✓	✓	✓
`chinaeast2`	ChinaEast2
`chinaeast3`	ChinaEast3
`chinanorth2`	ChinaNorth2
`chinanorth3`	ChinaNorth3
`eastasia`	EastAsia	✓	✓	✓
`eastus`	美國東部（EastUS）	✓	✓	✓
`eastus2`	EastUS2	✓	✓	✓
`francecentral`	FranceCentral	✓	✓	✓
`germanywestcentral`	德國西中部	✓	✓	✓
`japaneast`	日本東部	✓	✓	✓
`japanwest`	日本西部
`koreacentral`	韓國中心	✓	✓	✓
`mexicocentral`	墨西哥中心
`northcentralus`	NorthCentralUS	✓	✓	✓
`northeurope`	北歐	✓	✓	✓
`norwayeast`	挪威東部
`qatarcentral`	卡達中心
`southafricanorth`	南非北部
`southcentralus`	SouthCentralUS	✓	✓	✓
`southeastasia`	東南亞	✓	✓	✓
`southindia`	南印度
`swedencentral`	瑞典Central	✓	✓	✓
`switzerlandnorth`	瑞士北部	✓	✓	✓
`switzerlandwest`	瑞士西部
`uaenorth`	UAENorth	✓	✓	✓
`uksouth`	英國南區	✓	✓	✓	✓
`ukwest`	UKWest
`westcentralus`	WestCentralUS
`westeurope`	西歐	✓	✓	✓
`westindia`	WestIndia
`westus`	WestUS	✓	✓	✓
`westus2`	WestUS2	✓	✓	✓
`westus3`	WestUS3	✓	✓	✓

基礎模型 API 限制

關於基礎模型 API 的詳細資訊，包括基礎與外部模型的資源與有效載荷限制，請參見基礎模型 API 速率限制與配額。

區域可用性

注意

如果你需要在不支援的區域使用端點，請聯繫你的 Azure Databricks 帳號團隊。

如果您的工作區部署在支援模型服務的區域中，但由不支持區域中的控制平面提供服務，則工作區不支援模型服務。如果您嘗試在這類工作區中使用模型服務，您會看到錯誤訊息指出不支援您的工作區。請聯繫您的 Azure Databricks 帳戶團隊以獲得更多資訊。

如需每個模型服務功能區域可用性的詳細資訊，請參閱模型服務功能可用性。

如需 Databricks 裝載的基礎模型區域可用性，請參閱 Databricks 上裝載的基礎模型。

意見反應

此頁面對您有幫助嗎？

Last updated on 2026-04-11