模型服务限制和区域

本文总结了Azure Databricks模型服务和支持的终结点类型的限制和区域可用性。

资源和有效负载限制

模型服务施加了默认限制，以确保可靠的性能。如果对这些限制有反馈，请联系 Databricks 帐户团队。

本节中的限制仅适用于自定义模型和代理终结点。有关基础模型 API 以及外部模型资源和有效负载限制，请参阅基础模型 API 速率限制和配额。

自定义模型和代理

功能	粒度	限制
端点	每个工作区	1000。联系你的 Databricks 帐户团队以增加。
每秒查询次数 (QPS)	每个终结点	30万在使用路由优化。如果 1024 并发不够，请联系你的 Databricks 帐户团队以增加。
每秒查询次数 (QPS)	每个工作区	30万在使用路由优化。非路由优化为 200，仅推荐用于小型开发用例。
预配的并发	每个模型	1024 具有自定义选项和路由优化。联系你的 Databricks 帐户团队以增加。
预配的并发	每个工作区	4096。联系你的 Databricks 帐户团队以增加。
创建/更新操作	每个工作区	5 分钟内 50 个。
有效负载大小	应要求	16 MB。对于代理终结点，限制为 4 MB。
请求/响应大小	应要求	不会记录超过 1 MB 的任何请求/响应。
模型执行持续时间	应要求	597 秒
CPU 端点模型的内存使用情况	每个模型实例	取决于 CPU 工作负荷类型： `CPU` （4 GB）、 `CPU_MEDIUM` （8 GB）、 `CPU_LARGE` （16 GB）。请参阅自定义模型。
GPU 终结点模型内存使用	每个终结点	取决于 GPU 类型
环境变量	每个已服务模型	50。联系你的 Databricks 帐户团队以增加。
开销延迟	应要求	使用路由优化时少于 20 毫秒。

网络和安全限制

模型服务终结点受 access 控制保护，并遵循在工作区上配置的与网络相关的入口规则，例如 IP 允许列表和专用链接。
专用连接（例如 Azure 专用链接）仅支持模型服务终结点，这些终结点必须使用预配吞吐量或服务自定义模型。
默认情况下，模型服务不支持与外部终结点（如 Azure OpenAI）的专用链接。支持此功能的评估与实施是按每个区域进行的。有关详细信息，请联系Azure Databricks帐户团队。
由于生产部署存在不稳定的风险，模型服务不提供现有模型映像的安全修补程序。从新模型版本创建的新模型映像将包含最新的修补程序。有关详细信息，请联系 Databricks 帐户团队。

合规安全配置文件的标准：CPU 工作负荷

下表列出了 CPU 工作负荷上自定义模型服务功能支持的合规性安全配置文件符合性标准。

注意

这些符合性标准要求在最近 30 天内生成服务容器。 Databricks 会自动为您重建过时的容器。但是，如果此自动化作业失败，将显示如下所示的事件日志消息，并提供有关如何确保终结点保持在符合性要求的指导：

"Databricks couldn't complete a scheduled compliance check for model $servedModelName. This can happen if the system can't apply a required update. To resolve, try relogging your model. If the issue persists, contact support@databricks.com."

区域	位置	HIPAA	HITRUST	PCI-DSS	英国 Cyber Essentials Plus
`australiacentral`	AustraliaCentral
`australiacentral2`	AustraliaCentral2
`australiaeast`	澳大利亚东部	✓	✓	✓
`australiasoutheast`	澳大利亚东南部
`brazilsouth`	巴西南部	✓	✓	✓
`canadacentral`	CanadaCentral	✓	✓	✓
`canadaeast`	CanadaEast
`centralindia`	CentralIndia	✓	✓	✓
`centralus`	中央美国地区	✓	✓	✓
`chinaeast2`	ChinaEast2
`chinaeast3`	ChinaEast3
`chinanorth2`	ChinaNorth2
`chinanorth3`	ChinaNorth3
`eastasia`	EastAsia	✓	✓	✓
`eastus`	EastUS	✓	✓	✓
`eastus2`	EastUS2	✓	✓	✓
`francecentral`	FranceCentral	✓	✓	✓
`germanywestcentral`	德国西中部	✓	✓	✓
`japaneast`	JapanEast	✓	✓	✓
`japanwest`	日本西部
`koreacentral`	KoreaCentral	✓	✓	✓
`mexicocentral`	墨西哥中心
`northcentralus`	NorthCentralUS	✓	✓	✓
`northeurope`	NorthEurope	✓	✓	✓
`norwayeast`	挪威东部
`qatarcentral`	卡塔尔中央
`southafricanorth`	SouthAfricaNorth
`southcentralus`	SouthCentralUS	✓	✓	✓
`southeastasia`	东南亚	✓	✓	✓
`southindia`	南印度
`swedencentral`	瑞典中心	✓	✓	✓
`switzerlandnorth`	SwitzerlandNorth	✓	✓	✓
`switzerlandwest`	瑞士西部
`uaenorth`	阿联酋北部	✓	✓	✓
`uksouth`	UKSouth	✓	✓	✓	✓
`ukwest`	UKWest
`westcentralus`	WestCentralUS
`westeurope`	西欧	✓	✓	✓
`westindia`	WestIndia
`westus`	WestUS	✓	✓	✓
`westus2`	WestUS2	✓	✓	✓
`westus3`	WestUS3	✓	✓	✓

基础模型 API 限制

有关基础模型 API 的详细信息，包括基础模型和外部模型的资源和有效负载限制，请参阅基础模型 API 速率限制和配额。

区域可用性

注意

如果需要在不受支持的区域中使用终结点，请联系 Azure Databricks 帐户团队。

如果工作区部署在支持模型服务的区域，但由不受支持区域的控制平面提供服务，则工作区不支持模型服务。当您尝试在此类工作区中使用模型服务时，您会在错误消息中看到，您的工作区不受支持。有关详细信息，请联系Azure Databricks帐户团队。

有关每个模型服务功能的区域可用性的详细信息，请参阅模型服务功能可用性。

有关 Databricks 托管的基础模型区域可用性，请参阅 Databricks 上托管的基础模型。

反馈

此页面是否有帮助？

Last updated on 2026-07-28