다음을 통해 공유


모델 제공 한도 및 지역

이 문서에서는 Azure Databricks 모델 서비스 및 지원되는 엔드포인트 유형에 대한 제한 사항 및 지역 가용성을 요약합니다.

리소스 및 페이로드 제한

모델 제공은 안정적인 성능을 보장하기 위해 기본 제한을 적용합니다. 이러한 제한에 대한 피드백이 있는 경우 Databricks 계정 팀에 문의하세요.

이 섹션의 제한은 사용자 지정 모델 및 AI 에이전트 엔드포인트에만 적용됩니다. 파운데이션 모델 API 및 외부 모델 리소스 및 페이로드 제한은 Foundation Model API 속도 제한 및 할당량을 참조하세요.

사용자 지정 모델 및 AI 에이전트

기능 세분성 한계
Endpoints 작업 영역당 1000. Databricks 계정 팀에 문의하여 늘리세요.
QPS(초당 쿼리 수) 엔드포인트당 경로 최적화를 사용하는 300,000개. 1024 동시성만으로는 충분하지 않은 경우 Databricks 계정 팀에 문의하여 늘릴 수 있습니다.
QPS(초당 쿼리 수) 작업 영역당 경로 최적화를 사용하는 300,000개. 경로 최적화가 아닌 경우 200으로, 소규모 개발 사용 사례에만 권장됩니다.
프로비전된 동시 실행 모델당 사용자 지정 옵션경로 최적화를 사용하는 1024. Databricks 계정 팀에 문의하여 늘릴 수 있습니다.
프로비전된 동시 실행 작업 영역당 4096. Databricks 계정 팀에 문의하여 늘리세요.
작업 만들기/업데이트 작업 영역당 5분 안에 50.
페이로드 크기 요청에 따라 16MB AI 에이전트 엔드포인트의 경우 제한은 4MB입니다.
요청/응답 크기 요청에 따라 1MB를 넘는 요청/응답은 기록되지 않습니다.
모델 실행 기간 요청에 따라 297초
CPU 엔드포인트 모델 메모리 사용량 엔드포인트당 4GB
GPU 엔드포인트 모델 메모리 사용량 엔드포인트당 GPU 유형에 따라 다름
환경 변수 제공된 모델당 30. Databricks 계정 팀에 문의하여 늘릴 수 있습니다.
오버헤드 대기 시간 요청에 따라 경로 최적화를 사용하는 경우 20밀리초 미만입니다.

:::

네트워킹 및 보안 제한 사항

  • 모델 제공 엔드포인트는 액세스 제어로 보호되며 IP 허용 목록 및 비공개 링크와 같이 작업 영역에 구성된 네트워킹 관련 침입 규칙을 준수합니다.
  • 프라이빗 연결(예: Azure Private Link)은 프로비전된 처리량 또는 사용자 지정 모델을 제공하는 엔드포인트를 사용하는 엔드포인트를 제공하는 모델에 대해서만 지원됩니다.
  • 기본적으로 모델 제공은 외부 엔드포인트(예: Azure OpenAI)에 대한 Private Link를 지원하지 않습니다. 이 기능에 대한 지원은 지역별로 평가 및 구현됩니다. 더 자세한 내용은 Azure Databricks 계정 팀에 문의하세요.
  • 모델 제공은 프로덕션 배포에 대한 불안정의 위험 때문에 기존 모델 이미지에 보안 패치를 제공하지 않습니다. 새 모델 버전에서 만든 새 모델 이미지에는 최신 패치가 포함됩니다. 더 자세한 내용은 Databricks 계정 팀에 문의하세요.

규정 준수 보안 프로필 표준: CPU 워크로드

다음 표에서는 CPU 워크로드의 핵심 모델 서비스 기능에 대해 지원되는 규정 준수 보안 프로필 준수 표준을 나열합니다.

참고

이러한 규정 준수 표준을 사용하려면 가장 최근 30일 이내에 제공된 컨테이너를 빌드해야 합니다. Databricks는 사용자를 대신하여 오래된 컨테이너를 자동으로 다시 빌드합니다. 그러나 이 자동화된 작업이 실패하면 다음과 같은 이벤트 로그 메시지가 나타나고 엔드포인트가 규정 준수 요구 사항 내에서 유지되도록 하는 방법에 대한 지침을 제공합니다.

"Databricks couldn't complete a scheduled compliance check for model $servedModelName. This can happen if the system can't apply a required update. To resolve, try relogging your model. If the issue persists, contact support@databricks.com."

지역 위치 HIPAA HITRUST PCI-DSS IRAP (아이랩) CCCS 중간 보안 레벨 B 영국 Cyber Essentials Plus
australiacentral 오스트레일리아중부            
australiacentral2 AustraliaCentral2            
australiaeast 오스트레일리아동부      
australiasoutheast 오스트레일리아남동부            
brazilsouth 브라질 남부      
canadacentral 캐나다중부      
canadaeast 캐나다동부            
centralindia CentralIndia      
centralus 미국 중부      
chinaeast2 ChinaEast2            
chinaeast3 ChinaEast3            
chinanorth2 ChinaNorth2            
chinanorth3 ChinaNorth3            
eastasia EastAsia      
eastus 미국 동부      
eastus2 EastUS2      
francecentral FranceCentral      
germanywestcentral 독일 서중부      
japaneast JapanEast      
japanwest JapanWest            
koreacentral KoreaCentral      
mexicocentral 멕시코 센터            
northcentralus NorthCentralUS      
northeurope 유럽 북부      
norwayeast 노르웨이 동부            
qatarcentral 카타르 센터            
southafricanorth 남아프리카북부            
southcentralus SouthCentralUS      
southeastasia 동남아시아      
southindia 남인도            
swedencentral SwedenCentral      
switzerlandnorth 스위스 북부      
switzerlandwest 스위스 서부            
uaenorth UAENorth      
uksouth UKSouth    
ukwest UKWest            
westcentralus WestCentralUS            
westeurope 웨스트유로프      
westindia WestIndia            
westus 서부 미국      
westus2 WestUS2      
westus3 WestUS3      

파운데이션 모델 API 제한

파운데이션 및 외부 모델에 대한 리소스 및 페이로드 제한을 포함하여 Foundation Model API에 대한 자세한 내용은 Foundation Model API 속도 제한 및 할당량을 참조하세요.

지역 가용성

참고

지원되지 않는 지역에 엔드포인트가 필요한 경우 Azure Databricks 계정 팀에 문의하세요.

작업 영역이 모델 제공을 지원하는 지역에 배포되었지만, 지원되지 않는 지역의 컨트롤 플레인에서 제공되는 경우 작업 영역은 모델 제공을 지원하지 않습니다. 이러한 작업 영역에서 제공하는 모델을 사용하려고 하면 작업 영역이 지원되지 않는다는 오류 메시지가 표시됩니다. 더 자세한 내용은 Azure Databricks 계정 팀에 문의하세요.

각 모델 서비스 기능의 지역별 가용성에 대한 자세한 내용은 모델 서비스 기능 가용성을 참조하세요.

Databricks에서 호스트되는 기본 모델 지역 가용성은 Databricks에서 호스트되는 Foundation 모델을 참조하세요.