Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье приведены ограничения и доступность регионов для обслуживания моделей ИИ Мозаики и поддерживаемых типов конечных точек.
Ограничения ресурсов и полезной нагрузки
Служба модели ИИ мозаики накладывает ограничения по умолчанию, чтобы обеспечить надежную производительность. Если у вас есть отзывы об этих ограничениях, обратитесь к группе учетной записи Databricks.
В следующей таблице перечислены ограничения ресурсов и объема данных для конечных точек модели.
| Функция | Степень детализации | Предел |
|---|---|---|
| Размер полезной нагрузки | По запросу | 16 МБ. Для конечных точек, обслуживающих базовые модели, внешние модели или агенты ИИ , ограничение составляет 4 МБ. |
| Размер запроса и ответа | По запросу | Любой запрос или ответ более 1 МБ не будет зарегистрирован. |
| Число запросов в секунду (QPS) | В расчете на рабочую область | 200. Для более высокого уровня QPS включите оптимизацию маршрута. |
| Длительность выполнения модели | По запросу | 297 секунд |
| Использование памяти модели конечной точки ЦП | По конечной точке | 4 ГБ |
| Использование памяти модели конечной точки графического процессора | По конечной точке | Больше или равно назначенной памяти GPU зависит от размера рабочей нагрузки GPU |
| Выделенная одновременность | По модели и рабочему пространству | Одновременность 200. Для увеличения, свяжитесь с вашей командой по работе с аккаунтом Databricks. |
| Задержка накладных расходов | По запросу | Менее 50 миллисекунда |
| Скрипты инициализации | Скрипты инициализации не поддерживаются. | |
| Ограничения скорости API-интерфейсов модели Foundation | В расчете на рабочую область | Дополнительные сведения об ограничениях по скорости и квотах для API модели Foundation см. в разделе "Оплата за токен" и ограничения на предоставленную пропускную способность. |
Ограничения сети и безопасности
- Конечные точки обслуживания моделей защищены с помощью управления доступом и уважают правила входящего трафика, связанные с сетью, настроенные в рабочей области, такие как списки разрешений IP и приватный канал.
- Частное подключение (например, Приватный канал Azure) поддерживается только для конечных точек обслуживания моделей, использующих подготовленную пропускную способность или конечные точки, обслуживающие пользовательские модели.
- По умолчанию Model Serving не поддерживает Private Link для внешних конечных точек (например, Azure OpenAI). Поддержка этой функции оценивается и реализуется на основе каждого региона. Свяжитесь с командой по работе с учетными записями Azure Databricks для получения дополнительной информации.
- Модельный сервис не предоставляет обновления безопасности для имеющихся образов моделей из-за риска дестабилизации в производственных развертываниях. Новый образ модели, созданный из новой версии модели, будет содержать последние исправления. Обратитесь к группе учетных записей Databricks, чтобы получить дополнительные сведения.
Стандарты профиля безопасности соответствия требованиям: рабочие нагрузки ЦП
В следующей таблице перечислены поддерживаемые стандарты соответствия профилю безопасности для основных функций обслуживания моделей на рабочих нагрузках ЦП.
Примечание.
Эти стандарты соответствия требуют, чтобы контейнеры были созданы в течение последних 30 дней. Databricks автоматически перестраивает устаревшие контейнеры от вашего имени. Однако если это автоматическое задание завершается сбоем, появится сообщение журнала событий, например следующее, и содержит рекомендации по обеспечению соответствия конечным точкам:
"Databricks couldn't complete a scheduled compliance check for model $servedModelName. This can happen if the system can't apply a required update. To resolve, try relogging your model. If the issue persists, contact support@databricks.com."
| Регион | Местоположение | HIPAA | HITRUST | PCI-DSS | ИРАП (IRAP) | CCCS Medium (Защищенный уровень B) | Cyber Essentials Plus (Соединенное Королевство) |
|---|---|---|---|---|---|---|---|
australiacentral |
Центральная Австралия | ||||||
australiacentral2 |
АвстралияCentral2 | ||||||
australiaeast |
Восточная Австралия | ✓ | ✓ | ✓ | |||
australiasoutheast |
Австралия Юго-Восток | ||||||
brazilsouth |
Южная Бразилия | ✓ | ✓ | ✓ | |||
canadacentral |
Канада Централ | ✓ | ✓ | ✓ | |||
canadaeast |
КанадаИст | ||||||
centralindia |
CentralIndia | ✓ | ✓ | ✓ | |||
centralus |
Центральная часть США | ✓ | ✓ | ✓ | |||
chinaeast2 |
ChinaEast2 | ||||||
chinaeast3 |
ChinaEast3 | ||||||
chinanorth2 |
ChinaNorth2 | ||||||
chinanorth3 |
ChinaNorth3 | ||||||
eastasia |
EastAsia | ✓ | ✓ | ✓ | |||
eastus |
Восточный регион США (EastUS) | ✓ | ✓ | ✓ | |||
eastus2 |
EastUS2 | ✓ | ✓ | ✓ | |||
francecentral |
FranceCentral | ✓ | ✓ | ✓ | |||
germanywestcentral |
ГерманияWestCentral | ✓ | ✓ | ✓ | |||
japaneast |
ЯпонияВосток | ✓ | ✓ | ✓ | |||
japanwest |
Япония Запад | ||||||
koreacentral |
КореяCentral | ✓ | ✓ | ✓ | |||
mexicocentral |
МексикаCentral | ||||||
northcentralus |
NorthCentralUS | ✓ | ✓ | ✓ | |||
northeurope |
NorthEurope | ✓ | ✓ | ✓ | |||
norwayeast |
Норвегия Восток | ||||||
qatarcentral |
КатарЦентрал | ||||||
southafricanorth |
Южная Африка Север | ||||||
southcentralus |
SouthCentralUS | ✓ | ✓ | ✓ | |||
southeastasia |
Юго-Восточная Азия | ✓ | ✓ | ✓ | |||
southindia |
Южная Индия | ||||||
swedencentral |
ШвецияCentral | ✓ | ✓ | ✓ | |||
switzerlandnorth |
Север Швейцарии | ✓ | ✓ | ✓ | |||
switzerlandwest |
ШвейцарияWest | ||||||
uaenorth |
ОАЭ Север | ✓ | ✓ | ✓ | |||
uksouth |
UKSouth | ✓ | ✓ | ✓ | ✓ | ||
ukwest |
UKWest | ||||||
westcentralus |
WestCentralUS | ||||||
westeurope |
WestEurope | ✓ | ✓ | ✓ | |||
westindia |
WestIndia | ||||||
westus |
ВестЮС | ✓ | ✓ | ✓ | |||
westus2 |
ВестУС2 | ✓ | ✓ | ✓ | |||
westus3 |
WestUS3 | ✓ | ✓ | ✓ |
Ограничения API основной модели
Подробные сведения об API-интерфейсах модели Foundation см. в следующем разделе:
- Ограничения скорости и квоты: ограничения частоты и квоты api модели Foundation . Включает ограничения TPM, региональные ограничения доступности и ограничения для конкретной модели.
- Соответствие требованиям и безопасность. Соответствие и безопасностьAPI модели Foundation — охватывает стандарты соответствия, обработку данных и требования к безопасности.
Доступность по регионам
Примечание.
Если требуется конечная точка в неподдерживаемом регионе, обратитесь к группе учетной записи Azure Databricks.
Если рабочая область развернута в регионе, поддерживающем обслуживание моделей, но управляется контроллером в неподдерживаемом регионе, рабочая область не поддерживает обслуживание моделей. Если вы пытаетесь использовать модель, обслуживаемую в такой рабочей области, вы увидите сообщение об ошибке о том, что ваша рабочая область не поддерживается. Свяжитесь с командой по работе с учетными записями Azure Databricks для получения дополнительной информации.
Дополнительные сведения о региональной доступности каждой функции обслуживания моделей см. в разделе "Доступность функций обслуживания моделей".
Сведения о доступности региона модели, размещенной в Databricks, см. в моделях Foundation, размещенных в Databricks.