Профили рабочей нагрузки в приложениях-контейнерах Azure

Профиль рабочей нагрузки определяет объем вычислительных ресурсов и ресурсов памяти, доступных для приложений-контейнеров, развернутых в среде.

Профили настроены в соответствии с различными потребностями приложений.

Тип графика Description Потенциальное использование
Потребление Автоматически добавляется в любую новую среду. Приложения, которые не требуют конкретных требований к оборудованию
Выделенный (общего назначения) Баланс памяти и вычислительных ресурсов Приложения, требующие больших объемов ЦП и (или) памяти
Выделенный (оптимизированная для памяти) Увеличение ресурсов памяти Приложения, которым требуется доступ к большим данным в памяти, моделям машинного обучения в памяти или другим высоким требованиям к памяти
Выделенный (GPU с поддержкой) (предварительная версия) GPU с увеличенным объемом памяти и вычислительными ресурсами, доступными в регионах западной части США 3 и Северной Европы. Приложения, для которых требуется GPU

Примечание.

При использовании профилей рабочих нагрузок с поддержкой GPU убедитесь, что приложение работает с последней версией CUDA.

Профиль рабочей нагрузки потребления — это профиль по умолчанию, добавленный к каждому типу среды профилей рабочей нагрузки. Вы можете добавить в среду профили выделенной рабочей нагрузки при создании среды или после ее создания. Среды профилей рабочих нагрузок развертываются отдельно от сред потребления.

Для каждого профиля выделенной рабочей нагрузки в вашей среде можно:

  • Выберите тип и размер
  • Развертывание нескольких приложений в профиле
  • Использование автомасштабирования для добавления и удаления экземпляров в зависимости от потребностей приложений
  • Ограничение масштабирования профиля для повышения затрат на управление

Вы можете настроить каждое из приложений для запуска в любом из профилей рабочей нагрузки, определенных в среде приложений контейнеров. Эта конфигурация идеально подходит для развертывания микрослужб, где каждое приложение может работать в соответствующей вычислительной инфраструктуре.

Примечание.

Вы можете применить только профиль рабочей нагрузки GPU к среде при создании среды.

Типы профилей пользователей

Существуют различные типы и размеры профилей рабочей нагрузки, доступные по регионам. По умолчанию каждый выделенный план включает профиль потребления, но вы также можете добавить любой из следующих профилей:

Отображаемое имя Имя. Виртуальные ЦП Память (ГиБ) GPU Категория Распределение
Потребление Потребление 4 8 - Потребление на реплика
Выделенный D4 D4 4 16 - Универсальные на узел
Выделенный D8 D8 8 32 - Универсальные на узел
Выделенный-D16 D16 16 64 - Универсальные на узел
Выделенный D32 D32 32 128 - Универсальные на узел
Выделенный E4 E4 4 32 - Оптимизированные для памяти на узел
Выделенный E8 E8 8 64 - Оптимизированные для памяти на узел
Выделенный E16 E16 16 128 - Оптимизированные для памяти на узел
Выделенный E32 E32 32 256 - Оптимизированные для памяти на узел
Dedicated-NC24-A100 (предварительная версия) NC24-A100 24 220 1 С графическим процессором на узел*
Dedicated-NC48-A100 (предварительная версия) NC48-A100 48 440 2 С графическим процессором на узел*
Dedicated-NC96-A100 (предварительная версия) NC96-A100 96 880 4 С графическим процессором на узел*

* Емкость выделяется на основе каждого случая. Отправьте запрос в службу поддержки, чтобы запросить объем емкости, необходимый для приложения.

Выберите профиль рабочей нагрузки и используйте поле "Имя " при запуске az containerapp env workload-profile set параметра --workload-profile-type .

Помимо различных размеров ядра и памяти профили рабочих нагрузок также имеют различные ограничения размера изображения. Дополнительные сведения о ограничениях размера изображения для приложений контейнеров см . в справочнике по оборудованию.

Доступность различных профилей рабочей нагрузки зависит от региона.

Потребление ресурсов

Вы можете ограничить использование памяти и ЦП каждого приложения в профиле рабочей нагрузки, а также запустить несколько приложений в одном экземпляре профиля рабочей нагрузки. Однако общий объем ресурсов, доступных приложению-контейнеру, меньше того, что выделяется профилем. Разница между выделенными и доступными ресурсами — это объем, зарезервированный средой выполнения контейнерных приложений.

Масштабирование

Если спрос на новые приложения или более реплика существующего приложения превышает текущие ресурсы профиля, можно добавить экземпляры профилей.

В то же время, если количество необходимых реплика опускается, экземпляры профиля могут быть удалены. У вас есть контроль над ограничениями на минимальное и максимальное количество экземпляров профиля.

Azure вычисляет выставление счетов в основном на основе количества запущенных экземпляров профиля.

Сеть

При использовании среды профиля рабочей нагрузки доступны дополнительные сетевые функции, которые полностью защищают входящий и исходящий сетевой трафик (например, определяемые пользователем маршруты). Дополнительные сведения о поддерживаемых сетевых функциях см. в статье "Сети" в среде приложений контейнеров Azure. Инструкции по защите сети с помощью контейнерных приложений см. в разделе "Блокировка среды приложения контейнера".

Следующие шаги