Обзор виртуальных машин серии HBv2

Внимание

Эта статья ссылается на CentOS, дистрибутив Linux, который приближается к состоянию конца жизни (EOL). Обратите внимание на использование и план соответствующим образом. Дополнительные сведения см. в руководстве centOS End Of Life.

Применяется к: ✔️ виртуальные машины Linux Для виртуальных машин ✔️ ✔️ Windows Гибкие масштабируемые наборы ✔️ универсальных масштабируемых наборов.

Для обеспечения максимальной производительности приложений для высокопроизводительных вычислений (HPC) на процессорах AMD EPYC требуется продуманный подход к локализации памяти и размещению процессов. Далее рассматривается архитектура AMD EPYC и наш вариант ее реализации в Azure для приложений HPC. Мы используем термин pNUMA для ссылки на физический домен NUMA и vNUMA для ссылки на виртуализированный домен NUMA.

Физически сервер серии HBv2 составляет 2 * 64 ядра EPYC 7V12 для 128 физических ядер. Одновременная многопоточность (SMT) отключена в HBv2. Эти 128 ядер делятся на 16 разделов (8 на сокет), каждый раздел, содержащий 8 ядер процессора. Серверы Azure HBv2 также выполняют следующие параметры AMD BIOS:

Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled

В результате сервер загружается с 4 доменаМИ NUMA (2 на сокет) каждый 32 ядра в размере. Каждый NUMA имеет прямой доступ к 4 каналам физической памяти DRAM со скоростью 3200 MT/с.

Чтобы работа гипервизора Azure не мешала работе виртуальной машины, мы резервируем 8 физических ядер для каждого сервера.

Топология виртуальной машины

Мы зарезервируем эти 8 ядер узла гипервизора симметрично по обоим сокетам ЦП, принимая первые 2 ядра из конкретных основных сложных dies (CCD) на каждом домене NUMA с оставшимися ядрами для виртуальной машины серии HBv2. Граница CCD не эквивалентна границе NUMA. В HBv2 группа из четырех последовательных (4) CCD настраивается как домен NUMA, как на уровне узла, так и в гостевой виртуальной машине. Таким образом, все размеры виртуальных машин HBv2 предоставляют 4 домена NUMA, которые отображаются в ОС и приложении. 4 универсальных доменов NUMA, каждый из которых отличается от количества ядер в зависимости от конкретного размера виртуальной машины HBv2.

Закрепление процессов работает на виртуальных машинах серии HBv2, так как мы предоставляем базовый кремний как есть гостевой виртуальной машине. Мы настоятельно рекомендуем закреплять процесс для обеспечения оптимальной производительности и согласованности.

Характеристики оборудования

Характеристики оборудования Виртуальная машина серии HBv2
Ядра 120 (одновременная многопотоковая обработка отключена)
ЦП AMD EPYC 7V12
Частота ЦП (без AVX) ~3,1 ГГц (одно ядро + все ядра)
Память 4 ГБ на ядро (всего 480 ГБ)
Локальный диск 960 ГиБ NVMe (блок), 480 ГБ SSD (файл страницы)
Infiniband 200 Гб/с HDR Mellanox Подключение X-6
Network Ethernet 50 Гбит/с (доступно 40 Гбит/с) Azure SmartNIC второго поколения

Характеристики программного обеспечения

Характеристики программного обеспечения Виртуальная машина серии HBv2
Максимальный размер задания MPI 36 000 ядер (300 виртуальных машин в одном масштабируемом наборе виртуальных машин с параметром singlePlacementGroup = true)
Поддержка MPI HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, платформа MPI
Дополнительные платформы UCX, libfabric, PGAS
Поддержка службы хранилища Microsoft Azure Диски уровня "Стандарт" и "Премиум" (максимум 8 дисков)
Поддержка ОС для SRIOV RDMA CentOS/RHEL 7.9+, Ubuntu 18.04+, SLES 12 SP5+, WinServer 2016+
Поддержка Orchestrator CycleCloud, пакетная служба, AKS; параметры конфигурации кластера

Примечание.

Windows Server 2012 R2 не поддерживается на HBv2 и других виртуальных машинах, имеющих больше 64 ядер (виртуальных или физических). Дополнительные сведения см. в статье "Поддерживаемые гостевые операционные системы Windows" для Hyper-V на Windows Server.

Следующие шаги