Обзор виртуальной машины серии HBv4

Применимо к: ✔️ Виртуальные машины Linux ✔️ Виртуальные машины Windows ✔️ Гибкие масштабируемые наборы ✔️ Универсальные масштабируемые наборы

Сервер серии HBv4 оснащен 2 процессорами EPYC 9V33X с 96 ядрами каждый, что в сумме составляет 192 физических ядра архитектуры "Zen4" с кэшем AMD 3D-V. Одновременная многопоточность (SMT) отключена в HBv4. Эти 192 ядра разделены на 24 раздела (12 на сокет), каждый раздел, содержащий восемь ядер процессора с универсальным доступом к кэшу L3 96 МБ. Серверы Azure HBv4 также выполняют следующие параметры AMD BIOS:

Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled

В результате сервер загружается с четырьмя областями NUMA (2 на сокет), размером 48 ядер каждая. Каждый NUMA имеет прямой доступ к шести каналам физической DRAM.

Чтобы предоставить место для гипервизора Azure для работы без вмешательства в работу виртуальной машины, мы резервируем 16 физических ядер на сервер.

Топология виртуальной машины

На следующей схеме показана топология сервера. Мы зарезервируем эти 16 ядер узла гипервизора (желтые) симметрично между обоими сокетами ЦП, выбирая первые два ядра из определенных кристаллов ядра блока (CCD) в каждом домене NUMA, оставшиеся ядра предназначены для виртуальной машины серии HBv4 (зеленые).

Снимок экрана: топология сервера серии HBv4

Граница CCD отличается от границы NUMA. В HBv4 группа из шести последовательных CCD настраивается как домен NUMA, как на уровне узла, так и на гостевой виртуальной машине. Таким образом, все размеры виртуальных машин HBv4 предоставляют четыре универсальных доменов NUMA, которые отображаются в ОС и приложении, как показано ниже, каждый из которых имеет разное количество ядер в зависимости от конкретного размера виртуальной машины HBv4.

Снимок экрана: топология виртуальных машин серии HBv4

Размер каждой виртуальной машины HBv4 аналогичен физическому макету, функциям и производительности другого ЦП от AMD EPYC 9V33X, как показано ниже.

Размер виртуальной машины серии HBv4 Домены NUMA Количество ядер на домен NUMA Сходство с AMD EPYC
Standard_HB176rs_v4 4 44 Двухсокетный EPYC 9684X
Standard_HB176-144rs_v4 4 36 Двухсокетный EPYC 9684X
Standard_HB176-96rs_v4 4 двадцать четыре Двухсокетный EPYC 9684X
Standard_HB176-48rs_v4 4 12 Двухсокетный EPYC 9384X
Standard_HB176-24rs_v4 4 6 Двухсокетный EPYC 9184X

Примечание.

  • Размеры виртуальных машин с ограниченным количеством ядер уменьшают только количество физических ядер, предоставленных виртуальной машине. Все глобальные общие ресурсы (ОЗУ, пропускная способность памяти, кэши, подключение GMI/xGMI, InfiniBand, Azure сеть Ethernet, локальный SSD) остаются постоянными. Это позволяет клиенту выбрать размер виртуальной машины, который лучше всего подходит для рабочей нагрузки или лицензирования программного обеспечения.

Сопоставление виртуальных NUMA каждого размера виртуальной машины HBv4 ведется в соответствии с базовой физической топологией NUMA. Нет потенциальной вводящей в заблуждение абстракции аппаратной топологии.

Точная топология для различных размеров виртуальных машин HBv4 выглядит следующим образом на основе выходных данных lstopo:

lstopo-no-graphics --no-io --no-legend --of txt

Выберите, чтобы просмотреть результат работы lstopo для Standard_HB176rs_v4

Выходные данные lstopo для виртуальной машины HBv4-176

Выберите, чтобы просмотреть выходные данные lstopo для Standard_HB176-144rs_v4

Выходные данные lstopo для виртуальной машины HBv4-144

Выберите, чтобы просмотреть выходные данные lstopo для Standard_HB176-96rs_v4

Выходные данные lstopo для виртуальной машины HBv4-64

Выберите, чтобы просмотреть выходные данные lstopo для модели Standard_HB176-48rs_v4

Результаты lstopo для виртуальной машины HBv4-32

Выберите, чтобы просмотреть выходные данные lstopo для Standard_HB176-24rs_v4

Результат lstopo для виртуальной машины HBv4-24

Сеть InfiniBand

Виртуальные машины HBv4 также имеют сетевые адаптеры NVIDIA Mellanox NDR InfiniBand (ConnectX-7), работающие в до 400 Гигабит/с. Сетевой адаптер передается виртуальной машине через SRIOV, что позволяет сетевому трафику обойти гипервизор. В результате клиенты загружают стандартные драйверы Mellanox OFED на виртуальных машинах HBv4 так, как если бы они работали в среде без виртуализации.

Виртуальные машины HBv4 поддерживают адаптивную маршрутизацию, динамический подключенный транспорт (DCT, в дополнение к стандартным транспортам RC и UD), а также аппаратные разгрузки коллективов MPI на встроенный процессор адаптера ConnectX-7. Эти функции повышают производительность приложений, масштабируемость и согласованность и рекомендуется использовать их.

Временное хранилище

Виртуальные машины HBv4 имеют три физически локальных SSD-устройства. Одно устройство предварительно отформатировано в качестве файла страницы и отображается в виртуальной машине как универсальное устройство SSD.

Два других более крупных SSD представлены как неформатированные блоковые устройства NVMe. Когда устройство NVMe как блочное обходит гипервизор, оно имеет более высокую пропускную способность и IOPS.

При подключении к массиву с чередованием NVMe SSD обеспечивают пропускную способность до 12 ГБ/с (на чтение) и 7 ГБ/с (на запись), а также до 186 000 операций ввода-вывода в секунду (на чтение) и 201 000 (на запись).

Характеристики оборудования

Характеристики оборудования Виртуальные машины серии HBv4
Ядра 176, 144, 96, 48 или 24 (SMT отключен)
ЦП AMD EPYC 9V33X
Частота ЦП (без AVX) 2,55 ГГц (базовая), 3,7 ГГц (повышение)
Память 768 ГБ (ОЗУ на ядро зависит от размера виртуальной машины)
Локальный диск 2 * 1,8 ТБ NVMe (блок), 480 ГБ SSD (файл страницы)
InfiniBand 400 Гб/с NVIDIA Mellanox ConnectX-7 NDR InfiniBand
Сеть 100 Гбит/с Ethernet (80 Гбит/с, доступно для использования) SmartNIC третьего поколения Azure

Характеристики программного обеспечения

Характеристики программного обеспечения Виртуальные машины серии HBv4
Максимальный размер задания MPI 52 800 ядер (300 виртуальных машин в одном масштабируемом наборе виртуальных машин при условии, что singlePlacementGroup=true)
Поддержка MPI HPC-X, OpenMPI, MVAPICH2, MPICH
Дополнительные платформы UCX, libfabric, PGAS
Поддержка службы хранилища Microsoft Azure Диски уровня "Стандартный" и "Премиум" (не более 32 дисков), Azure NetApp Files, Файлы Azure, Управляемая Azure система Lustre файловой системы
Поддерживаемая и проверенная ОС RHEL 8.6+, AlmaLinux 8.10+, Ubuntu 22.04+ LTS, SLES 15 SP7+, Windows Server 2022+
Рекомендуемая операционная система для повышения производительности AlmaLinux HPC 9.7, Ubuntu HPC 24.04, Windows Server 2025
Поддержка Orchestrator Azure CycleCloud, пакетная служба Azure, Служба Azure Kubernetes

Следующие шаги