Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Применимо к: ✔️ Виртуальные машины Linux ✔️ Виртуальные машины Windows ✔️ Гибкие масштабируемые наборы ✔️ Универсальные масштабируемые наборы
Сервер серии HBv4 оснащен 2 процессорами EPYC 9V33X с 96 ядрами каждый, что в сумме составляет 192 физических ядра архитектуры "Zen4" с кэшем AMD 3D-V. Одновременная многопоточность (SMT) отключена в HBv4. Эти 192 ядра разделены на 24 раздела (12 на сокет), каждый раздел, содержащий восемь ядер процессора с универсальным доступом к кэшу L3 96 МБ. Серверы Azure HBv4 также выполняют следующие параметры AMD BIOS:
Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled
В результате сервер загружается с четырьмя областями NUMA (2 на сокет), размером 48 ядер каждая. Каждый NUMA имеет прямой доступ к шести каналам физической DRAM.
Чтобы предоставить место для гипервизора Azure для работы без вмешательства в работу виртуальной машины, мы резервируем 16 физических ядер на сервер.
Топология виртуальной машины
На следующей схеме показана топология сервера. Мы зарезервируем эти 16 ядер узла гипервизора (желтые) симметрично между обоими сокетами ЦП, выбирая первые два ядра из определенных кристаллов ядра блока (CCD) в каждом домене NUMA, оставшиеся ядра предназначены для виртуальной машины серии HBv4 (зеленые).
Граница CCD отличается от границы NUMA. В HBv4 группа из шести последовательных CCD настраивается как домен NUMA, как на уровне узла, так и на гостевой виртуальной машине. Таким образом, все размеры виртуальных машин HBv4 предоставляют четыре универсальных доменов NUMA, которые отображаются в ОС и приложении, как показано ниже, каждый из которых имеет разное количество ядер в зависимости от конкретного размера виртуальной машины HBv4.
Размер каждой виртуальной машины HBv4 аналогичен физическому макету, функциям и производительности другого ЦП от AMD EPYC 9V33X, как показано ниже.
| Размер виртуальной машины серии HBv4 | Домены NUMA | Количество ядер на домен NUMA | Сходство с AMD EPYC |
|---|---|---|---|
| Standard_HB176rs_v4 | 4 | 44 | Двухсокетный EPYC 9684X |
| Standard_HB176-144rs_v4 | 4 | 36 | Двухсокетный EPYC 9684X |
| Standard_HB176-96rs_v4 | 4 | двадцать четыре | Двухсокетный EPYC 9684X |
| Standard_HB176-48rs_v4 | 4 | 12 | Двухсокетный EPYC 9384X |
| Standard_HB176-24rs_v4 | 4 | 6 | Двухсокетный EPYC 9184X |
Примечание.
- Размеры виртуальных машин с ограниченным количеством ядер уменьшают только количество физических ядер, предоставленных виртуальной машине. Все глобальные общие ресурсы (ОЗУ, пропускная способность памяти, кэши, подключение GMI/xGMI, InfiniBand, Azure сеть Ethernet, локальный SSD) остаются постоянными. Это позволяет клиенту выбрать размер виртуальной машины, который лучше всего подходит для рабочей нагрузки или лицензирования программного обеспечения.
Сопоставление виртуальных NUMA каждого размера виртуальной машины HBv4 ведется в соответствии с базовой физической топологией NUMA. Нет потенциальной вводящей в заблуждение абстракции аппаратной топологии.
Точная топология для различных размеров виртуальных машин HBv4 выглядит следующим образом на основе выходных данных lstopo:
lstopo-no-graphics --no-io --no-legend --of txt
Выберите, чтобы просмотреть результат работы lstopo для Standard_HB176rs_v4
Выберите, чтобы просмотреть выходные данные lstopo для Standard_HB176-144rs_v4
Выберите, чтобы просмотреть выходные данные lstopo для Standard_HB176-96rs_v4
Выберите, чтобы просмотреть выходные данные lstopo для модели Standard_HB176-48rs_v4
Выберите, чтобы просмотреть выходные данные lstopo для Standard_HB176-24rs_v4
Сеть InfiniBand
Виртуальные машины HBv4 также имеют сетевые адаптеры NVIDIA Mellanox NDR InfiniBand (ConnectX-7), работающие в до 400 Гигабит/с. Сетевой адаптер передается виртуальной машине через SRIOV, что позволяет сетевому трафику обойти гипервизор. В результате клиенты загружают стандартные драйверы Mellanox OFED на виртуальных машинах HBv4 так, как если бы они работали в среде без виртуализации.
Виртуальные машины HBv4 поддерживают адаптивную маршрутизацию, динамический подключенный транспорт (DCT, в дополнение к стандартным транспортам RC и UD), а также аппаратные разгрузки коллективов MPI на встроенный процессор адаптера ConnectX-7. Эти функции повышают производительность приложений, масштабируемость и согласованность и рекомендуется использовать их.
Временное хранилище
Виртуальные машины HBv4 имеют три физически локальных SSD-устройства. Одно устройство предварительно отформатировано в качестве файла страницы и отображается в виртуальной машине как универсальное устройство SSD.
Два других более крупных SSD представлены как неформатированные блоковые устройства NVMe. Когда устройство NVMe как блочное обходит гипервизор, оно имеет более высокую пропускную способность и IOPS.
При подключении к массиву с чередованием NVMe SSD обеспечивают пропускную способность до 12 ГБ/с (на чтение) и 7 ГБ/с (на запись), а также до 186 000 операций ввода-вывода в секунду (на чтение) и 201 000 (на запись).
Характеристики оборудования
| Характеристики оборудования | Виртуальные машины серии HBv4 |
|---|---|
| Ядра | 176, 144, 96, 48 или 24 (SMT отключен) |
| ЦП | AMD EPYC 9V33X |
| Частота ЦП (без AVX) | 2,55 ГГц (базовая), 3,7 ГГц (повышение) |
| Память | 768 ГБ (ОЗУ на ядро зависит от размера виртуальной машины) |
| Локальный диск | 2 * 1,8 ТБ NVMe (блок), 480 ГБ SSD (файл страницы) |
| InfiniBand | 400 Гб/с NVIDIA Mellanox ConnectX-7 NDR InfiniBand |
| Сеть | 100 Гбит/с Ethernet (80 Гбит/с, доступно для использования) SmartNIC третьего поколения Azure |
Характеристики программного обеспечения
| Характеристики программного обеспечения | Виртуальные машины серии HBv4 |
|---|---|
| Максимальный размер задания MPI | 52 800 ядер (300 виртуальных машин в одном масштабируемом наборе виртуальных машин при условии, что singlePlacementGroup=true) |
| Поддержка MPI | HPC-X, OpenMPI, MVAPICH2, MPICH |
| Дополнительные платформы | UCX, libfabric, PGAS |
| Поддержка службы хранилища Microsoft Azure | Диски уровня "Стандартный" и "Премиум" (не более 32 дисков), Azure NetApp Files, Файлы Azure, Управляемая Azure система Lustre файловой системы |
| Поддерживаемая и проверенная ОС | RHEL 8.6+, AlmaLinux 8.10+, Ubuntu 22.04+ LTS, SLES 15 SP7+, Windows Server 2022+ |
| Рекомендуемая операционная система для повышения производительности | AlmaLinux HPC 9.7, Ubuntu HPC 24.04, Windows Server 2025 |
| Поддержка Orchestrator | Azure CycleCloud, пакетная служба Azure, Служба Azure Kubernetes |
Следующие шаги
- Ознакомьтесь с последними объявлениями, примерами рабочей нагрузки HPC, а также результатами оценки производительности в блогах технического сообщества Вычислений Azure.
- Сведения о более высоком уровне архитектурного представления выполнения рабочих нагрузок HPC см. в статье Высокопроизводительные вычисления (HPC) в Azure.