Поделиться через


Высокопроизводительные вычисления на виртуальных машинах серии HB и N с InfiniBand

Применимо к: ✔️ Виртуальные машины Linux ✔️ Виртуальные машины Windows ✔️ Универсальные масштабируемые наборы

Виртуальные машины серии H и N с Azure InfiniBand предназначены для обеспечения максимальной производительности, масштабируемости Message Passing Interface (MPI) и эффективности затрат для различных реальных рабочих нагрузок HPC и искусственного интеллекта (ИИ). Эти виртуальные машины, оптимизированные для высокопроизводительных вычислений (HPC), позволяют решить некоторые из наиболее ресурсоемких проблем в науке и технике, например в гидродинамике, моделировании недр, метеорологической ситуации и т. д.

В этих статьях описывается, как приступить к работе на виртуальных машинах серии H и N с InfiniBand в Azure, а также оптимальная конфигурация рабочих нагрузок HPC и ИИ на виртуальных машинах для обеспечения масштабируемости.

Функции и возможности

Виртуальные машины серии HB с поддержкой InfiniBand и серии N предназначены для обеспечения оптимальной производительности HPC, масштабируемости MPI и экономичности для рабочих нагрузок HPC. Дополнительные сведения о функциях и возможностях виртуальных машин серии HB см. в статье О виртуальных машинах серии HB и серии N.

RDMA и InfiniBand

Виртуальные машины серии HB и N-серии RDMA взаимодействуют по низкой задержке и сети InfiniBand с высокой пропускной способностью. Поддержка RDMA в таком взаимодействии очень важна для повышения масштабируемости и производительности рабочих нагрузок распределенного узла HPC и ИИ. Виртуальные машины серии H и N с InfiniBand соединены в неблокируемое утолщенное дерево с небольшим размером программной архитектуры для оптимизированной и согласованной производительности RDMA. Дополнительные сведения о настройке InfiniBand на виртуальных машинах с InfiniBand см. в статье о включении InfiniBand.

Интерфейс передачи сообщений

Серия HB с поддержкой SR-IOV и серии N поддерживают почти все библиотеки и версии MPI. Вот некоторые из наиболее часто используемых библиотек MPI: Intel MPI, OpenMPI, HPC-X, MVAPICH2, MPICH, Platform MPI. Поддерживаются все команды удаленного доступа к памяти (RDMA). Дополнительные сведения об установке различных поддерживаемых библиотек MPI и их оптимальной конфигурации см. в статье о настройке MPI.

Начало работы

Первым шагом является выбор типа виртуальной машины серии HB и серии N для рабочей нагрузки на основе спецификаций виртуальной машины и возможностей RDMA. Во-вторых, настройте виртуальную машину, включив InfiniBand. Это можно сделать разными способами, включая использование оптимизированных образов виртуальных машин со встроенными драйверами. Дополнительные сведения см. в статьях об оптимизации Linux и включении InfiniBand. В-третьих, для рабочих нагрузок распределенных узлов важно выбрать и соответствующим образом настроить MPI. Дополнительные сведения см. в статье о настройке MPI. В-четвертых, для обеспечения производительности и масштабируемости оптимально настройте рабочие нагрузки, следуя указаниям для семейства виртуальных машин в статьях с обзором виртуальных машин серии HBv3 и HC.

Следующие шаги