Высокопроизводительные вычисления на виртуальных машинах серии HB и N с поддержкой InfiniBand

Применимо к: ✔️ Виртуальные машины Linux ✔️ Виртуальные машины Windows ✔️ Универсальные масштабируемые наборы

Виртуальные машины серии H и N с Azure InfiniBand предназначены для обеспечения максимальной производительности, масштабируемости Message Passing Interface (MPI) и эффективности затрат для различных реальных рабочих нагрузок HPC и искусственного интеллекта (ИИ). Эти виртуальные машины, оптимизированные для высокопроизводительных вычислений (HPC), позволяют решить некоторые из наиболее ресурсоемких проблем в науке и технике, например в гидродинамике, моделировании недр, метеорологической ситуации и т. д.

В этих статьях описывается, как приступить к работе на виртуальных машинах серии H и N с InfiniBand в Azure, а также оптимальная конфигурация рабочих нагрузок HPC и ИИ на виртуальных машинах для обеспечения масштабируемости.

Функции и возможности

Виртуальные машины серии HB и N с поддержкой InfiniBand предназначены для обеспечения наилучшей производительности HPC, масштабируемости MPI и экономичности для рабочих нагрузок HPC. Дополнительные сведения о функциях и возможностях виртуальных машин см. в статье Виртуальные машины серии HB и N .

RDMA и InfiniBand

Виртуальные машины серии HB и N с поддержкой RDMA обмениваются данными по сети InfiniBand с низкой задержкой и высокой пропускной способностью. Поддержка RDMA в таком взаимодействии очень важна для повышения масштабируемости и производительности рабочих нагрузок распределенного узла HPC и ИИ. Виртуальные машины серии H и N с InfiniBand соединены в неблокируемое утолщенное дерево с небольшим размером программной архитектуры для оптимизированной и согласованной производительности RDMA. Дополнительные сведения о настройке InfiniBand на виртуальных машинах с InfiniBand см. в статье о включении InfiniBand.

Интерфейс передачи сообщений

Серии HB и N с поддержкой SR-IOV поддерживают почти все библиотеки и версии MPI. Вот некоторые из наиболее часто используемых библиотек MPI: Intel MPI, OpenMPI, HPC-X, MVAPICH2, MPICH, Platform MPI. Поддерживаются все команды удаленного доступа к памяти (RDMA). Дополнительные сведения об установке различных поддерживаемых библиотек MPI и их оптимальной конфигурации см. в статье о настройке MPI.

Начало работы

Первым шагом является выбор типа виртуальных машин серии HB и N , оптимальных для рабочей нагрузки на основе спецификаций виртуальной машины и возможностей RDMA. Во-вторых, настройте виртуальную машину, включив InfiniBand. Это можно сделать разными способами, включая использование оптимизированных образов виртуальных машин со встроенными драйверами. Дополнительные сведения см. в статьях об оптимизации Linux и включении InfiniBand. В-третьих, для рабочих нагрузок распределенных узлов важно выбрать и соответствующим образом настроить MPI. Дополнительные сведения см. в статье о настройке MPI. В-четвертых, для обеспечения производительности и масштабируемости оптимально настройте рабочие нагрузки, следуя указаниям для семейства виртуальных машин в статьях с обзором виртуальных машин серии HBv3 и HC.

Дальнейшие действия