Серия ND MI300X v5

Мақала
05/21/2024

Область применения: ✔️ Виртуальные машины Linux ✔️ Гибкие масштабируемые наборы ✔️ Универсальные масштабируемые наборы

Виртуальная машина серии ND MI300X версии 5 — это новое флагманское дополнение к семейству GPU Azure. Она была разработана для высокоуровневого обучения глубокого обучения и тесно связана с масштабируемыми и масштабируемыми рабочими нагрузками ИИ и HPC.

Виртуальная машина серии ND MI300X версии 5 начинается с восьми графических процессоров AMD Instinct MI300 и двух четвертых процессоров Intel Xeon Scalable для всего 96 физических ядер. Затем каждый GPU в виртуальной машине подключается друг к другу через 4-го поколения AMD Infinity Fabric связи с пропускной способностью 128 ГБ/с на GPU и 896 ГБ/с агрегированной пропускной способности.

Развертывания на основе ND MI300X версии 5 могут масштабироваться до тысяч gpu с пропускной способностью 3,2 ТБ/с пропускной способности взаимодействия на каждую виртуальную машину. Каждый GPU в виртуальной машине предоставляется с собственным выделенным подключением InfiniBand, не зависящим от топологии 400 ГБ/с NVIDIA Quantum-2 CX7. Эти подключения автоматически настраиваются между всеми виртуальными машинами, которые входят в один масштабируемый набор виртуальных машин, и поддерживают технологию GPUDirect RDMA.

Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch и другие платформы. Кроме того, межсоединение InfiniBand поддерживает большой набор существующих средств ИИ и HPC, созданных на базе библиотеки roCm Communication Collectives (RCCL) AMD для эффективного кластеризации gpu.

Спецификации узлов

Часть	Количество Подсчет единиц	Очки Идентификатор SKU, единицы производительности и т. д.
Процессор	96 виртуальных ядер	Intel® Xeon® Scalable (Sapphire Rapids)
Память	1850 ГиБ
Локальное хранилище	1 диск	1000 ГиБ
Удаленные диски	32 диска	40800 операций ввода-вывода в секунду 612 МБИТ/с
Network	8 сетевых адаптеров	80000 Мбит/с
Ускорители	8 GPU	AMD MI300X 192 ГиБ 1535 ГиБ на виртуальную машину

Поддерживаемые компоненты

Хранилище класса Premium: поддерживается
Кэширование в хранилище класса Premium: поддерживается
Диск "Ультра": поддерживается дополнительные сведения о доступности, использовании и производительности
Динамическая миграция: не поддерживается
Обновления с сохранением памяти: не поддерживаются
Поддержка создания виртуальных машин: поколение 2
Ускорение сети: поддерживается
Временные диски ОС: поддерживаемые
Infiniband: Поддерживается, GPUDirect RDMA, 8x400 Гигабит NDR
Вложенная виртуализация: не поддерживается

Внимание

Чтобы приступить к работе с виртуальными машинами ND MI300X версии 5, см. инструкции по настройке и оптимизации рабочей нагрузки HPC, включая конфигурацию драйвера и сети. Из-за увеличения объема памяти gpu ввода-вывода ND MI300X версии 5 требуется использование виртуальных машин поколения 2 и образов Marketplace.

Размеры рядов

Размер	Виртуальные ЦП	Память, ГиБ	Временное хранилище (SSD): ГиБ	GPU	Гиб памяти GPU	Макс. количество дисков данных	Максимальная пропускная способность дисков без кэширования: операций ввода-вывода в секунду / МБит/с	Максимальная пропускная способность сети	Макс. количество сетевых адаптеров
Standard_ND96isr_MI300X_v5	96	1850	1000	8 MI300X	192	32	40800/612	80 000 Мбит/с	8

Определение размера

Емкость хранилища отображается в единицах ГиБ (1 ГиБ = 1024^3 байтов). При сравнении емкости дисков в ГБ (1000^3 байтов) с емкостью дисков в ГиБ (1024^3 байтов) помните, что значения емкости в ГиБ могут казаться меньше, чем в ГБ. Например, 1023 ГиБ = 1098,4 ГБ.
Пропускная способность дисков измеряется в операциях ввода-вывода в секунду (IOPS) и МБит/с, где 1 МБит/с = 10^6 байтов в секунду.
Диски данных могут работать в режиме кэширования и в режиме без кэширования. Чтобы использовать кэширование диска данных, для режима кэширования узла следует задать значение ReadOnly или ReadWrite. Чтобы не использовать кэширование диска данных, для режима кэширования узла следует задать значение None.
Сведения о том, как получить оптимальную производительность хранилища для виртуальных машин, см. в статье Производительность диска и виртуальной машины.
Ожидаемая пропускная способность сети — это максимальная агрегированная пропускная способность , выделенная для каждого типа виртуальной машины для всех сетевых адаптеров. Чтобы получить дополнительную информацию, см. Пропускная способность сети для виртуальных машин.

Верхние пределы не гарантированы. Пределы предлагают руководство по выбору типа виртуальной машины, подходящего для предполагаемого приложения. Фактическая производительность сети зависит от нескольких факторов, в том числе загрузки сети и приложения, а также параметров сети. Сведения об оптимизации пропускной способности см. в статье Оптимизация пропускной способности сети для виртуальных машин Azure. Чтобы обеспечить ожидаемую производительность сети на виртуальных машинах Linux или Windows, возможно, потребуется выбрать определенную версию виртуальной машины или оптимизировать ее. Чтобы получить дополнительную информацию, см. Проверка пропускной способности (NTTTCP).

Другие сведения о размере

Список всех доступных размеров: размеры

Калькулятор цен: Калькулятор цен

Сведения о типах дисков: типы дисков

Следующие шаги

Узнайте больше о том, как с помощью единиц вычислений Azure (ACU) сравнить производительность вычислений для различных номеров SKU Azure.

Ознакомьтесь с выделенными узлами Azure для физических серверов, которые могут размещать одну или несколько виртуальных машин, назначенных одной подписке Azure.

Узнайте, как отслеживать виртуальные машины Azure.

Бөлісу құралы: