Серия размеров виртуальных машин с ускорением gpu в подсеть ND
Применимо к: ✔️ Виртуальные машины Linux ✔️ Виртуальные машины Windows ✔️ Универсальные масштабируемые наборы
Семейство размеров виртуальных машин типа ND — это один из экземпляров виртуальной машины с ускорением GPU Azure. Они предназначены для глубокого обучения, исследования ИИ и высокопроизводительных вычислительных задач, которые пользуются мощным ускорением GPU. Оснащенные графическими процессорами NVIDIA, виртуальные машины серии ND предлагают специализированные возможности для обучения и вывода сложных моделей машинного обучения, упрощая более быстрые вычисления и эффективную обработку больших наборов данных. Это делает их особенно хорошо подходит для академических и коммерческих приложений в разработке и имитации ИИ, где передовые технологии GPU важны для достижения быстрых и точных результатов обработки нейронной сети и других вычислительных интенсивных задач.
Рабочие нагрузки и варианты использования
ИИ и глубокое обучение. Виртуальные машины семейства ND идеально подходят для обучения и развертывания сложных моделей глубокого обучения. Оснащен мощными GPU NVIDIA, они обеспечивают вычислительные мощности, необходимые для обработки обширного обучения нейронной сети с большими наборами данных, значительно сокращая время обучения.
Высокопроизводительные вычисления (HPC): виртуальные машины семейства ND подходят для приложений HPC, требующих ускорения GPU. Такие области, как научные исследования, моделирование инженерных вычислений (например, динамики вычислительной жидкости) и геномическая обработка могут воспользоваться возможностями вычислений с высокой пропускной способностью виртуальных машин серии ND.
Отрисовка графики: графические процессоры семейства ND делают их отличным выбором для графических задач с интенсивным графикой, включая отрисовку в режиме реального времени для анимации и производства видео, а также имитации высокой точности для сред виртуальной реальности.
Удаленная визуализация: виртуальные машины семейства ND можно использовать для удаленной визуализации задач с интенсивным доступом к данным, где для обработки и отрисовки сложных визуализаций в облаке требуется высокий уровень возможностей GPU, упрощающий доступ с менее мощных клиентских компьютеров.
Серия в семействе
Серия ND версии 1
Виртуальные машины серии ND — это новое дополнение к семейству GPU, предназначенное для рабочих нагрузок ИИ и глубокого обучения. Они обеспечивают превосходную производительность для обучения и вывода. Экземпляры ND созданы на базе GPU NVIDIA Tesla P40 и процессоров Intel Xeon E5-2690 v4 (Broadwell). Эти экземпляры обеспечивают высокую производительность для операций одиночной точности с числами с плавающей запятой, а также для рабочих нагрузок ИИ, в которых используются Microsoft Cognitive Toolkit, TensorFlow, Caffe и другие платформы. В серии ND значительно увеличен объем памяти графического процессора (24 ГБ), что позволяет работать с моделями нейронных сетей гораздо большего размера. Как и в серии NC, конфигурация серии ND предусматривает низкую задержку (менее секунды), высокую пропускную способность сети за счет использования RDMA и подключение InfiniBand. Это позволяет выполнять масштабные задания, связанные с обучением, в которых задействованы многочисленные GPU.
Просмотрите полную страницу серии ND.
Часть | Количество Подсчет единиц |
Очки Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 6 – 24виртуальных ядер | Intel® Xeon® E5-2690 v4 (Broadwell) |
Память | 112 - 448ГиБ | |
Диски данных | 12 — 32диска | 20000 – 80000операций ввода-вывода в секунду / 200 – 800мб/с |
Network | 4 – 8сетевых адаптеров | |
Ускорители | 1 – 4GPU | NVIDIA Tesla P40 24ГиБ 24 – 96ГиБ на виртуальную машину |
Серия NDv2
Виртуальные машины серии NDv2 представляют собой новое пополнение семейства графических процессоров для наиболее требовательных задач ИИ с поддержкой ускорения за счет GPU, машинного обучения, моделирования и рабочих нагрузок HPC. NDv2 работает на основе 8 процессоров GPU NVIDIA Tesla V100, подключенных по NVLINK, каждый из которых оснащен 32 ГБ памяти GPU. У каждой виртуальной машины NDv2 есть также 40 процессоров Intel Xeon Platinum 8168 (Skylake) без технологии Hyper-Threading и 672 ГиБ системной памяти. Экземпляры NDv2 обеспечивают превосходную производительность для рабочих нагрузок HPC и ИИ, которые используют ядра вычислений, оптимизированные для GPU на основе CUDA, а также для многих средств ИИ, машинного обучения и аналитики со стандартной поддержкой ускорения GPU, например TensorFlow, Pytorch, Caffe, RAPIDS и других платформ. Важно отметить, что NDv2 рассчитаны на ресурсоемкие рабочие нагрузки с возможностью как вертикального увеличения масштаба (за счет использования 8 GPU для каждой виртуальной машины), так и горизонтального увеличения масштаба (работа нескольких виртуальных машин вместе). Серия NDv2 теперь поддерживает 100-гигабитную межсерверную сеть InfiniBand EDR, аналогичную той, что доступна на виртуальных машинах серии HB для высокопроизводительных вычислений. Это обеспечивает эффективную кластеризацию для сценариев параллельной обработки, включая распределенное обучение для ИИ и машинного обучения. Эта межсерверная сеть поддерживает все основные протоколы InfiniBand, включая те, что используются библиотеками NCCL2 NVIDIA. Это позволяет эффективно выполнять кластеризацию процессоров GPU.
Просмотр полной страницы серии NDv2
Часть | Количество Подсчет единиц |
Очки Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 40виртуальных ядер | Intel® Xeon® Platinum 8168 (Skylake) |
Память | 672ГиБ | |
Диски данных | 32диска | 80000операций ввода-вывода в секунду / 800МБИТ/с |
Network | 8сетевых адаптеров | 24000Мбит/с |
Ускорители | 8GPU | NVIDIA V100 (NVLink) 32ГиБ 256ГиБ на виртуальную машину |
серия ND_A100_v4
Виртуальная машина серии ND A100 версии 4 — это новое флагманское дополнение к семейству GPU Azure. Она предназначена для высокоуровневого обучения глубокого обучения и тесно связана с масштабируемыми и масштабируемыми рабочими нагрузками HPC. Серия ND A100 версии 4 начинается с одной виртуальной машины и восьми GPU NVIDIA Ampere A100 40 ГБ Tensor Core. Развертывания на основе ND A100 версии 4 могут масштабироваться до тысяч GPU с пропускной способностью 1,6 ТБ/с пропускной способности взаимодействия на каждую виртуальную машину. Каждый ГРАФИЧЕСКИй процессор в виртуальной машине предоставляется с собственным выделенным подключением 200 ГБ/с NVIDIA Mellanox HDR InfiniBand. Эти подключения автоматически настраиваются между всеми виртуальными машинами, которые входят в один масштабируемый набор виртуальных машин, и поддерживают технологию GPUDirect RDMA. Каждый GPU включает подключение NVLINK 3.0 для обмена данными в виртуальной машине, а экземпляр поддерживается 96 физическими 2-го поколения AMD Epyc™ 7V12 (Рим) ядрами ЦП. Эти экземпляры обеспечивают великолепную производительность для многих средств аналитики, машинного обучения и искусственного интеллекта, которые в стандартной конфигурации поддерживают ускорение GPU, в том числе TensorFlow, Pytorch, Caffe, RAPIDS и другие платформы. Кроме того, межсоединение InfiniBand поддерживается большим набором существующих средств искусственного интеллекта и HPC, созданных на основе библиотек коммуникации NVIDIA NCCL2 для эффективного кластеризации графических процессоров.
Просмотрите полную страницу серии ND_A100_v4.
Часть | Количество Подсчет единиц |
Очки Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 96виртуальных ядер | AMD Epyc™ 7V12 (Рим) |
Память | 900ГиБ | |
Диски данных | 32диска | 80000операций ввода-вывода в секунду / 800МБИТ/с |
Network | 8 сетевых адаптеров | 24000Мбит/с |
Ускорители | 8GPU | NVIDIA A100 (NVLink) 40ГиБ 320ГиБ на виртуальную машину |
Серия NDm_A100_v4
Виртуальная машина серии NDm A100 версии 4 — это новое флагманское дополнение к семейству GPU Azure. Она предназначена для высокоуровневого обучения глубокого обучения и тесно связана с масштабируемыми и масштабируемыми рабочими нагрузками HPC. Серия NDm A100 версии 4 начинается с одной виртуальной машины и восьми GPU NVIDIA Ampere A100 80 ГБ Tensor Core. Развертывания NDm A100 версии 4 могут масштабироваться до тысяч GPU с пропускной способностью 1,6 ТБ/с пропускной способности взаимодействия на каждую виртуальную машину. Каждый ГРАФИЧЕСКИй процессор в виртуальной машине предоставляется с собственным выделенным подключением 200 ГБ/с NVIDIA Mellanox HDR InfiniBand. Эти подключения автоматически настраиваются между всеми виртуальными машинами, которые входят в один масштабируемый набор виртуальных машин, и поддерживают технологию GPUDirect RDMA. Каждый GPU включает подключение NVLINK 3.0 для обмена данными в виртуальной машине, а экземпляр поддерживается 96 физическими 2-го поколения AMD Epyc™ 7V12 (Рим) ядрами ЦП. Эти экземпляры обеспечивают великолепную производительность для многих средств аналитики, машинного обучения и искусственного интеллекта, которые в стандартной конфигурации поддерживают ускорение GPU, в том числе TensorFlow, Pytorch, Caffe, RAPIDS и другие платформы. Кроме того, межсоединение InfiniBand поддерживается большим набором существующих средств искусственного интеллекта и HPC, созданных на основе библиотек коммуникации NVIDIA NCCL2 для эффективного кластеризации графических процессоров.
Просмотрите полную страницу серии NDm_A100_v4.
Часть | Количество Подсчет единиц |
Очки Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 96виртуальных ядер | AMD Epyc™ 7V12 (Рим) |
Память | 900ГиБ | |
Диски данных | 32диска | 80000операций ввода-вывода в секунду / 800МБИТ/с |
Network | 8сетевых адаптеров | 24000Мбит/с |
Ускорители | 8GPU | NVIDIA A100 (NVLink) 80ГиБ 640ГиБ на виртуальную машину |
серия ND_H100_v5
Виртуальная машина серии ND H100 v5 — это новое флагманское дополнение к семейству GPU Azure. Она предназначена для высокоуровневого обучения глубокого обучения и тесно связана с масштабируемыми и масштабируемыми рабочими нагрузками ИИ и HPC. Серия ND H100 v5 начинается с одной виртуальной машины и восьми gpu NVIDIA H100 Tensor Core. Развертывания на основе ND H100 версии 5 могут масштабироваться до тысяч gpu с 3,2Tb/с пропускной способности взаимодействия на каждую виртуальную машину. Каждый GPU в виртуальной машине предоставляется с собственным выделенным подключением InfiniBand, не зависящим от топологии 400 ГБ/с NVIDIA Quantum-2 CX7. Эти подключения автоматически настраиваются между всеми виртуальными машинами, которые входят в один масштабируемый набор виртуальных машин, и поддерживают технологию GPUDirect RDMA. Каждый GPU включает подключение NVLINK 4.0 для обмена данными на виртуальной машине, а экземпляр поддерживается 96 физическими 4-го поколения процессорами Intel Xeon Scalable. Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch, Caffe, RAPIDS и другие платформы. Кроме того, межсоединение InfiniBand поддерживается большим набором существующих средств искусственного интеллекта и HPC, созданных на основе библиотек связи NCCL NVIDIA для эффективного кластеризации gpu.
Просмотрите полную страницу серии ND_H100_v5.
Часть | Количество Подсчет единиц |
Очки Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 96виртуальных ядер | Intel® Xeon® Scalable (Sapphire Rapids) |
Память | 1900ГиБ | |
Диски данных | 32диска | 40800операций ввода-вывода в секунду / 612мб/с |
Network | 8сетевых адаптеров | 80000Мбит/с |
Ускорители | 8GPU | NVIDIA H100 (NVLink) 80ГиБ 640ГиБ на виртуальную машину |
серия ND_MI300X_v5
Виртуальная машина серии ND MI300X версии 5 — это новое флагманское дополнение к семейству GPU Azure. Она была разработана для высокоуровневого обучения глубокого обучения и тесно связана с масштабируемыми и масштабируемыми рабочими нагрузками ИИ и HPC.
Виртуальная машина серии ND MI300X версии 5 начинается с восьми графических процессоров AMD Instinct MI300 и двух четвертых процессоров Intel Xeon Scalable для всего 96 физических ядер. Затем каждый GPU в виртуальной машине подключается друг к другу через 4-го поколения AMD Infinity Fabric связи с пропускной способностью 128 ГБ/с на GPU и 896 ГБ/с агрегированной пропускной способности.
Развертывания на основе ND MI300X версии 5 могут масштабироваться до тысяч gpu с пропускной способностью 3,2 ТБ/с пропускной способности взаимодействия на каждую виртуальную машину. Каждый GPU в виртуальной машине предоставляется с собственным выделенным подключением InfiniBand, не зависящим от топологии 400 ГБ/с NVIDIA Quantum-2 CX7. Эти подключения автоматически настраиваются между всеми виртуальными машинами, которые входят в один масштабируемый набор виртуальных машин, и поддерживают технологию GPUDirect RDMA.
Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch и другие платформы. Кроме того, межсоединение InfiniBand поддерживает большой набор существующих средств ИИ и HPC, созданных на базе библиотеки roCm Communication Collectives (RCCL) AMD для эффективного кластеризации gpu.
Просмотрите полную страницу серии ND_MI300X_v5.
Часть | Количество Подсчет единиц |
Очки Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 96 виртуальных ядер | Intel® Xeon® Scalable (Sapphire Rapids) |
Память | 1850 ГиБ | |
Локальное хранилище | 1 диск | 1000 ГиБ |
Удаленные диски | 32 диска | 40800 операций ввода-вывода в секунду 612 МБИТ/с |
Network | 8 сетевых адаптеров | 80000 Мбит/с |
Ускорители | 8 GPU | AMD MI300X 192 ГиБ 1535 ГиБ на виртуальную машину |
Серия семейств ND предыдущего поколения
Сведения о старых размерах см . в предыдущих размерах поколения.
Другие сведения о размере
Список всех доступных размеров: размеры
Калькулятор цен: Калькулятор цен
Сведения о типах дисков: типы дисков
Следующие шаги
Узнайте больше о том, как с помощью единиц вычислений Azure (ACU) сравнить производительность вычислений для различных номеров SKU Azure.
Ознакомьтесь с выделенными узлами Azure для физических серверов, которые могут размещать одну или несколько виртуальных машин, назначенных одной подписке Azure.
Узнайте, как отслеживать виртуальные машины Azure.
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по