سلسلة حجم الجهاز الظاهري المسرعة ل GPU "ND" من العائلة الفرعية

مقالة
08/25/2024

ينطبق على: ✔️ أجهزة ظاهرية بنظام التشغيل Linux ✔️ أجهزة ظاهرية بنظام التشغيل Windows ✔️ مجموعات التوسعة المرنة ✔️ مجموعات التوسعة الموحدة

عائلة "ND" من سلسلة حجم الجهاز الظاهري هي واحدة من مثيلات الجهاز الظاهري المتسارعة لوحدة معالجة الرسومات في Azure. وهي مصممة للتعلم العميق والبحث الذكاء الاصطناعي ومهام الحوسبة عالية الأداء التي تستفيد من تسريع GPU القوي. مزودة بوحدات NVIDIA GPUs، توفر الأجهزة الظاهرية من سلسلة ND قدرات متخصصة لتدريب واستنتاج نماذج التعلم الآلي المعقدة، مما يسهل عمليات الحساب الأسرع والتعامل الفعال مع مجموعات البيانات الكبيرة. وهذا يجعلها مناسبة بشكل خاص للتطبيقات الأكاديمية والتجارية في الذكاء الاصطناعي التطوير والمحاكاة، حيث تعد تقنية GPU المتطورة أمرا بالغ الأهمية لتحقيق نتائج سريعة ودقيقة في معالجة الشبكات العصبية وغيرها من المهام الحسابية المكثفة.

أحمال العمل وحالات الاستخدام

الذكاء الاصطناعي والتعلم العميق: تعد الأجهزة الظاهرية ND-family مثالية لتدريب ونشر نماذج التعلم العميق المعقدة. وهي مجهزة بوحدات معالجة الرسومات NVIDIA القوية، وتوفر القوة الحسابية اللازمة للتعامل مع التدريب الواسع للشبكة العصبية مع مجموعات البيانات الكبيرة، مما يقلل بشكل كبير من أوقات التدريب.

الحوسبة عالية الأداء (HPC): الأجهزة الظاهرية لعائلة ND مناسبة لتطبيقات HPC التي تتطلب تسريع وحدة معالجة الرسومات. يمكن أن تستفيد حقول مثل البحث العلمي والمحاكاة الهندسية (على سبيل المثال، ديناميكيات السوائل الحسابية) والمعالجة الجينومية من قدرات الحوسبة عالية الإنتاجية للأجهزة الظاهرية من سلسلة ND.

سلسلة في العائلة

ND-series V1

تعد الأجهزة الظاهرية من سلسلة ND إضافة جديدة إلى عائلة GPU المصممة للذكاء الاصطناعي وأحمال عمل التعلم العميق. وهي توفر أداءً ممتازاً للتدريب والاستدلال. يتم تشغيل مثيلات ND عن طريق وحدات معالجة الرسومات NVIDIA Tesla P40 ووحدات المعالجة المركزية Intel Xeon E5-2690 v4 (Broadwell). توفر هذه المثيلات أداءً ممتازاً لعمليات النقطة العائمة أحادية الدقة، لأحمال عمل الذكاء الاصطناعي باستخدام Microsoft Cognitive Toolkit وTensorFlow وCaffe وأطر العمل الأخرى. توفر سلسلة ND أيضاً حجم ذاكرة GPU أكبر بكثير (24 جيجا بايت)، ما يتيح ملاءمة نماذج الشبكة العصبية الأكبر بكثير. مثل سلسلة NC، توفر سلسلة ND تكويناً باستخدام شبكة ذات زمن انتقال ثانوي أقل ومعدل نقل عالٍ من خلال اتصال RDMA وInfiniBand حتى تتمكن من تشغيل مهام تدريب واسعة النطاق تغطي العديد من وحدات معالجة الرسومات.

عرض صفحة سلسلة ND الكاملة.

الجزء	كم ^{عدد الوحدات}	المواصفات ^{معرف SKU ووحدات الأداء وما إلى ذلك.}
معالج	6 - 24 vCPUs	Intel Xeon E5-2690 v4 (Broadwell) [x86-64]
الذاكرة	112 - 448 جيبي بايت
التخزين المحلي	قرص 1	736 - 2948 جيبي بايت
التخزين عن بُعد	12 - 32 قرصا	20000 - 80000 IOPS 200 - 800 ميغابت في الثانية
الشبكة	4 - 8 بطاقات NIC
المسرعات	1 - 4 وحدات معالجة الرسومات	Nvidia Tesla P40 GPU (24 غيغابايت)

السلسلة NDv2

يعد الجهاز الظاهري من سلسلة NDv2 إضافة جديدة إلى عائلة وحدات معالجة الرسومات المصممة لتلبية احتياجات الذكاء الاصطناعي تسريع وحدة معالجة الرسومات الأكثر تطلبا والتعلم الآلي والمحاكاة وأحمال عمل الحوسبة عالية الأداء.

يتم تشغيل NDv2 بواسطة 8 وحدات معالجة رسومات NVIDIA Tesla V100 NVLINK متصلة، تحتوي كل منها على ذاكرة GPU بسعة 32 جيجابايت. يحتوي كل جهاز NDv2 ظاهري أيضا على 40 non-HyperThreaded Intel Xeon Platinum 8168 (Skylake) غير HyperThreaded و672 جيبي بايت من ذاكرة النظام.

توفر مثيلات NDv2 أداء ممتازا لأحمال عمل HPC و الذكاء الاصطناعي باستخدام أنوية الحوسبة المحسنة لوحدة معالجة الرسومات CUDA، والعديد من أدوات الذكاء الاصطناعي والتعلم الآلي والتحليلات التي تدعم تسريع وحدة معالجة الرسومات "خارج الصندوق"، مثل TensorFlow و Pytorch و Caffe و RAPIDS وأطر العمل الأخرى.

والأهم من ذلك، تم تصميم NDv2 لكل من التوسع المكثف حسابيا (تسخير 8 وحدات معالجة رسومات لكل جهاز ظاهري) وزيادة (تسخير أجهزة ظاهرية متعددة تعمل معا) أحمال العمل. تدعم سلسلة NDv2 الآن شبكة InfiniBand الكشف التلقائي والاستجابة على النقط النهائية الخلفية بسرعة 100 جيجابت، على غرار تلك المتوفرة في سلسلة HB من HPC VM، للسماح بتجميع عالي الأداء للسيناريوهات المتوازية بما في ذلك التدريب الموزع الذكاء الاصطناعي والتعلم الآلي. تدعم هذه الشبكة الخلفية جميع بروتوكولات InfiniBand الرئيسية، بما في ذلك تلك المستخدمة في مكتبات NCCL2 من NVIDIA، مما يسمح بتجميع سلس لوحدات معالجة الرسومات.

عرض صفحة السلسلة NDv2 الكاملة

الجزء	كم ^{عدد الوحدات}	المواصفات ^{معرف SKU ووحدات الأداء وما إلى ذلك.}
معالج	40 vCPUs	Intel Xeon Platinum 8168 (Skylake) [x86-64]
الذاكرة	672 جيبي بايت
التخزين المحلي	قرص 1	2948 جيبي بايت
التخزين عن بُعد	32 قرصا	80000 IOPS 800 ميغابت في الثانية
الشبكة	8 بطاقات NIC	24000 ميجابايت في الثانية
المسرعات	بلا

سلسلة ND_A100_v4

الجهاز الظاهري لسلسلة ND A100 v4 (VM) هو إضافة رئيسية جديدة لعائلة Azure GPU. تم تصميم هذه الأحجام لتدريب Deep Learning المتطور وأحمال عمل HPC المقترنة بإحكام.

تبدأ سلسلة ND A100 v4 ب VM واحد وثمانية NVIDIA Ampere A100 40GB Tensor Core GPUs. يمكن أن تصل عمليات النشر المستندة إلى ND A100 v4 إلى آلاف وحدات معالجة الرسومات مع 1.6 تيرابايت/ ثانية من النطاق الترددي المترابط لكل جهاز ظاهري. يتم تزويد كل وحدة معالجة الرسومات داخل الجهاز الظاهري باتصال NVIDIA Mellanox HDR InfiniBand المخصص والمخصص له 200 جيجابايت/ ثانية. يتم تكوين هذه الاتصالات تلقائيا بين الأجهزة الظاهرية التي تشغل نفس مجموعة مقياس الجهاز الظاهري Azure، وتدعم GPU Direct RDMA.

تتميز كل وحدة معالجة الرسومات باتصال NVLINK 3.0 للاتصال داخل الجهاز الظاهري مع 96 ذاكرة أساسية لوحدة المعالجة المركزية AMD Epyc™ 7V12 (روما) من الجيل الثاني الفعلي خلفها.

توفر هذه المثيلات أداءً ممتازاً للعديد من أدوات الذكاء الاصطناعي والتعلم الآلي والتحليلات التي تدعم تسريع وحدة معالجة الرسومات "خارج الصندوق"، مثل TensorFlow وPytorch وCaffe وRAPIDS وأُطر أخرى. بالإضافة إلى ذلك، يدعم اتصال InfiniBand المتدرج مجموعة كبيرة من أدوات الذكاء الاصطناعي والحوسبة عالية الأداء الموجودة التي تم إنشاؤها على مكتبات اتصال NVIDIA NCCL2 للتكوين السلس لوحدات معالجة الرسومات.

عرض صفحة سلسلة ND_A100_v4 الكاملة.

الجزء	كم ^{عدد الوحدات}	المواصفات ^{معرف SKU ووحدات الأداء وما إلى ذلك.}
معالج	96 vCPUs	AMD EPYC 7V12 (روما) [x86-64]
الذاكرة	900 جيبي بايت
التخزين المحلي	قرص 1	6000 جيبي بايت
التخزين عن بُعد	32 قرصا	80000 IOPS 800 ميغابت في الثانية
الشبكة	8 بطاقات NIC	24000 ميجابايت في الثانية
المسرعات	8 وحدات معالجة الرسومات	Nvidia A100 GPU (40 غيغابايت)

سلاسل NDm_A100_v4

الجهاز الظاهري لسلسلة NDm A100 v4 هو إضافة رئيسية جديدة لعائلة Azure GPU. تم تصميم هذه الأحجام لتدريب Deep Learning المتطور وأحمال عمل HPC المقترنة بإحكام.

تبدأ سلسلة NDm A100 v4 بجهاز ظاهري واحد وثمانية NVIDIA Ampere A100 80GB Tensor Core GPUs. يمكن أن تصل عمليات النشر المستندة إلى NDm A100 v4 إلى آلاف وحدات معالجة الرسومات مع 1.6 تيرابايت/ ثانية من النطاق الترددي المترابط لكل جهاز ظاهري. يتم تزويد كل وحدة معالجة الرسومات داخل الجهاز الظاهري باتصال NVIDIA Mellanox HDR InfiniBand المخصص والمخصص له 200 جيجابايت/ ثانية. يتم تكوين هذه الاتصالات تلقائيا بين الأجهزة الظاهرية التي تشغل نفس مجموعة مقياس الجهاز الظاهري Azure، وتدعم GPU Direct RDMA.

عرض صفحة سلسلة NDm_A100_v4 الكاملة.

الجزء	كم ^{عدد الوحدات}	المواصفات ^{معرف SKU ووحدات الأداء وما إلى ذلك.}
معالج	96 vCPUs	AMD EPYC 7V12 (روما) [x86-64]
الذاكرة	1900 جيبي بايت
التخزين المحلي	قرص 1	6400 جيبي بايت
التخزين عن بُعد	32 قرصا	80000 IOPS 800 ميغابت في الثانية
الشبكة	8 بطاقات NIC	24000 ميجابايت في الثانية
المسرعات	8 وحدات معالجة الرسومات	Nvidia A100 GPU (80 غيغابايت)

سلسلة ND_H100_v5

الجهاز الظاهري لسلسلة ND H100 v5 (VM) هو إضافة رئيسية جديدة لعائلة Azure GPU. تم تصميم هذه السلسلة لتدريب Deep Learning المتطور وأحمال عمل الذكاء الاصطناعي التوليدية والحوسبة عالية الأداء المقترنة بإحكام.

تبدأ سلسلة ND H100 v5 بجهاز ظاهري واحد وثماني وحدات معالجة الرسومات NVIDIA H100 Tensor Core. يمكن أن تصل عمليات النشر المستندة إلى ND H100 v5 إلى آلاف وحدات معالجة الرسومات مع 3.2 تيرابايت في الثانية من النطاق الترددي للربط لكل جهاز ظاهري. يتم تزويد كل وحدة معالجة الرسومات داخل الجهاز الظاهري باتصال CX7 InfiniBand المخصص والمخصص 400 جيجابت/ثانية NVIDIA Quantum-2 CX7 InfiniBand. يتم تكوين هذه الاتصالات تلقائيا بين الأجهزة الظاهرية التي تشغل نفس مجموعة مقياس الجهاز الظاهري، وتدعم GPU Direct RDMA.

تتميز كل وحدة معالجة الرسومات باتصال NVLINK 4.0 للاتصال داخل الجهاز الظاهري، ويحتوي المثيل على 96 نواة معالج Intel Xeon Scalable الرابعة الفعلية.

توفر هذه المثيلات أداء ممتازا للعديد من أدوات الذكاء الاصطناعي وML والتحليلات التي تدعم تسريع وحدة معالجة الرسومات "الجاهزة"، مثل TensorFlow وPytorch و Caffe و RAPIDS وأطر العمل الأخرى. بالإضافة إلى ذلك، يدعم اتصال InfiniBand المتدرج مجموعة كبيرة من أدوات الذكاء الاصطناعي والحوسبة عالية الأداء الموجودة التي تم إنشاؤها على مكتبات اتصال NCCL الخاصة ب NVIDIA من أجل التجميع السلس لوحدات معالجة الرسومات.

عرض صفحة سلسلة ND_H100_v5 الكاملة.

الجزء	كم ^{عدد الوحدات}	المواصفات ^{معرف SKU ووحدات الأداء وما إلى ذلك.}
معالج	96 vCPUs	Intel Xeon (Sapphire Rapids) [x86-64]
الذاكرة	1900 جيبي بايت
التخزين المحلي	قرص 1	28000 جيبي بايت
التخزين عن بُعد	32Disks
الشبكة	8 بطاقات NIC
المسرعات	8 وحدات معالجة الرسومات	Nvidia H100 GPU (80 غيغابايت)

سلسلة ND_MI300X_v5

الجهاز الظاهري لسلسلة ND MI300X v5 (VM) هو إضافة رئيسية جديدة لعائلة Azure GPU. وقد تم تصميمه لتدريب التعلم العميق المتطور وأحمال عمل الذكاء الاصطناعي التوليدية والحوسبة عالية الأداء المقترنة بإحكام.

يبدأ الجهاز الظاهري لسلسلة ND MI300X v5 بثماني وحدات معالجة الرسومات AMD Instinct MI300 واثنين من معالجات Gen Intel Xeon Scalable الرابعة لإجمالي 96 نواة فعلية. ثم يتم توصيل كل وحدة معالجة الرسومات داخل الجهاز الظاهري ببعضها البعض عبر روابط AMD Infinity Fabric من الجيل الرابع مع عرض النطاق الترددي 128 غيغابايت/ثانية لكل وحدة معالجة الرسومات وعرض النطاق الترددي الإجمالي 896 غيغابايت/ثانية.

يمكن أن تصل عمليات النشر المستندة إلى ND MI300X v5 إلى آلاف وحدات معالجة الرسومات مع 3.2 تيرابايت/ ثانية من النطاق الترددي للربط لكل جهاز ظاهري. يتم تزويد كل وحدة معالجة الرسومات داخل الجهاز الظاهري باتصال CX7 InfiniBand المخصص والمخصص 400 جيجابت/ثانية NVIDIA Quantum-2 CX7 InfiniBand. يتم تكوين هذه الاتصالات تلقائيا بين الأجهزة الظاهرية التي تشغل نفس مجموعة مقياس الجهاز الظاهري، وتدعم GPUDirect RDMA.

توفر هذه المثيلات أداء ممتازا للعديد من أدوات الذكاء الاصطناعي وML والتحليلات التي تدعم تسريع وحدة معالجة الرسومات "الجاهزة"، مثل TensorFlow وPytorch وأطر العمل الأخرى. بالإضافة إلى ذلك، يدعم InfiniBand interconnect الموسع مجموعة كبيرة من أدوات الذكاء الاصطناعي والحوسبة عالية الأداء الموجودة التي تم إنشاؤها على مكتبة مجموعات اتصالات ROCm (RCCL) من AMD للتجمع السلس لوحدات معالجة الرسومات.

عرض صفحة سلسلة ND_MI300X_v5 الكاملة.

الجزء	كم ^{عدد الوحدات}	المواصفات ^{معرف SKU ووحدات الأداء وما إلى ذلك.}
معالج	96 vCPUs	Intel Xeon (Sapphire Rapids) [x86-64]
الذاكرة	1850 جيبي بايت
التخزين المحلي	قرص مؤقت 1 8 أقراص NVMe	1000 جيبي بايت قرص مؤقت 28000 جيبي بايت NVMe Disks
التخزين عن بُعد	32 قرصا	80000 IOPS 1200 ميغابت في الثانية
الشبكة	8 بطاقات NIC
المسرعات	8 وحدات معالجة الرسومات	AMD Instinct MI300X GPU (192 غيغابايت)

سلسلة عائلة ND من الجيل السابق

للاطلاع على الأحجام القديمة، راجع أحجام الأجيال السابقة.

معلومات الحجم الأخرى

قائمة بجميع الأحجام المتوفرة: الأحجام

حاسبة الأسعار: حاسبة الأسعار

معلومات حول أنواع الأقراص: أنواع الأقراص

الخطوات التالية

تعرف على المزيد حول كيف يمكن لوحدات حوسبة Azure مساعدتك في مقارنة أداء الحوسبة عبر وحدات Azure SKU.

تحقق من مضيفي Azure المخصصين للخوادم الفعلية القادرة على استضافة جهاز ظاهري واحد أو أكثر تم تعيينه لاشتراك Azure واحد.

تعرف على كيفية مراقبة أجهزة Azure الظاهرية.

مشاركة عبر