استخدم مثيلات RDMA أو GPU في تجمعات الدُفعات

لتشغيل وظيفة دفعية معينة، يمكنك الاستفادة من أحجام أجهزة Azure الظاهرية المصممة لإجراء عمليات حسابية على نطاق واسع. على سبيل المثال:

  • لتشغيل أحمال عمل MPI متعددة المثيلات، اختر سلسلة HB أو HC أو NC أو ND أو الأحجام الأخرى التي تحتوي على واجهة شبكة للوصول إلى الذاكرة المباشرة عن بعد (RDMA). تتصل هذه الأحجام بشبكة InfiniBand للاتصال بين العقد، والتي يمكنها تسريع تطبيقات MPI.

  • بالنسبة لتطبيقات CUDA، اختر أحجام السلسلة N التي تتضمن بطاقات وحدة معالجة الرسومات (GPU) NVIDIA Tesla.

توفر هذه المقالة إرشادات وأمثلة لاستخدام بعض أحجام Azure المتخصصة في تجمعات الدُفعات. للحصول على المواصفات والخلفية، راجع:

  • أحجام الجهاز الظاهري عالية الأداء(Linux و Windows)

  • أحجام الأجهزة الظاهرية التي تدعم GPU (Linux ،Windows)

إشعار

قد لا تتوفر أحجام معينة من الأجهزة الظاهرية في المناطق التي تنشئ فيها حسابات الدُفعات الخاصة بك. للتحقق من توفر الحجم، راجع المنتجات المتوفرة حسب المنطقة و اختيار حجم الجهاز الظاهري لتجمع الدُفعات.

التبعيات

يتم دعم إمكانات RDMA أو GPU للأحجام كثيفة الحوسبة في الدُّفعة فقط في أنظمة تشغيل معينة. تتضمن أنظمة التشغيل المدعومة لأحجام الأجهزة الظاهرية هذه مجموعة فرعية فقط من تلك المتوفرة لإنشاء الجهاز الظاهري. اعتمادا على كيفية إنشاء تجمع الدفعات الخاص بك، قد تحتاج إلى تثبيت أو تكوين برنامج تشغيل إضافي أو برامج أخرى على العقد. تلخص الجداول التالية هذه التبعيات. راجع المقالات المرتبطة للحصول على التفاصيل. للحصول على خيارات لتكوين تجمعات الدُفعات، انظر لاحقاً في هذه المقالة.

تجمعات Linux - تكوين الجهاز الظاهري

الحجم الإمكانية أنظمة التشغيل البرامج المطلوبة إعدادات التجمع
H16r, H16mr
NC24r, NC24rs_v2, NC24rs_v3, ND24rs*
RDMA Ubuntu 22.04 LTS
(Azure Marketplace)
Intel MPI 5

Linux RDMA drivers
تمكين الاتصال بين العقدة، وتعطيل تنفيذ المهام المتزامنة
سلسلة NCv3 وNDv2 وNDv4 وNDv5 NVIDIA Tesla GPU (يختلف حسب الإصدار) Ubuntu 22.04 LTS
(Azure Marketplace)
NVIDIA CUDA أو CUDA Toolkit drivers ‏‫غير متوفر‬
سلسلة NVv3 وNVv4 وNVv5 وحدة معالجة الرسومات للتصور المتسارع Ubuntu 22.04 LTS
(Azure Marketplace)
برامج تشغيل NVIDIA GRID (إذا لزم الأمر) ‏‫غير متوفر‬

* تتضمن أحجام السلسلة N التي تدعم RDMA أيضاً وحدات معالجة NVIDIA Tesla GPUs

هام

يشير هذا المستند إلى إصدار إصدار من Linux يقترب من أو في نهاية العمر الافتراضي (EOL). يرجى التفكير في التحديث إلى إصدار أحدث.

تجمعات Windows - تكوين الجهاز الظاهري

الحجم الإمكانية أنظمة التشغيل البرامج المطلوبة إعدادات التجمع
H16r, H16mr
NC24r, NC24rs_v2, NC24rs_v3, ND24rs*
RDMA Windows Server 2016، 2012 R2، أو
2012 (Azure Marketplace)
Microsoft MPI 2012 R2 أو أحدث، او
Intel MPI 5

Windows RDMA drivers
تمكين الاتصال بين العقدة، وتعطيل تنفيذ المهام المتزامنة
أصدارات NC, NCv2, NCv3, ND, NDv2 NVIDIA Tesla GPU (يختلف حسب الإصدار) Windows Server 2016 أو
2012 R2 (Azure Marketplace)
NVIDIA CUDA أو CUDA Toolkit drivers ‏‫غير متوفر‬
سلسلة NV وNVv2 وNVv4 NVIDIA Tesla M60 GPU Windows Server 2016 أو
2012 R2 (Azure Marketplace)
NVIDIA GRID drivers ‏‫غير متوفر‬

* تتضمن أحجام السلسلة N التي تدعم RDMA أيضاً وحدات معالجة NVIDIA Tesla GPUs

تجمعات Windows - تكوين Cloud Services

تحذير

تجمعات تكوين الخدمات السحابية مهملة. يُرجى استخدام تكوين تجمعات الجهاز الظاهري بدلاً من ذلك.

الحجم الإمكانية أنظمة التشغيل البرامج المطلوبة إعدادات التجمع
H16r, H16mr RDMA Windows Server 2016، 2012 R2، 2012، أو
2008 R2 (Guest OS family)
Microsoft MPI 2012 R2 أو أحدث، او
Intel MPI 5

Windows RDMA drivers
تمكين الاتصال بين العقد،
تعطيل تنفيذ المهام المتزامنة

إشعار

أحجام السلسلة N غير مدعومة في تجمعات تكوين Cloud Services.

خيارات تكوين التجمع

لتكوين حجم جهاز ظاهري متخصص لتجمع الدُفعات لديك، لديك عدة خيارات لتثبيت البرامج أو برامج التشغيل المطلوبة:

  • بالنسبة إلى التجمعات في تكوين الجهاز الظاهري، اختر صورة جهاز ظاهري Azure Marketplace مكونة مسبقاً تحتوي على برامج تشغيل وبرامج مثبتة مسبقاً. أمثلة:

  • Data Science Virtual Machine لنظام التشغيل Linux أو Windows - يتضمن برامج تشغيل NVIDIA CUDA

  • صور Linux لأحمال عمل حاوية الدُّفعة التي تتضمن أيضاً برامج تشغيل GPU وRDMA:

  • خادم Ubuntu (مع برامج تشغيل GPU وRDMA) لتجمعات Azure Batch container

  • إنشاء صورة Windows أو Linux VM مخصصة مع برامج التشغيل المثبتة أو البرامج أو الإعدادات الأخرى المطلوبة لحجم الجهاز الظاهري.

  • إنشاء حزمة تطبيق Batch من برنامج تشغيل مضغوط أو مثبت تطبيق. ثم قم بتكوين Batch لنشر هذه الحزمة لتجميع العقد وتثبيتها مرة واحدة عند إنشاء كل عقدة. على سبيل المثال، إذا كانت حزمة التطبيق عبارة عن أداة تثبيت، فأنشئ سطر الأوامرstart task لتثبيت التطبيق بصمت على جميع عقد التجمع. ضع في اعتبارك استخدام حزمة تطبيق ومهمة بدء تجمع إذا كان حمل العمل الخاص بك يعتمد على إصدار برنامج تشغيل معين.

    إشعار

    يجب تشغيل مهمة البدء بأذونات (مسؤول) مرتفعة، ويجب أن تنتظر النجاح. ستؤدي المهام طويلة المدى إلى زيادة الوقت اللازم لتوفير تجمع الدُفعات.

مثال: برامج تشغيل NVIDIA GPU على تجمع Windows NC VM

لتشغيل تطبيقات CUDA على تجمعات من عقد Windows NC، تحتاج إلى تثبيت برامج تشغيل NVDIA GPU. تستخدم الخطوات النموذجية التالية حزمة تطبيق لتثبيت برامج تشغيل NVIDIA GPU. يمكنك تحديد هذا الخيار إذا كان حمل العمل الخاص بك يعتمد على إصدار برنامج تشغيل GPU محدد.

  1. قم بتنزيل حزمة إعداد برامج تشغيل GPU على Windows Server 2016 منNVIDIA website - على سبيل المثال، version 411.82. احفظ الملف محلياً باستخدام اسم قصير مثل GPUDriverSetup.exe.
  2. قم بإنشاء ملف مضغوط للحزمة.
  3. قم بتحميل الحزمة إلى حساب الدُفعة الخاص بك. لمعرفة الخطوات، راجع إرشاداتحزم التطبيق. حدد معرّف تطبيق مثلGPUDriver، وإصداراً مثل 411.82.
  4. باستخدام واجهات برمجة التطبيقات الدُّفعة أو مدخل Microsoft Azure، قم بإنشاء تجمع في تكوين الجهاز الظاهري مع العدد المطلوب من العقد والمقياس. يعرض الجدول التالي عينة من الإعدادات لتثبيت برامج تشغيل NVIDIA GPU بصمت باستخدام مهمة البدء:
الإعداد القيمة‬
نوع الصورة Marketplace (Linux/Windows)
الناشر MicrosoftWindowsServer
العرض WindowsServer
Sku 2016-Datacenter
حجم العقدة NC6 Standard
مراجع حزمة التطبيق GPUDriver, version 411.82
تمكين بدء المهمة صواب
سطر الأوامر - cmd /c "%AZ_BATCH_APP_PACKAGE_GPUDriver#411.82%\\GPUDriverSetup.exe /s"
هوية المستخدم - مستخدم تلقائي للتجمع، مسؤول
انتظر النجاح - صحيح

مثال: برامج تشغيل NVIDIA GPU على تجمعات Linux NC VM

لتشغيل تطبيقات CUDA على مجموعة من عقد Linux NC، تحتاج إلى تثبيت برامج تشغيل NVIDIA Tesla GPU الضرورية من CUDA Toolkit. تنشئ الخطوات النموذجية التالية صورة Ubuntu 22.04 LTS مخصصة وتنشرها باستخدام برامج تشغيل GPU:

  1. نشر Azure NC-series VM يعمل على Ubuntu 22.04 LTS. على سبيل المثال، قم بإنشاء الجهاز الظاهري في منطقة جنوب وسط الولايات المتحدة.
  2. أضفNVIDIA GPU Drivers extension إلى الجهاز الظاهري باستخدام مدخل Microsoft Azure أو كمبيوتر عميل يتصل باشتراك Azure أو Azure Cloud Shell. بدلاً من ذلك، اتبع الخطوات للاتصال بـ بالجهاز الظاهري و تثبيت برامج تشغيل CUDA يدوياً.
  3. اتبع الخطوات لإنشاء صورةAzure Compute Gallery لتجمع.
  4. قم بإنشاء حساب دفعة في منطقة تدعم الأجهزة الظاهرية لـ NC.
  5. باستخدام واجهات برمجة التطبيقات الدُفعة أو مدخل Microsoft Azure، أنشئ تجمعاً باستخدام الصورة المخصصة وبالعدد المطلوب من العقد والمقياس. يعرض الجدول التالي عينة من إعدادات التجمع للصورة:
الإعداد القيمة‬
نوع الصورة صورة مخصصة
صورة مخصصة اسم الصورة
حزمة SKU لوكيل العقدة batch.node.ubuntu 22.04
حجم العقدة NC6 Standard

مثال: Microsoft MPI على تجمع Windows H16r VM

لتشغيل تطبيقات Windows MPI على مجموعة من عقد Azure H16r VM، تحتاج إلى تكوين ملحق HpcVmDrivers وتثبيتMicrosoft MPI. فيما يلي خطوات نموذجية لنشر صورة Windows Server 2016 مخصصة مع برامج التشغيل والبرامج الضرورية:

  1. انشر الجهاز الظاهري Azure H16r يعمل بنظامWindows Server 2016. على سبيل المثال، قم بإنشاء جهاز ظاهري في منطقة غرب الولايات المتحدة.
  2. أضف ملحق HpcVmDrivers إلى الجهاز الظاهري عن طريق تشغيل أمر Azure PowerShell من كمبيوتر عميل يتصل باشتراك Azure الخاص بك، أو باستخدام Azure Cloud Shell.
  3. قم بإجراء اتصال سطح المكتب البعيد بالجهاز الظاهري.
  4. قم بتنزيلsetup package (MSMpiSetup.exe) لأحدث إصدار من Microsoft MPI، وقم بتثبيت Microsoft MPI.
  5. اتبع الخطوات لإنشاء صورةAzure Compute Gallery لتجمع.
  6. باستخدام واجهات برمجة التطبيقات الدُفعة أو مدخل Microsoft Azure، أنشئ تجمعًا باستخدامAzure Compute Gallery وبالعدد المطلوب من العقد والمقياس. يعرض الجدول التالي عينة من إعدادات التجمع للصورة:
الإعداد القيمة‬
نوع الصورة صورة مخصصة
صورة مخصصة اسم الصورة
حزمة SKU لوكيل العقدة batch.node.windows amd64
حجم العقدة H16r Standard
تم تمكين اتصال Internode صواب
الحد الأقصى من المهام لكل عقدة 1

الخطوات التالية

  • لتشغيل مهام MPI على تجمع Azure Batch، راجع أمثلةWindows أوLinux.