ملحق برنامج تشغيل NVIDIA GPU لنظام التشغيل Linux

تنبيه

تشير هذه المقالة إلى CentOS، وهو توزيع Linux يقترب من حالة نهاية العمر الافتراضي (EOL). يرجى مراعاة استخدامك والتخطيط وفقا لذلك. لمزيد من المعلومات، راجع إرشادات نهاية العمر الافتراضي CentOS.

يثبت هذا الملحق برامج تشغيل NVIDIA GPU على الأجهزة الظاهرية (VMs) التي تعمل بنظام Linux من السلسلة N. استناداً إلى عائلة الجهاز الظاهري، يثبت الملحق برامج تشغيل CUDA أو GRID. عندما تثبت برامج تشغيل NVIDIA باستخدام هذا الملحق، فأنت تقبل شروط اتفاقية الترخيص لمستخدم NVIDIA وتوافق عليها. أثناء عملية التثبيت، قد تتم إعادة تشغيل الجهاز الظاهري لإكمال إعداد برنامج التشغيل.

تتوفر إرشادات حول تثبيت برامج التشغيل يدوياً والإصدارات الحالية المدعومة. يتوفر أيضاً ملحق لتثبيت برامج تشغيل NVIDIA GPU على الأجهزة الظاهرية التي تعمل على نظام Windows من سلسلة N.

إشعار

مع تمكين التمهيد الآمن، يجب توقيع جميع مكونات تمهيد نظام التشغيل (محمل التمهيد، النواة، برامج تشغيل النواة) من قبل الناشرين الموثوق بهم (المفتاح الموثوق به من قبل النظام). التمهيد الآمن غير مدعوم باستخدام ملحقات Windows أو Linux. لمزيد من المعلومات حول تثبيت برامج تشغيل GPU يدويا مع تمكين التمهيد الآمن، راجع إعداد برنامج تشغيل GPU من سلسلة Azure N لنظام Linux.

إشعار

لا تقوم ملحقات برنامج تشغيل GPU بتحديث برنامج التشغيل تلقائيا بعد تثبيت الملحق. إذا كنت بحاجة إلى الانتقال إلى إصدار برنامج تشغيل أحدث، فقم إما بتنزيل برنامج التشغيل وتثبيته يدويا أو إزالته وإضافة الملحق مرة أخرى.

المتطلبات الأساسية

نظام التشغيل

يدعم هذا الملحق توزيعات نظام التشغيل التالية، اعتماداً على دعم برنامج التشغيل لإصدار نظام تشغيل معين:

التوزيع إصدار
Linux (Ubuntu) 20.04-LTS
Linux: Red Hat Enterprise Linux 7.9
Linux: CentOS 7

إشعار

أحدث برامج تشغيل CUDA المدعومة للأجهزة الظاهرية من سلسلة NC حالياً هي 470.82.01. إصدارات برنامج التشغيل الأحدث غير معتمدة على بطاقات K80 في NC. أثناء تحديث الملحق مع هذا الطرف من الدعم لـ NC، قم بتثبيت برامج تشغيل CUDA يدوياً لبطاقات K80 على سلسلة NC.

هام

يشير هذا المستند إلى إصدار إصدار من Linux يقترب من أو في نهاية العمر الافتراضي (EOL). يرجى التفكير في التحديث إلى إصدار أحدث.

الاتصال بالإنترنت

يتطلب تشغيل ملحق Microsoft Azure لبرامج تشغيل NVIDIA GPU أن يكون الجهاز الظاهري الهدف متصلاً بالإنترنت ولديه حق الوصول إليه.

مخطط الملحق

يعرض تنسيق JSON التالي مخطط هذا الملحق:

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverLinux",
    "typeHandlerVersion": "1.6",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

خصائص

الاسم القيمة/المثال نوع البيانات
apiVersion 2015-06-15 date
publisher Microsoft.HpcCompute سلسلة
النوع NvidiaGpuDriverLinux سلسلة
typeHandlerVersion 1.6 العدد الصحيح

إعدادات

جميع الإعدادات اختيارية. السلوك الافتراضي هو عدم تحديث kernel إذا لم يكن مطلوباً لتثبيت برنامج التشغيل وتثبيت أحدث برنامج تشغيل معتمد، ومجموعة أدوات CUDA (حسب الاقتضاء).

Name الوصف القيمة الافتراضية قيم صحيحة نوع البيانات
updateOS قم بتحديث kernel حتى لو لم يكن مطلوباً لتثبيت برنامج التشغيل. true true, false boolean
driverVersion NV: إصدار برنامج تشغيل GRID.
إصدار مجموعة أدوات NC/ND: CUDA. يتم تثبيت أحدث برامج التشغيل لـ CUDA المختار تلقائياً.
الأحدث قائمة بإصدارات برامج التشغيل المدعومة سلسلة
installCUDA تثبيت مجموعة أدوات CUDA. ذات الصلة فقط بالأجهزة الظاهرية لسلسلة NC / ND. صحيح true, false boolean

التوزيع

مدخل Azure

يمكنك نشر ملحقات الجهاز الظاهري Azure NVIDIA في مدخل Microsoft Azure.

  1. في مستعرض، انتقل إلى مدخل Azure.

  2. انتقل إلى الجهاز الظاهري الذي تريد تثبيت برنامج التشغيل عليه.

  3. في القائمة اليسرى، حدد Extensions.

    لقطة شاشة تعرض تحديد الملحقات في قائمة مدخل Azure.

  4. حدد إضافة.

    لقطة شاشة تعرض إضافة ملحق جهاز ظاهري للجهاز الظاهري المحدد.

  5. قم بالتمرير للبحث عن NVIDIA GPU Driver Extension وحدده، ثم حدد Next.

    لقطة شاشة تعرض تحديد ملحق برنامج تشغيل NVIDIA G P U.

  6. حدد Review + create,، وحدد Create. انتظر بضع دقائق حتى يتم توزيع برنامج التشغيل.

    لقطة شاشة تعرض تحديد الزر

  7. تحقق من إضافة الملحق إلى قائمة الملحقات المثبتة.

    لقطة شاشة تعرض الملحق الجديد في قائمة الملحقات لـ V M.

قالب Azure Resource Manager

يمكنك استخدام قوالب Azure Resource Manager لتوزيع ملحقات Azure VM. تعد القوالب مثالية عند توزيع جهاز ظاهري واحد أو أكثر يشترط التكوين بعد التوزيع.

يمكن تضمين تكوين JSON المخصص لملحق الجهاز الظاهري داخل مورد الجهاز الظاهري أو وضعه في الجذر أو المستوى العلوي لقالب Resource Manager JSON. يؤثر موضع تكوين JSON على قيمة اسم المورد ونوعه. لمزيد من المعلومات، راجع تعيين اسم ونوع الموارد التابعة.

يفترض المثال التالي أن الملحق متداخل داخل مورد الجهاز الظاهري. عندما يكون مورد الملحق مضمناً، يتم وضع JSON في عنصر "resources": [] في الجهاز الظاهري.

{
  "name": "myExtensionName",
  "type": "extensions",
  "location": "[resourceGroup().location]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', myVM)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverLinux",
    "typeHandlerVersion": "1.6",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

PowerShell

Set-AzVMExtension
    -ResourceGroupName "myResourceGroup" `
    -VMName "myVM" `
    -Location "southcentralus" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "NvidiaGpuDriverLinux" `
    -ExtensionType "NvidiaGpuDriverLinux" `
    -TypeHandlerVersion 1.6 `
    -SettingString '{ `
	}'

Azure CLI

يعكس المثال التالي أمثلة Resource Manager وPowerShell السابقة:

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name NvidiaGpuDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.6

يضيف المثال التالي أيضاً إعدادين مخصصين اختياريين كمثال لتثبيت برنامج التشغيل غير الافتراضي. على وجه التحديد، يقوم بتحديث kernel الخاصة بنظام التشغيل إلى أحدث إصدار، ويقوم بتثبيت برنامج تشغيل محدد لمجموعة أدوات CUDA. مرة أخرى، لاحظ أن العناصر --settings اختيارية وافتراضية. قد يؤدي تحديث kernel إلى زيادة الوقت المستغرق لتثبيت الملحق. علاوة على ذلك، قد لا يكون اختيار إصدار محدد (أقدم) من مجموعة أدوات CUDA متوافقاً دائماً مع kernel الأحدث.

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name NvidiaGpuDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.6 \
  --settings '{ \
    "updateOS": true, \
    "driverVersion": "10.0.130" \
  }'

استكشاف الأخطاء وإصلاحها والدعم

استكشاف الأخطاء وإصلاحها

يمكنك استرداد البيانات حول حالة عمليات توزيع الملحقات عبر مدخل Microsoft Azure ومن خلال استخدام Azure PowerShell وAzure CLI. للاطلاع على حالة توزيع ملحقات أحد الأجهزة الظاهرية المعينة، قم بتشغيل الأمر التالي:

Get-AzVMExtension -ResourceGroupName myResourceGroup -VMName myVM -Name myExtensionName
az vm extension list --resource-group myResourceGroup --vm-name myVM -o table

يتم تسجيل إخراج تنفيذ الملحق إلى الملف التالي. راجع هذا الملف لتعقب حالة أي تثبيت طويل الأمد ولاستكشاف أي حالات فشل وإصلاحها.

/var/log/azure/nvidia-vmext-status

التعليمات البرمجية للخروج

رمز الإنهاء المعنى الإجراء الممكن اتخاذه
0 عملية ناجحة
1 الاستخدام غير الصحيح للملحق تحقق من سجل إخراج التنفيذ.
10 خدمات تكامل Linux لـ Hyper-V وAzure غير متوفرة أو مثبتة تحقق من إخراج lspci.
11 NVIDIA GPU غير موجود على حجم الجهاز الظاهري هذا استخدام حجم الجهاز الظاهري ونظام التشغيل المدعوم.
12 عرض الصور غير مدعوم
13 حجم الجهاز الظاهري غير مدعوم استخدم جهازاً ظاهرياً من الفئة N للنشر.
14 عملية غير ناجحة تحقق من سجل إخراج التنفيذ.

يدعم

إذا كنت بحاجة إلى مزيد من المساعدة في أي وقت من هذه المقالة، فتواصل مع خبراء Azure عبر منتديات MSDN Azure وStack Overflow. بدلاً من ذلك، يمكنك تقديم حدث دعم Azure. انتقل إلى Azure support وحدد Get support. للحصول على معلومات حول استخدام دعم Azure، اقرأ الأسئلة المتداولة حول دعم Azure.

الخطوات التالية