استكشاف أخطاء نشر الجهاز الظاهري وإصلاحها في Azure Stack Edge Pro GPU

ينطبق على: نعم ل Pro GPU SKUAzure Stack Edge Pro - GPUنعم ل Pro 2 SKUAzure Stack Edge Pro 2نعم ل Pro R SKUAzure Stack Edge Pro Rنعم ل Mini R SKUAzure Stack Edge Mini R

توضح هذه المقالة كيفية استكشاف الأخطاء الشائعة وإصلاحها عند نشر الأجهزة الظاهرية على جهاز Azure Stack Edge Pro GPU. توفر المقالة إرشادات للتحقيق في المشكلات الأكثر شيوعا التي تسبب مهلات ومشكلات توفير الجهاز الظاهري أثناء واجهة الشبكة وإنشاء الجهاز الظاهري.

لتشخيص أي فشل في توفير الجهاز الظاهري، راجع سجلات الضيف للجهاز الظاهري الفاشل. للحصول على خطوات لتجميع سجلات ضيف الجهاز الظاهري وتضمينها في حزمة دعم، راجع تجميع سجلات الضيف للأجهزة الظاهرية على Azure Stack Edge Pro.

للحصول على إرشادات حول المشكلات التي تمنع التحميل الناجح لصورة جهاز ظاهري قبل نشر الجهاز الظاهري، راجع استكشاف أخطاء تحميلات صورة الجهاز الظاهري وإصلاحها في Azure Stack Edge Pro GPU.

مهلة توفير الجهاز الظاهري

يوفر هذا القسم استكشاف الأخطاء وإصلاحها للأسباب الأكثر شيوعا لمهلة توفير الجهاز الظاهري.

عند انتهاء مهلة توفير الجهاز الظاهري، سترى الخطأ التالي:

لقطة شاشة للخطأ المعروض في مدخل Microsoft Azure عند مهلة توفير الجهاز الظاهري في Azure Stack Edge.

المشكلات التالية هي الأسباب الرئيسية لمهلات توفير الجهاز الظاهري:

  • عنوان IP الذي قمت بتعيينه إلى الجهاز الظاهري قيد الاستخدام بالفعل. معرفة المزيد
  • لم يتم إعداد صورة الجهاز الظاهري التي استخدمتها لنشر الجهاز الظاهري بشكل صحيح. معرفة المزيد
  • تعذر الوصول إلى البوابة الافتراضية وخادم DNS من الجهاز الظاهري الضيف. معرفة المزيد
  • cloud init أثناء التثبيت، cloud init إما لم يتم تشغيله أو كانت هناك مشكلات أثناء تشغيله. (أجهزة Linux الظاهرية فقط) التعرف على المزيد
  • بالنسبة إلى جهاز Linux الظاهري المنشور باستخدام صورة جهاز ظاهري مخصصة، فإن علامات التزويد في ملف /etc/waagent.conf غير صحيحة. (أجهزة Linux الظاهرية فقط) التعرف على المزيد
  • واجهة الشبكة الأساسية المرفقة بمفتاح ظاهري ممكن ل SRIOV تعرف على المزيد

IP المعين إلى الجهاز الظاهري قيد الاستخدام بالفعل

وصف الخطأ: تم تعيين عنوان IP ثابت للجهاز الظاهري قيد الاستخدام بالفعل، وفشل توفير الجهاز الظاهري. يحدث هذا الخطأ عندما يكون عنوان IP قيد الاستخدام في الشبكة الفرعية التي يتم نشر الجهاز الظاهري عليها. عند نشر جهاز ظاهري عبر مدخل Microsoft Azure، تتحقق العملية من عنوان IP موجود داخل جهازك ولكن لا يمكنها التحقق من عناوين IP للخدمات الأخرى أو الأجهزة الظاهرية التي قد تكون أيضا على شبكتك الفرعية.

الحل المقترح: استخدم عنوان IP ثابتا غير مستخدم، أو استخدم عنوان IP ديناميكيا يوفره خادم DHCP.

للتحقق من وجود عنوان IP مكرر:

  • قم بتشغيل الأمرين التاليين ping و Test-NetConnection (tnc) من أي جهاز على نفس الشبكة:

    ping <IP address>
    tnc <IP address>
    tnc <IP address> -CommonTCPPort “RDP”
    

إذا تلقيت استجابة، فإن عنوان IP الذي قمت بتعيينه إلى الجهاز الظاهري الجديد قيد الاستخدام بالفعل.

صورة الجهاز الظاهري غير معدة بشكل صحيح

وصف الخطأ: لإعداد صورة جهاز ظاهري للاستخدام على جهاز Azure Stack Edge Pro GPU، يجب اتباع سير عمل معين. يجب إنشاء جهاز ظاهري gen1 في Azure، وتخصيص الجهاز الظاهري، وتعميم VHD، ثم تنزيل OS VHD لهذا الجهاز الظاهري. يجب أن تكون الصورة المعدة VHD gen1 مع ملحق اسم الملف "vhd" والنوع الثابت.

للحصول على نظرة عامة على المتطلبات، راجع إنشاء صور جهاز ظاهري مخصصة لجهاز Azure Stack Edge Pro GPU. للحصول على إرشادات حول حل مشكلات صورة الجهاز الظاهري، راجع استكشاف أخطاء تحميلات صور الجهاز الظاهري وإصلاحها في Azure Stack Edge Pro GPU.

الحل المقترح: أكمل سير العمل لإعداد صورة الجهاز الظاهري. للحصول على إرشادات، راجع إحدى المقالات التالية:

البوابة، تعذر الوصول إلى خادم DNS من الجهاز الظاهري الضيف

وصف الخطأ: إذا تعذر الوصول إلى البوابة الافتراضية وخادم DNS أثناء نشر الجهاز الظاهري، فانتهاء مهلة توفير الجهاز الظاهري وفشل نشر الجهاز الظاهري.

الحل المقترح: تحقق من إمكانية الوصول إلى البوابة الافتراضية وخادم DNS من الجهاز الظاهري. ثم كرر نشر الجهاز الظاهري.

للتحقق من إمكانية الوصول إلى البوابة الافتراضية وخادم DNS من الجهاز الظاهري، قم بالخطوات التالية:

  1. الاتصال بالجهاز الظاهري.

  2. شغّل الأوامر التالية:

    ping <default gateway IP address>
    ping <DNS server IP address>
    

    لمعرفة عناوين IP للبوابة الافتراضية وخوادم DNS، انتقل إلى واجهة المستخدم المحلية لجهازك. حدد المنفذ الذي تهتم به، واعرض إعدادات الشبكة.

    لقطة شاشة لصفحة الشبكة لجهاز Azure Stack Edge مع عرض إعدادات الشبكة للمنفذ 2.

cloud init المشكلات (أجهزة Linux الظاهرية)

وصف الخطأ: cloud init لم يتم تشغيله، أو كانت هناك مشكلات أثناء cloud init التشغيل. cloud-init يستخدم لتخصيص جهاز ظاهري يعمل بنظام Linux عند تشغيل الجهاز الظاهري للمرة الأولى. لمزيد من المعلومات، راجع دعم cloud-init للأجهزة الظاهرية في Azure.

الحلول المقترحة: للعثور على المشكلات التي حدثت عند cloud init التشغيل:

  1. الاتصال بالجهاز الظاهري.

  2. cloud init تحقق من وجود أخطاء في ملفات السجل التالية:

    • /var/log/cloud-init-output.log
    • /var/log/cloud-init.log
    • /var/log/waagent/log

للتحقق من بعض المشكلات الأكثر شيوعا التي تمنع cloud init من التشغيل بنجاح، قم بتنفيذ الخطوات التالية:

  1. تأكد من أن صورة الجهاز الظاهري تستند إلى cloud init. شغّل الأمر التالي:

    cloud-init --version

    يجب أن يرجع الأمر رقم إصدار cloud init. إذا لم تكن cloud initالصورة مستندة إلى، فلن يرجع الأمر معلومات الإصدار.

    للحصول على تعليمات حول cloud init الخيارات، قم بتشغيل الأمر التالي:

    cloud-init --help

  2. تأكد من أن المثيل cloud init يمكن تشغيله بنجاح مع تعيين مصدر البيانات إلى Azure.

    عند تعيين مصدر البيانات إلى Azure، يبدو الإدخال في سجلات init السحابية مشابها للإدراج التالي.

    رسم توضيحي لإدخال سجل cloud-init لصورة جهاز ظاهري مع تعيين مصدر البيانات إلى Azure. يتم تمييز النص المحدد.

    إذا لم يتم تعيين مصدر البيانات إلى Azure، فقد تحتاج إلى مراجعة البرنامج النصي الخاص بك cloud init . لمزيد من المعلومات، راجع التعمق في cloud-init.

تعيين علامات التوفير بشكل غير صحيح (أجهزة Linux الظاهرية)

وصف الخطأ: لنشر جهاز ظاهري يعمل بنظام Linux بنجاح في Azure، يجب تعطيل التوفير على الصورة، ويجب تمكين التوفير باستخدام cloud init . يتم تكوين علامات التزويد التي تعين هذه القيم بشكل صحيح لصور الجهاز الظاهري القياسية. إذا كنت تستخدم صورة جهاز ظاهري مخصصة، فستحتاج إلى التأكد من صحتها.

الحل المقترح: تأكد من أن علامات التزويد في ملف /etc/waagent.conf لها القيم التالية:

الإمكانية القيمة المطلوبة
تمكين التوفير Provisioning.Enabled=n
الاعتماد على cloud-init للتزويد Provisioning.UseCloudInit=y

واجهة الشبكة الأساسية المرفقة بمفتاح ظاهري ممكن ل SRIOV

وصف الخطأ: تسببت واجهة الشبكة الأساسية المرفقة بالتبديل الظاهري الممكن لواجهة إدخال/إخراج جذر واحد (SRIOV) في تجاوز نسبة استخدام الشبكة ل Hyper-V، لذلك لم يتمكن المضيف من تلقي طلبات DHCP من الجهاز الظاهري، مما أدى إلى انتهاء مهلة التزويد.

الحلول المقترحة:

  • قم بتوصيل واجهة الشبكة الأساسية للجهاز الظاهري بمفتاح ظاهري دون تمكين الشبكات المتسارعة.

  • على جهاز Azure Stack Edge Pro 1، لا تمكن مفاتيح التبديل الظاهرية التي تم إنشاؤها على المنفذ 1 إلى المنفذ 4 الشبكات المتسارعة. في المنفذ 5 أو المنفذ 6، تمكن المحولات الظاهرية الشبكات المتسارعة بشكل افتراضي.

  • على جهاز Azure Stack Edge Pro 2، لا تمكن مفاتيح التبديل الظاهرية التي تم إنشاؤها على المنفذ 1 أو المنفذ 2 الشبكات المتسارعة. في المنفذ 3 أو المنفذ 4، تمكن المحولات الظاهرية الشبكات المتسارعة بشكل افتراضي.

مشكلات إنشاء واجهة الشبكة

يوفر هذا القسم إرشادات للمشكلات التي تتسبب في فشل إنشاء واجهة الشبكة أثناء نشر الجهاز الظاهري.

مهلة إنشاء NIC

وصف الخطأ: لم يكتمل إنشاء واجهة الشبكة على الجهاز الظاهري خلال فترة المهلة المسموح بها. يمكن أن يحدث هذا الفشل بسبب مشكلات خادم DHCP في البيئة الخاصة بك.

للتحقق مما إذا كان قد تم إنشاء واجهة الشبكة بنجاح، قم بتنفيذ الخطوات التالية:

  1. في مدخل Microsoft Azure، انتقل إلى مورد Azure Stack Edge لجهازك (انتقل إلى الأجهزة الظاهرية لخدمات >Edge). ثم حدد Deployments، وانتقل إلى توزيع VM.

  2. إذا لم يتم إنشاء واجهة شبكة اتصال بنجاح، فسترى الخطأ التالي.

    لقطة شاشة للخطأ المعروض في مدخل Microsoft Azure عند فشل إنشاء واجهة الشبكة أثناء نشر الجهاز الظاهري على جهاز Azure Stack Edge.

الحل المقترح: إنشاء الجهاز الظاهري مرة أخرى، وتعيين عنوان IP ثابت له.

مشكلات إنشاء الجهاز الظاهري

يغطي هذا القسم المشكلات الشائعة التي تحدث أثناء إنشاء الجهاز الظاهري.

فشل إنشاء الجهاز الظاهري

وصف الخطأ: إذا كان لديك صورة Marketplace تم إنشاؤها باستخدام Azure Stack Edge قبل 2403 ثم قمت بإنشاء جهاز ظاهري من صورة Marketplace الموجودة، فسيفشل إنشاء الجهاز الظاهري لأن Azure Stack Edge 2407 غير مسار التنزيل لصورة Marketplace.

الحل المقترح: استخدم الخطوات التالية لحذف صورة Marketplace الموجودة ثم إنشاء صورة Marketplace جديدة من مدخل Microsoft Azure.

  1. من مدخل Microsoft Azure، احذف صورة Marketplace الموجودة.

    1. سرد عملية الاستيعاب ووظيفة استيعاب BlobDownload لصورة Marketplace. استخدم هذه الخطوات للاتصال ب Azure Resource Manager.

      قم بتشغيل البرنامج النصي التالي لسرد مهام الاستيعاب:

      حدد معرف الاشتراك في Uri التالي:

      $uri 1 = "https://management.appliance name. مجال DNS/الاشتراكات/sid/providers/Microsoft.AzureBridge/locations/DBELocal/ingestionJobs/?api-version=2022-03-01"

      Function Get-AzCachedAccessToken() 
      {
      $ErrorActionPreference = 'Stop' 
      $azureRmProfile = [Microsoft.Azure.Commands.Common.Authentication.Abstractions.AzureRmProfileProvider]::Instance.Profile 
      $currentAzureContext = Get-AzContext 
      $profileClient = New-Object Microsoft.Azure.Commands.ResourceManager.Common.RMProfileClient($azureRmProfile) 
      Write-Debug ("Getting access token for tenant" + $currentAzureContext.Subscription.TenantId) 
      $token = $profileClient.AcquireAccessToken($currentAzureContext.Subscription.TenantId) 
      $token.AccessToken 
      } 
      
      $token = Get-AzCachedAccessToken 
      $headers = @{Authorization = "Bearer $token"; "Content-Type" = "application/json" } 
      $v = Invoke-RestMethod -Method Get -Uri $uri1 -Headers $headers 
      v.value
      
    2. ابحث عن اسم مهمة الاستيعاب = Marketplace image sku name والنوع = BlobDownload.

      مثال: اسم مهمة الاستيعاب = Ubuntu-18-04 والنوع = BlobDownload.

      لقطة شاشة لمثال بناء الجملة للعثور على اسم مهمة الاستيعاب.

  2. إذا تم العثور على مهمة الاستيعاب في الخطوة 1، فاستخدم الخطوات التالية لحذف مهمة الاستيعاب وحذف الصورة. على سبيل المثال، اسم مهمة الاستيعاب في المثال أعلاه هو ubuntu-18-04. بالإضافة إلى ذلك، Subscription ID يمكن العثور على والاسم Resource group في المثال.

    $uri2 = "https://management.<appliance name>.<DNS domain>/subscriptions/sid/resourceGroups/rgname/providers/Microsoft.AzureBridge/locations/dbelocal/ingestionJobs/<ingestion job name>?api-version=2018-06-01" 
    
    Invoke-RestMethod -Method DELETE -Uri $uri2 -Headers $headers
    
  3. اتبع الخطوات لإنشاء صورة جهاز ظاهري جديدة من Azure Marketplace.

ذاكرة غير كافية لإنشاء الجهاز الظاهري

وصف الخطأ: عند فشل إنشاء الجهاز الظاهري بسبب عدم كفاية الذاكرة، سترى الخطأ التالي.

لقطة شاشة للخطأ المعروض في مدخل Microsoft Azure عند فشل إنشاء الجهاز الظاهري على جهاز Azure Stack Edge.

الحل المقترح: تحقق من الذاكرة المتوفرة على الجهاز، واختر حجم الجهاز الظاهري وفقا لذلك. لمزيد من المعلومات، راجع أحجام الأجهزة الظاهرية المدعومة على Azure Stack Edge.

الذاكرة المتوفرة لنشر جهاز ظاهري مقيدة بعدة عوامل:

  • مقدار الذاكرة المتوفرة على الجهاز. لمزيد من المعلومات، راجع مواصفات الحوسبة والذاكرة في المواصفات الفنية ل Azure Stack Edge Pro GPU والمواصفات الفنية ل Azure Stack Edge Mini R.

  • إذا تم تمكين Kubernetes، فإن ذاكرة الحساب المطلوبة ل Kubernetes والتطبيقات على مجموعة Kubernetes.

  • النفقات العامة لكل جهاز ظاهري في Hyper-V.

الحلول المقترحة:

  • استخدم حجم الجهاز الظاهري الذي يتطلب ذاكرة أقل.
  • أوقف أي أجهزة ظاهرية غير مستخدمة من المدخل قبل نشر الجهاز الظاهري الجديد.
  • احذف أي أجهزة ظاهرية لم تعد قيد الاستخدام.

عدد وحدات معالجة الرسومات غير كاف لإنشاء GPU VM

إذا حاولت نشر جهاز ظاهري على جهاز GPU تم تمكين Kubernetes عليه بالفعل، فلن تتوفر وحدات معالجة الرسومات، ويفشل توفير الجهاز الظاهري مع الخطأ التالي:

لقطة شاشة للخطأ المعروض في مدخل Microsoft Azure عند فشل إنشاء جهاز ظاهري لوحدة معالجة الرسومات بسبب عدم توفر وحدات معالجة الرسومات على جهاز Azure Stack Edge.

الأسباب المحتملة: إذا تم تمكين Kubernetes قبل إنشاء الجهاز الظاهري، يستخدم Kubernetes جميع وحدات معالجة الرسومات المتوفرة، ولن تتمكن من إنشاء أي أجهزة ظاهرية بحجم وحدة معالجة الرسومات. يمكنك إنشاء العديد من الأجهزة الظاهرية بحجم وحدة معالجة الرسومات مثل عدد وحدات معالجة الرسومات المتوفرة. يمكن تجهيز جهاز Azure Stack Edge بوحدات معالجة الرسومات 1 أو 2.

الحل المقترح: للحصول على خيارات نشر الجهاز الظاهري على جهاز 1-GPU أو 2-GPU مع تكوين Kubernetes، راجع GPU VMs وKubernetes.

الخطوات التالية