نظرة عامة على الأجهزة الظاهرية من سلسلة HB

تنبيه

تشير هذه المقالة إلى CentOS، وهو توزيع Linux يقترب من حالة نهاية العمر الافتراضي (EOL). يرجى مراعاة استخدامك والتخطيط وفقا لذلك. لمزيد من المعلومات، راجع إرشادات نهاية العمر الافتراضي CentOS.

ينطبق على: ✔️ أجهزة ظاهرية بنظام التشغيل Linux ✔️ أجهزة ظاهرية بنظام التشغيل Windows ✔️ مجموعات التوسعة المرنة ✔️ مجموعات التوسعة الموحدة

يتطلب تحقيق أقصى قدر من أداء تطبيقات الحوسبة عالية الأداء (HPC) على AMD EPYC نهجاً مدروساً لموقع الذاكرة ووضع العملية. نوضح فيما يلي بنية AMD EPYC وتنفيذنا لها على Azure لتطبيقات الحوسبة عالية الأداء (HPC). سنستخدم المصطلح "pNUMA" للإشارة إلى نطاق NUMA الفعلي، و"vNUMA" للإشارة إلى نطاق NUMA افتراضي.

من الناحية الفعلية، فإن خادم سلسلة HB هو وحدات معالجة مركزية EPYC 7551 ذات 2 * 32 نواة لمجموع 64 نواة فعلية. تنقسم هذه النوى الـ 64 إلى 16 مجال pNUMA (8 لكل مأخذ توصيل)، كل منها عبارة عن أربع نوى ويطلق عليها "وحدة المعالجة المركزية المعقدة" (أو "CCX"). يحتوي كل CCX على ذاكرة تخزين مؤقت L3 خاصة به، وهي الطريقة التي سيرى بها نظام التشغيل حدود pNUMA/vNUMA. يشارك زوج من CCXs المجاورة في الوصول إلى قناتين من ذاكرة DRAM الفعلية (32 غيغابايت من DRAM في خوادم السلسلة HB).

لتوفير مساحة لـ Azure hypervisor للعمل دون التدخل في الجهاز الظاهري، نحتفظ بمجالات pNUMA الفعلية 0 (أي أول CCX). ثم نقوم بتعيين نطاقات pNUMA 1-15 (وحدات CCX المتبقية) للجهاز الظاهري. الجهاز الظاهري سيرى:

(15 vNUMA domains) * (4 cores/vNUMA) = 60 النوى لكل جهاز ظاهري

لا يعرف الجهاز الظاهري نفسه أن pNUMA 0 لم تُمنح له. يفهم الجهاز الظاهري pNUMA 1-15 على أنه vNUMA 0-14، مع 7 vNUMA على vSocket 0 و8 vNUMA على vSocket 1. على الرغم من أن هذا غير متماثل، إلا أنه يجب أن يقوم نظام التشغيل الخاص بك بالتمهيد والعمل بشكل طبيعي. في وقت لاحق من هذه الإرشادات، نتناول أفضل طريقة لتشغيل تطبيقات MPI على تخطيط NUMA غير المتماثل هذا.

سيعمل تثبيت العملية على الأجهزة الظاهرية من سلسلة HB لأننا نعرض السيليكون الأساسي كما هو للجهاز الظاهري الضيف. نوصي بشدة بتثبيت العملية للحصول على الأداء والاتساق الأمثل.

يوضح الرسم التخطيطي التالي فصل النوى المحجوزة لـ Azure Hypervisor والجهاز الظاهري من سلسلة HB.

فصل الذاكرات الأساسية المحجوزة ل Azure Hypervisor وHB-series VM

مواصفات الأجهزة

مواصفات الأجهزة سلسلة HB من الجهاز الظاهري
الذاكرات الأساسية 60 (SMT معطّل)
CPU AMD EPYC 7551
تردد CPU (غير AVX) ~2.55 جيجاهرتز (أحادي + جميع النوى)
الذاكرة 4 جيجابايت/نواة (إجمالي 240 جيجابايت)
قرص محلي SSD بسعة 700 جيجابايت
Infiniband 100 جيجابايت الكشف التلقائي والاستجابة على النقط النهائية Mellanox ConnectX-5
الشبكة 50 غيغابايت إيثرنت (40 غيغابايت قابلة للاستخدام) Azure الجيل الثاني SmartNIC

مواصفات البرنامج

مواصفات البرنامج سلسلة HB من الجهاز الظاهري
الحد الأقصى لحجم مهمة MPI 18000 ذاكرة أساسية (300 جهاز ظاهري في مجموعة مقياس جهاز ظاهري واحدة مع singlePlacementGroup=true)
دعم MPI HPC-X، وIntel MPI، وOpenMPI، وMVAPICH2، وMPICH، والنظام الأساسي لـ MPI
أطر عمل إضافية UCX، وlibfabric، وPGAS
دعم تخزين Azure الأقراص القياسية والأقراص المتميزة (بحد أقصى 4 أقراص)
دعم نظام التشغيل لـ SRIOV RDMA CentOS/RHEL 7.6+، Ubuntu 18.04+، SLES 15.4، WinServer 2016+
دعم المُنسق CycleCloud، دفعة، AKS؛ خيارات تكوين نظام مجموعة

هام

يشير هذا المستند إلى إصدار إصدار من Linux يقترب من أو في نهاية العمر الافتراضي (EOL). يرجى التفكير في التحديث إلى إصدار أحدث.

الخطوات التالية