نظرة عامة على الأجهزة الظاهرية من سلسلة HB
ينطبق على: ✔️ أجهزة ظاهرية بنظام التشغيل Linux ✔️ أجهزة ظاهرية بنظام التشغيل Windows ✔️ مجموعات التوسعة المرنة ✔️ مجموعات التوسعة الموحدة
يتطلب تحقيق أقصى قدر من أداء تطبيقات الحوسبة عالية الأداء (HPC) على AMD EPYC نهجاً مدروساً لموقع الذاكرة ووضع العملية. نوضح فيما يلي بنية AMD EPYC وتنفيذنا لها على Azure لتطبيقات الحوسبة عالية الأداء (HPC). نستخدم مصطلح "pNUMA" للإشارة إلى مجال NUMA فعلي، و"vNUMA" للإشارة إلى مجال NUMA ظاهري.
من الناحية الفعلية، فإن خادم سلسلة HB هو وحدات معالجة مركزية EPYC 7551 ذات 2 * 32 نواة لمجموع 64 نواة فعلية. تنقسم هذه النوى الـ 64 إلى 16 مجال pNUMA (8 لكل مأخذ توصيل)، كل منها عبارة عن أربع نوى ويطلق عليها "وحدة المعالجة المركزية المعقدة" (أو "CCX"). يحتوي كل CCX على ذاكرة التخزين المؤقت L3 الخاصة به، وهي الطريقة التي يرى بها نظام التشغيل حد pNUMA/vNUMA. يشارك زوج من CCXs المجاورة في الوصول إلى قناتين من ذاكرة DRAM الفعلية (32 غيغابايت من DRAM في خوادم السلسلة HB).
لتوفير مساحة لـ Azure hypervisor للعمل دون التدخل في الجهاز الظاهري، نحتفظ بمجالات pNUMA الفعلية 0 (أي أول CCX). ثم نقوم بتعيين نطاقات pNUMA 1-15 (وحدات CCX المتبقية) للجهاز الظاهري. يرى الجهاز الظاهري ما يلي:
(15 vNUMA domains) * (4 cores/vNUMA) = 60
النوى لكل جهاز ظاهري
لا يعرف الجهاز الظاهري نفسه أن pNUMA 0 لم تُمنح له. يفهم الجهاز الظاهري pNUMA 1-15 على أنه vNUMA 0-14، مع 7 vNUMA على vSocket 0 و8 vNUMA على vSocket 1. على الرغم من أن هذا غير متماثل، إلا أنه يجب أن يقوم نظام التشغيل الخاص بك بالتمهيد والعمل بشكل طبيعي. في وقت لاحق من هذه الإرشادات، نتناول أفضل طريقة لتشغيل تطبيقات MPI على تخطيط NUMA غير المتماثل هذا.
سيعمل تثبيت العملية على الأجهزة الظاهرية من سلسلة HB لأننا نعرض السيليكون الأساسي كما هو للجهاز الظاهري الضيف. نوصي بشدة بتثبيت العملية للحصول على الأداء والاتساق الأمثل.
يوضح الرسم التخطيطي التالي فصل النوى المحجوزة لـ Azure Hypervisor والجهاز الظاهري من سلسلة HB.
مواصفات الأجهزة
مواصفات الأجهزة | سلسلة HB من الجهاز الظاهري |
---|---|
الذاكرات الأساسية | 60 (SMT معطّل) |
CPU | AMD EPYC 7551 |
تردد CPU (غير AVX) | ~2.55 جيجاهرتز (أحادي + جميع النوى) |
الذاكرة | 4 جيجابايت/نواة (إجمالي 240 جيجابايت) |
قرص محلي | SSD بسعة 700 جيجابايت |
Infiniband | 100 جيجابايت الكشف التلقائي والاستجابة على النقط النهائية Mellanox ConnectX-5 |
الشبكة | 50 غيغابايت إيثرنت (40 غيغابايت قابلة للاستخدام) Azure الجيل الثاني SmartNIC |
مواصفات البرنامج
مواصفات البرنامج | سلسلة HB من الجهاز الظاهري |
---|---|
الحد الأقصى لحجم مهمة MPI | 18000 ذاكرة أساسية (300 جهاز ظاهري في مجموعة مقياس جهاز ظاهري واحدة مع singlePlacementGroup=true) |
دعم MPI | HPC-X، وIntel MPI، وOpenMPI، وMVAPICH2، وMPICH، والنظام الأساسي لـ MPI |
أطر عمل إضافية | UCX، وlibfabric، وPGAS |
دعم تخزين Azure | الأقراص القياسية والأقراص المتميزة (بحد أقصى 4 أقراص) |
دعم نظام التشغيل لـ SRIOV RDMA | RHEL 7.6+، Ubuntu 18.04+، SLES 15.4، WinServer 2016+ |
دعم المُنسق | CycleCloud، دفعة، AKS؛ خيارات تكوين نظام مجموعة |
هام
يشير هذا المستند إلى إصدار إصدار من Linux يقترب من أو في نهاية العمر الافتراضي (EOL). يرجى التفكير في التحديث إلى إصدار أحدث.
الخطوات التالية
- تعرف على المزيد حول بنية AMD EPYC والتصميمات متعددة الشرائح. لمزيد من المعلومات التفصيلية، راجع دليل ضبط الحوسبة عالية الأداء لمعالجات AMD EPYC.
- اقرأ بشأن أحدث الإعلانات، والأمثلة حول حمل عمل الحوسبة عالية الأداء (HPC)، ونتائج الأداء في مدوّنات المجتمع التقني حول الحساب في Azure.
- من أجل عرض هندسي ذي مستوى أعلى لتشغيل أحمال عمل الحوسبة عالية الأداء (HPC)، راجع الحوسبة عالية الأداء (HPC) على Azure.