مشاركة عبر


أداء الجهاز الظاهري من سلسلة HX

ينطبق على: ✔️ أجهزة ظاهرية بنظام التشغيل Linux ✔️ أجهزة ظاهرية بنظام التشغيل Windows ✔️ مجموعات التوسعة المرنة ✔️ مجموعات التوسعة الموحدة

توقعات الأداء باستخدام المعايير الدقيقة HPC الشائعة هي كما يلي:

حمل العمل HX
ثلاثية STREAM 750-780 غيغابايت/ثانية من DDR5، ما يصل إلى 5.7 تيرابايت/ثانية من النطاق الترددي لذاكرة التخزين المؤقت 3D-V
Linpack (HPL) عالي الأداء ما يصل إلى 7.6 TF (Rpeak، FP64) لحجم الجهاز الظاهري 144 نواة
زمن انتقال RDMA وعرض النطاق الترددي < 2 ميكرو ثانية (1 بايت)، 400 جيجابايت/ثانية (أحادي الاتجاه)
FIO على محركات أقراص NVMe SSDs المحلية (RAID0) قراءة 12 غيغابايت/ثانية، 7 غيغابايت/ثانية يكتب؛ 186 ألف عملية قراءة IOPS، يكتب 201k IOPS

اختبار عرض النطاق الترددي للذاكرة

يمكن تشغيل اختبار ذاكرة STREAM باستخدام البرامج النصية في مستودع GitHub هذا.

git clone https://github.com/Azure/woc-benchmarking 
cd woc-benchmarking/apps/hpc/stream/ 
sh build_stream.sh 
sh stream_run_script.sh $PWD “hbrs_v4” 

اختبار أداء الحساب

يمكن تشغيل معيار HPL باستخدام البرنامج النصي في مستودع GitHub هذا.

git clone https://github.com/Azure/woc-benchmarking 
cd woc-benchmarking/apps/hpc/hpl 
sh hpl_build_script.sh 
sh hpl_run_scr_hbv4.sh $PWD 

زمن انتقال MPI

يمكن تنفيذ اختبار زمن انتقال MPI من مجموعة العلامة الدقيقة OSU كما هو موضح. نماذج البرامج النصية موجودة على GitHub.

module load mpi/hpcx 
mpirun -np 2 --host $src,$dst --map-by node -x LD_LIBRARY_PATH $HPCX_OSU_DIR/osu_latency

عرض النطاق الترددي MPI

يمكن تنفيذ اختبار عرض النطاق الترددي MPI من مجموعة العلامة الدقيقة OSU كما هو موضح. نماذج البرامج النصية موجودة على GitHub.

module load mpi/hpcx 
mpirun -np 2 --host $src,$dst --map-by node -x LD_LIBRARY_PATH $HPCX_OSU_DIR/osu_bw

[! ملاحظة] تعريف المصدر (src) والوجهة (dst).

Mellanox Perftest

تحتوي حزمة Mellanox Perftest على العديد من اختبارات InfiniBand مثل زمن انتقال (ib_send_lat) والنطاق الترددي (ib_send_bw). يتم عرض أمر مثال.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

[! ملاحظة] ترابط عقدة NUMA ل InfiniBand NIC هو NUMA0.

الخطوات التالية