أداء الجهاز الظاهري من سلسلة HBv3

ينطبق على: ✔️ أجهزة ظاهرية بنظام التشغيل Linux ✔️ أجهزة ظاهرية بنظام التشغيل Windows ✔️ مجموعات التوسعة المرنة ✔️ مجموعات التوسعة الموحدة

توقعات الأداء باستخدام المعايير الدقيقة HPC الشائعة هي كما يلي:

حمل العمل HBv3
ثلاثية STREAM 330-350 جيجابايت/ثانية (يتم تضخيمها حتى 630 جيجابايت/ثانية)
Linpack (HPL) عالي الأداء 4 TF (Rpeak، FP64)، 8 TF (Rpeak، FP32) لحجم VM 120-core
زمن انتقال RDMA وعرض النطاق الترددي 1.2 ميكرو ثانية (1 بايت)، 192 غيغابايت/ثانية (أحادي الاتجاه)
FIO على محركات أقراص NVMe SSDs المحلية (RAID0) 7 جيجابايت / ثانية يقرأ، 3 جيجابايت / ثانية يكتب؛ 186 ألف قراءة IOPS، 201 ألف كتابة IOPS

تثبيت العملية

عملية تثبيت يعمل بشكل جيد على أجهزة ظاهرية سلسلة HBv3 لأننا نعرض السيليكون الأساسي كما هو لـVM الضيف. نوصي بشدة بتثبيت العملية للحصول على الأداء والاتساق الأمثل.

زمن انتقال MPI

يمكن تنفيذ اختبار زمن انتقال MPI من مجموعة العلامة الدقيقة OSU كما هو موضح. نماذج البرامج النصية موجودة على GitHub.

./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency

عرض النطاق الترددي MPI

يمكن تنفيذ اختبار عرض النطاق الترددي MPI من مجموعة أدوات القياس الدقيقة في OSU على النحو التالي. نماذج البرامج النصية موجودة على GitHub.

./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw

Mellanox Perftest

تحتوي حزمة Mellanox Perftest على العديد من اختبارات InfiniBand مثل زمن انتقال (ib_send_lat) والنطاق الترددي (ib_send_bw). يوجد مثال على الأمر أدناه.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

الخطوات التالية