أداء الجهاز الظاهري من سلسلة HBv3

مقالة
03/09/2023

ينطبق على: ✔️ أجهزة ظاهرية بنظام التشغيل Linux ✔️ أجهزة ظاهرية بنظام التشغيل Windows ✔️ مجموعات التوسعة المرنة ✔️ مجموعات التوسعة الموحدة

توقعات الأداء باستخدام المعايير الدقيقة HPC الشائعة هي كما يلي:

حمل العمل	HBv3
ثلاثية STREAM	330-350 جيجابايت/ثانية (يتم تضخيمها حتى 630 جيجابايت/ثانية)
Linpack (HPL) عالي الأداء	4 TF (Rpeak، FP64)، 8 TF (Rpeak، FP32) لحجم VM 120-core
زمن انتقال RDMA وعرض النطاق الترددي	1.2 ميكرو ثانية (1 بايت)، 192 غيغابايت/ثانية (أحادي الاتجاه)
FIO على محركات أقراص NVMe SSDs المحلية (RAID0)	7 جيجابايت / ثانية يقرأ، 3 جيجابايت / ثانية يكتب؛ 186 ألف قراءة IOPS، 201 ألف كتابة IOPS

تثبيت العملية

عملية تثبيت يعمل بشكل جيد على أجهزة ظاهرية سلسلة HBv3 لأننا نعرض السيليكون الأساسي كما هو لـVM الضيف. نوصي بشدة بتثبيت العملية للحصول على الأداء والاتساق الأمثل.

زمن انتقال MPI

يمكن تنفيذ اختبار زمن انتقال MPI من مجموعة العلامة الدقيقة OSU كما هو موضح. نماذج البرامج النصية موجودة على GitHub.

./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency

عرض النطاق الترددي MPI

يمكن تنفيذ اختبار عرض النطاق الترددي MPI من مجموعة أدوات القياس الدقيقة في OSU على النحو التالي. نماذج البرامج النصية موجودة على GitHub.

./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw

Mellanox Perftest

تحتوي حزمة Mellanox Perftest على العديد من اختبارات InfiniBand مثل زمن انتقال (ib_send_lat) والنطاق الترددي (ib_send_bw). يوجد مثال على الأمر أدناه.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

الخطوات التالية

تعرف على كيفية توسيع نطاق تطبيقات MPI.
مراجعة نتائج الأداء وقابلية التوسع لتطبيقات HPC على الأجهزة الظاهرية من سلسلة HBv3 في مقالة TechCommunity.
اقرأ بشأن أحدث الإعلانات، والأمثلة حول حمل عمل الحوسبة عالية الأداء (HPC)، ونتائج الأداء في مدوّنات المجتمع التقني حول الحساب في Azure.
من أجل عرض هندسي ذي مستوى أعلى لتشغيل أحمال عمل HPC، راجع الحوسبة عالية الأداء (HPC) على Azure.

مشاركة عبر