تحديد الجهاز الظاهري المناسب لنظام مجموعة Azure HDInsight

تتناول هذه المقالة كيفية تحديد حجم الجهاز الظاهري المناسب للعُقد المختلفة في نظام مجموعة HDInsight.

ابدأ بفهم كيفية تأثير خصائص الجهاز الظاهري مثل معالجة وحدة المعالجة المركزية وحجم ذاكرة الوصول العشوائي وزمن انتقال الشبكة على معالجة أحمال العمل الخاصة بك. بعد ذلك، ارجع إلى تطبيقك وكيفية تطابقه مع عائلات الأجهزة الظاهرية المختلفة المثالية لها. تأكد من أن مجموعة الأجهزة الظاهرية التي ترغب في استخدامها متوافقة مع نوع نظام المجموعة الذي تخطط لاستخدامه. للحصول على قائمة بكافة أحجام الأجهزة الظاهرية المعتمدة والموصى بها لكل نوع نظام مجموعة، راجع عمليات تكوين العقدة المدعومة من Azure HDInsight. وأخيراً، يمكنك استخدام معيار تقييم الأداء لاختبار بعض النماذج من أحمال العمل والتحقق من وحدة SKU المناسبة لك ضمن تلك المجموعة.

لمزيد من المعلومات حول تخطيط جوانب أخرى من نظام المجموعة الخاصة بك مثل تحديد نوع تخزين أو حجم نظام مجموعة، راجع تخطيط السعة لمجموعات HDInsight.

خصائص الجهاز الظاهري وأحمال عمل البيانات الضخمة

يتم تحديد حجم الجهاز الظاهري ونوعه بواسطة قوة معالجة وحدة المعالجة المركزية وحجم ذاكرة الوصول العشوائي وزمن انتقال الشبكة:

  • CPU: حجم الجهاز الظاهري يشير إلى عدد الذاكرات الأساسية. كلما زادت الذاكرات الأساسية، زادت درجة الحساب المتوازي الذي يمكن أن تحققه كل عقدة. وكذلك، تحتوي بعض أنواع الأجهزة الظاهرية على ذاكرات أساسية أسرع.

  • RAM: حجم الجهاز الظاهري أيضاً يشير إلى مقدار ذاكرة RAM المتوفرة في الجهاز الظاهري. بالنسبة لأحمال العمل التي تخزن البيانات في الذاكرة للمعالجة، بدلاً من القراءة من القرص، تأكد من أن العُقد العاملة لديها ذاكرة كافية لتناسب البيانات.

  • الشبكة: بالنسبة لمعظم أنواع المجموعات، فإن البيانات التي تتم معالجتها بواسطة الكتلة ليست على القرص المحلي، ولكن بدلاً من ذلك في خدمة تخزين خارجية مثل Data Lake Storage أو تخزين Azure. خذ بعين الاعتبار عرض النطاق الترددي للشبكة ومعدل النقل بين الجهاز الظاهري للعقدة وخدمة التخزين. عادةً ما يزيد عرض النطاق الترددي للشبكة المتوفرة إلى جهاز ظاهري مع أحجام أكبر. للحصول على التفاصيل، راجع نظرة عامة على أحجام الأجهزة الظاهرية.

فهم تحسين الأجهزة الظاهرية

تم تحسين مجموعات الأجهزة الظاهرية في Azure لتناسب حالات الاستخدام المختلفة. في الجدول التالي، يمكنك العثور على بعض حالات الاستخدام الأكثر شيوعا وعائلات الأجهزة الظاهرية التي تتطابق معها.

نوع الأحجام ‏‏الوصف
المستوى المبدئي Av2 يتوفر أداء وCPU وتكوينات الذاكرة الأنسب لأحمال العمل الأساسية مثل التطوير. فهي اقتصادية وتوفر خيارا منخفض التكلفة لبدء استخدام Azure.
الغرض العام D، ، DSv2Dv2 نسبة وحدة معالج CPU إلى الذاكرة المتوازنة. مثالية للاختبار والتطوير، وقواعد البيانات الصغيرة والمتوسطة، ومنخفضة إلى متوسطة السير لخوادم الويب.
الحوسبة المحسنة F نسبة معالج CPU إلى الذاكرة العالية. ويكون ذلك مناسباً لخوادم الويب ذات نسبة استخدام الشبكة المتوسطة، وأجهزة الشبكة، وعمليات الدُفعة، وخوادم التطبيقات.
الذاكرة المحسنة Esv3, Ev3 نسبة الذاكرة العالية إلى معالج CPU. يكون ممتازًا لخوادم قواعد البيانات الارتباطية، وذاكرة التخزين المؤقت المتوسطة إلى الكبيرة، والتحليلات داخل الذاكرة.
  • للحصول على معلومات حول أسعار مثيلات الأجهزة الظاهرية المتوفرة عبر المناطق المدعومة بخدمة HDInsight، راجع أسعار HDInsight.

أنواع الأجهزة الظاهرية الموفرة للتكلفة لأحمال العمل الخفيفة

إذا كان لديك متطلبات معالجة خفيفة، يمكن أن تكون سلسلة F خياراً جيداً للبدء مع HDInsight. بسعر أقل في الساعة، فإن الفئة F هي أفضل قيمة للأداء السعري في محفظة Azure استناداً إلى وحدة الحساب Azure (ACU) لكل وحدة معالج CPU ظاهري.

يصف الجدول التالي أنواع نظام المجموعة وأنواع العقدة، التي يمكن إنشاؤها باستخدام الأجهزة الظاهرية لسلسلة Fsv2.

نوع شبكة نظام المجموعة إصدار عقدة العامل عقدة الرأس عقدة وسيطة
Spark الكل F4 والأحدث no no
Hadoop الكل F4 والأحدث no no
Kafka الكل F4 والأحدث no no
HBase الكل F4 والأحدث no no
LLAP معطل no no no

للاطلاع على مواصفات كل SKU من السلسلة F، راجع أحجام الأجهزة الظاهرية للسلسلة F.

معيار تقييم الأداء

قياس الأداء هو عملية تشغيل أحمال عمل محاكاة على أجهزة ظاهرية مختلفة لقياس مدى أدائها لأحمال عمل الإنتاج الخاصة بك.

لمزيد من المعلومات حول معيار تقييم الأداء لوحدات SKU الخاصة بالأجهزة الظاهرية وأحجام نظام المجموعة راجع تخطيط سعة نظام المجموعة في Azure HDInsight .

الخطوات التالية