مراقبة الكتلة

مقالة
08/25/2024

من المهم المراقبة على مستوى نظام المجموعة لتحديد ما إذا كان الجهاز والكتلة يتصرفان كما هو متوقع أم لا. على الرغم من أن Service Fabric يمكن أن تحافظ على تشغيل التطبيقات أثناء فشل الأجهزة، إلا أنك لا تزال بحاجة إلى تشخيص ما إذا كان هناك خطأ ما يحدث في أحد التطبيقات أو في البنية التحتية الأساسية. يجب عليك أيضًا مراقبة مجموعاتك للتخطيط بشكل أفضل للسعة، والمساعدة في اتخاذ القرارات المتعلقة بإضافة أو إزالة الأجهزة.

تعرض Service Fabric العديد من أحداث النظام الأساسي المنظمة، مثل أحداث Service Fabric، من خلال EventStore وقنوات تسجيل مختلفة خارج الصندوق.

في Windows، تتوفر أحداث Service Fabric من موفر ETW واحد مع مجموعة من العناصر ذات الصلة logLevelKeywordFilters المستخدمة للانتقاء بين قنوات التشغيل والبيانات والمراسلة - هذه هي الطريقة التي نفصل بها أحداث Service Fabric الصادرة لتصفيتها حسب الحاجة.

العمليات التشغيلية عالية المستوى التي يتم إجراؤها بواسطة Service Fabric والمجموعة، بما في ذلك الأحداث الخاصة بالعقدة القادمة، أو تطبيق جديد يتم نشره، أو عودة إلى الحالة السابقة للترقية، وما إلى ذلك. انظر القائمة الكاملة للأحداث هنا.
تشغيلية - مفصلة
التقارير الصحية وقرارات موازنة الحمل.

يمكن الوصول إلى قناة العملية من خلال طرق مختلفة بما في ذلك ETW/Windows Event Logs و EventStore (متوفر على Windows في الإصدارات 6.2 والإصدارات الأحدث لمجموعات Windows). يمنحك EventStore الوصول إلى أحداث المجموعة الخاصة بك على أساس كل كيان (الكيانات بما في ذلك المجموعة والعقد والتطبيقات والخدمات والأقسام والنسخ المتماثلة والحاويات) ويعرضها عبر واجهات برمجة تطبيقات REST ومكتبة عميل Service Fabric. استخدم EventStore لمراقبة مجموعات التطوير / الاختبار الخاصة بك، وللحصول على فهم دقيق لحالة مجموعات الإنتاج الخاصة بك.

البيانات والمراسلة
السجلات والأحداث الهامة التي تم إنشاؤها في الرسائل (حاليًا فقط ReverseProxy) ومسار البيانات (نماذج خدمات موثوقة).
البيانات والمراسلة - مفصلة
قناة مطولة تحتوي على جميع السجلات غير الهامة من البيانات والمراسلة في نظام المجموعة (تحتوي هذه القناة على حجم كبير من الأحداث).

بالإضافة إلى ذلك، هناك قناتان منظمتان لمصدر الحدث، بالإضافة إلى السجلات التي نجمعها لأغراض الدعم.

أحداث خدمات موثوق بها
برمجة أحداث نموذجية محددة.
أحداث Reliable Actors
برمجة الأحداث الخاصة بنموذج وعدادات الأداء.
سجلات الدعم
سجلات النظام التي تم إنشاؤها بواسطة Service Fabric فقط لاستخدامها من قبلنا عند تقديم الدعم.

تغطي هذه القنوات المتنوعة معظم عمليات تسجيل مستوى النظام الأساسي الموصى بها. لتحسين تسجيل مستوى النظام الأساسي، ضع في اعتبارك الاستثمار في فهم أفضل للنموذج الصحي وإضافة تقارير صحية مخصصة وإضافة عدادات أداء مخصصة لبناء فهم في الوقت الفعلي لتأثير خدماتك وتطبيقاتك على المجموعة.

للاستفادة من هذه السجلات، يوصى بشدة بترك "التشخيصات" ممكنة أثناء إنشاء نظام المجموعة في مدخل Microsoft Azure. من خلال تشغيل التشخيصات، عند نشر نظام المجموعة، يمكن لتشخيص Azure الاعتراف بقنوات الجهات الفاعلة التشغيلية، والخدمات الموثوق بها، وتخزين البيانات كما هو موضح أكثر في تجميع الأحداث باستخدام تشخيصات Azure.

سلامة Azure Service Fabric وتقارير الحمل

تمتلك Service Fabric نموذجًا صحيًا خاصًا بها، والذي تم وصفه بالتفصيل في هذه المقالات:

تُعد المراقبة الصحية أمرًا بالغ الأهمية لجوانب متعددة من تشغيل الخدمة، خاصة أثناء ترقية التطبيق. بعد ترقية كل مجال ترقية للخدمة، يجب أن يجتاز مجال الترقية الفحوصات الصحية قبل أن ينتقل النشر إلى مجال الترقية التالي. إذا تعذر تحقيق الحالة الصحية OK، يتم التراجع عن التوزيع، بحيث يظل التطبيق في حالة موافق معروفة. رغم أن بعض العملاء قد يتأثرون قبل التراجع عن الخدمات، فإن معظم العملاء لن يواجهوا مشكلة. أيضًا، تحدث الدقة بسرعة نسبيًا دون الحاجة إلى انتظار إجراء من عامل بشري. كلما زاد عدد الفحوصات الصحية المضمنة في التعليمات البرمجية الخاصة بك، زادت مرونة خدمتك في التعامل مع مشكلات النشر.

جانب آخر لصحة الخدمة هو الإبلاغ عن المقاييس من الخدمة. المقاييس مهمة في Service Fabric لأنها تستخدم لموازنة استخدام الموارد. يمكن أن تكون المقاييس أيضًا مؤشرًا على صحة النظام. على سبيل المثال، قد يكون لديك تطبيق يحتوي على العديد من الخدمات، ويبلغ كل مثيل عن مقياس الطلبات في الثانية (RPS). إذا كانت إحدى الخدمات تستخدم موارد أكثر من خدمة أخرى، فإن Service Fabric ينقل مثيلات الخدمة حول المجموعة، لمحاولة الحفاظ على استخدام الموارد بشكل متساوٍ. للحصول على شرح أكثر تفصيلاً عن كيفية عمل استخدام الموارد، راجع إدارة استهلاك الموارد وتحميلها في Service Fabric باستخدام المقاييس.

يمكن أن تساعدك المقاييس أيضًا في منحك نظرة ثاقبة على كيفية أداء خدمتك. بمرور الوقت، يمكنك استخدام المقاييس للتحقق من أن الخدمة تعمل ضمن المعلمات المتوقعة. على سبيل المثال، إذا أظهرت الاتجاهات أنه في الساعة 9 صباحًا من صباح يوم الاثنين، يكون متوسط RPS هو 1000، فيمكنك إعداد تقرير صحي ينبهك إذا كانت RPS أقل من 500 أو أعلى من 1500. قد يكون كل شيء على ما يرام تمامًا، ولكن قد يكون من المفيد إلقاء نظرة للتأكد من أن عملائك يتمتعون بتجربة رائعة. يمكن لخدمتك تحديد مجموعة من المقاييس التي يمكن الإبلاغ عنها لأغراض الفحص الصحي، ولكنها لا تؤثر على موازنة الموارد للمجموعة. للقيام بذلك، اضبط الوزن المتري على صفر. نوصي ببدء تشغيل جميع المقاييس بوزن صفري، وعدم زيادة الوزن حتى تتأكد من فهم كيفية تأثير ترجيح المقاييس على موازنة الموارد للمجموعة الخاصة بك.

تلميح

لا تستخدم الكثير من المقاييس الموزونة. قد يكون من الصعب فهم سبب نقل مثيلات الخدمة لتحقيق التوازن. يمكن لبعض المقاييس أن تقطع شوطًا طويلاً!

أي معلومات يمكن أن تشير إلى صحة وأداء التطبيق الخاص بك هي مرشح للمقاييس والتقارير الصحية. يمكن أن يخبرك عداد أداء وحدة المعالجة المركزية بكيفية استخدام العقدة الخاصة بك، لكنه لا يخبرك ما إذا كانت خدمة معينة سليمة، لأن خدمات متعددة قد تعمل على عقدة واحدة. ولكن، يمكن أن تشير جميع المقاييس مثل RPS والعناصر التي تمت معالجتها ووقت الاستجابة للطلب إلى صحة خدمة معينة.

سجلات دعم Service Fabric

إذا كنت بحاجة إلى الاتصال بدعم Microsoft للحصول على مساعدة بشأن مجموعة Azure Service Fabric، فستكون سجلات الدعم مطلوبة دائمًا تقريبًا. إذا كانت مجموعتك مستضافة في Azure، فسيتم تكوين سجلات الدعم وتجميعها تلقائيًا كجزء من إنشاء نظام مجموعة. يتم تخزين السجلات في حساب تخزين مخصص في مجموعة موارد المجموعة الخاصة بك. لا يحتوي حساب التخزين على اسم ثابت، ولكن في الحساب، ترى حاويات الكائنات الثنائية كبيرة الحجم وجداول بأسماء تبدأ بالنسيج. للحصول على معلومات عن إعداد مجموعات السجل لمجموعة مستقلة، راجع إنشاء وإدارة مجموعة Azure Service Fabric المستقلة وإعدادات التكوين لمجموعة Windows المستقلة. بالنسبة لمثيلات Service Fabric المستقلة، يجب إرسال السجلات إلى مشاركة ملف محلي. يجب أن يكون لديك هذه السجلات للحصول على الدعم، ولكن لا يقصد بها أن تكون قابلة للاستخدام من قبل أي شخص خارج فريق دعم عملاء Microsoft.

قياس الأداء

قم بقياس أداء نظام المجموعة الخاص بك لمساعدتك على فهم كيفية قدرتها على التعامل مع التحميل واتخاذ القرارات حول تحجيم نظام المجموعة (راجع المزيد حول تحجيم نظام المجموعة على Azure أو محليا). تعد بيانات الأداء مفيدة أيضا عند مقارنتها بالإجراءات التي ربما اتخذتها أنت أو تطبيقاتك وخدماتك، عند تحليل السجلات في المستقبل.

للحصول على قائمة عدادات الأداء التي يجب تجميعها عند استخدام Service Fabric، راجع مقاييس الأداء

فيما يلي طريقتان شائعتان يمكنك من خلالهما إعداد تجميع بيانات الأداء لمجموعتك:

استخدام وكيل
هذه هي الطريقة المفضلة لجمع الأداء من الجهاز، نظرًا لأن الوكلاء عادةً ما يكون لديهم قائمة بمقاييس الأداء المحتملة التي يمكن جمعها، وهي عملية سهلة نسبيًا لاختيار المقاييس التي تريد جمعها أو تغييرها. اقرأ عن Azure Monitor الذي يقدم سجلات Azure Monitor في تكامل سجلات Azure Monitor من Service Fabric وإعداد وكيل تحليلات السجل لمعرفة المزيد عن وكيل تحليلات السجل، وهو أحد عوامل المراقبة القادرة على تسجيل بيانات الأداء للأجهزة الظاهرية العنقودية والحاويات المنشورة.
عدادات الأداء لتخزين جدول Azure
يمكنك أيضًا إرسال مقاييس الأداء إلى نفس تخزين الجدول مثل الأحداث. يتطلب ذلك تغيير تكوين Azure Diagnostics لانتقاء عدادات الأداء المناسبة من الأجهزة الظاهرية في مجموعتك، وتمكينها من تسجيل إحصائيات عامل الإرساء إذا كنت ستنشر أي حاويات. اقرأ عن تكوين عدادات الأداء في WAD في نسيج الخدمة لإعداد مجموعة عداد الأداء.

الخطوات التالية

اقرأ عن تكامل سجلات Azure Monitor في Service Fabric لتجميع تشخيصات المجموعة وإنشاء استعلامات وتنبيهات مخصصة
تعرف على تجربة التشخيص المدمجة في Service Fabric، وهي EventStore
استعرض بعض السيناريوهات التشخيصية الشائعة في نسيج الخدمة

مشاركة عبر

مراقبة الكتلة

سلامة Azure Service Fabric وتقارير الحمل

سجلات دعم Service Fabric

قياس الأداء

الخطوات التالية

الملاحظات

الموارد الإضافية