مراقبة الكتلة

من المهم المراقبة على مستوى الكتلة لتحديد ما إذا كانت الأجهزة والمجموعة الخاصة بك تتصرف كما هو متوقع أم لا. على الرغم من أن Service Fabric يمكن أن تحافظ على تشغيل التطبيقات أثناء فشل الأجهزة، إلا أنك لا تزال بحاجة إلى تشخيص ما إذا كان هناك خطأ ما يحدث في أحد التطبيقات أو في البنية التحتية الأساسية. يجب عليك أيضًا مراقبة مجموعاتك للتخطيط بشكل أفضل للسعة، والمساعدة في اتخاذ القرارات المتعلقة بإضافة أو إزالة الأجهزة.

تعرض Service Fabric العديد من أحداث النظام الأساسي المنظمة، مثل أحداث Service Fabric، من خلال EventStore وقنوات تسجيل مختلفة خارج الصندوق.

في Windows، تتوفر أحداث Service Fabric من موفر ETW واحد مع مجموعة من العناصر ذات الصلة logLevelKeywordFilters المستخدمة للانتقاء بين قنوات التشغيل والبيانات والمراسلة - هذه هي الطريقة التي نفصل بها أحداث Service Fabric الصادرة لتصفيتها حسب الحاجة.

  • العمليات التشغيلية عالية المستوى التي يتم إجراؤها بواسطة Service Fabric والمجموعة، بما في ذلك الأحداث الخاصة بالعقدة القادمة، أو تطبيق جديد يتم نشره، أو عودة إلى الحالة السابقة للترقية، وما إلى ذلك. انظر القائمة الكاملة للأحداث هنا.

  • تشغيلية - مفصلة
    التقارير الصحية وقرارات موازنة الحمل.

يمكن الوصول إلى قناة التشغيل من خلال مجموعة متنوعة من الطرق بما في ذلك ETW / Windows Event Logs وEventStore (متوفر على Windows في الإصدار 6.2 والإصدارات الأحدث لمجموعات Windows). يمنحك EventStore الوصول إلى أحداث المجموعة الخاصة بك على أساس كل كيان (الكيانات بما في ذلك المجموعة والعقد والتطبيقات والخدمات والأقسام والنسخ المتماثلة والحاويات) ويعرضها عبر واجهات برمجة تطبيقات REST ومكتبة عميل Service Fabric. استخدم EventStore لمراقبة مجموعات التطوير / الاختبار الخاصة بك، وللحصول على فهم دقيق لحالة مجموعات الإنتاج الخاصة بك.

  • البيانات والمراسلة
    السجلات والأحداث الهامة التي تم إنشاؤها في الرسائل (حاليًا فقط ReverseProxy) ومسار البيانات (نماذج خدمات موثوقة).

  • البيانات والمراسلة - مفصلة
    قناة مطولة تحتوي على جميع السجلات غير الهامة من البيانات والرسائل في المجموعة (تحتوي هذه القناة على عدد كبير جدًا من الأحداث).

بالإضافة إلى ذلك، هناك قناتان منظمتان لمصدر الحدث، بالإضافة إلى السجلات التي نجمعها لأغراض الدعم.

  • أحداث خدمات موثوق بها
    برمجة أحداث نموذجية محددة.

  • أحداث Reliable Actors
    برمجة الأحداث الخاصة بنموذج وعدادات الأداء.

  • سجلات الدعم
    سجلات النظام التي تم إنشاؤها بواسطة Service Fabric فقط لاستخدامها من قبلنا عند تقديم الدعم.

تغطي هذه القنوات المتنوعة معظم عمليات تسجيل مستوى النظام الأساسي الموصى بها. لتحسين تسجيل مستوى النظام الأساسي، ضع في اعتبارك الاستثمار في فهم أفضل للنموذج الصحي وإضافة تقارير صحية مخصصة وإضافة عدادات أداء مخصصة لبناء فهم في الوقت الفعلي لتأثير خدماتك وتطبيقاتك على المجموعة.

للاستفادة من هذه السجلات، يوصى بشدة بترك "التشخيصات" ممكّنة أثناء إنشاء المجموعة في Azure Portal. من خلال تشغيل التشخيصات، عند نشر المجموعة، تكون تشخيصات Windows Azure قادرة على التعرف على الخدمات التشغيلية والموثوقة وقنوات الجهات الفاعلة الموثوقة، وتخزين البيانات كما هو موضح بمزيد من التفصيل في الأحداث المجمعة باستخدام Azure Diagnostics.

سلامة Azure Service Fabric وتقارير الحمل

تمتلك Service Fabric نموذجًا صحيًا خاصًا بها، والذي تم وصفه بالتفصيل في هذه المقالات:

تُعد المراقبة الصحية أمرًا بالغ الأهمية لجوانب متعددة من تشغيل الخدمة، خاصة أثناء ترقية التطبيق. بعد ترقية كل مجال ترقية للخدمة، يجب أن يجتاز مجال الترقية الفحوصات الصحية قبل أن ينتقل النشر إلى مجال الترقية التالي. إذا تعذر الوصول إلى حالة صحية جيدة، فسيتم التراجع عن النشر، بحيث يظل التطبيق في حالة "موافق" معروفة. رغم أن بعض العملاء قد يتأثرون قبل التراجع عن الخدمات، فإن معظم العملاء لن يواجهوا مشكلة. أيضًا، تحدث الدقة بسرعة نسبيًا دون الحاجة إلى انتظار إجراء من عامل بشري. كلما زاد عدد الفحوصات الصحية المضمنة في التعليمات البرمجية الخاصة بك، زادت مرونة خدمتك في التعامل مع مشكلات النشر.

جانب آخر لصحة الخدمة هو الإبلاغ عن المقاييس من الخدمة. تعتبر المقاييس مهمة في Service Fabric لأنها تُستخدم لموازنة استخدام الموارد. يمكن أن تكون المقاييس أيضًا مؤشرًا على صحة النظام. على سبيل المثال، قد يكون لديك تطبيق يحتوي على العديد من الخدمات، ويبلغ كل مثيل عن مقياس الطلبات في الثانية (RPS). إذا كانت إحدى الخدمات تستخدم موارد أكثر من خدمة أخرى، فإن Service Fabric ينقل مثيلات الخدمة حول المجموعة، لمحاولة الحفاظ على استخدام الموارد بشكل متساوٍ. للحصول على شرح أكثر تفصيلاً عن كيفية عمل استخدام الموارد، راجع إدارة استهلاك الموارد وتحميلها في Service Fabric باستخدام المقاييس.

يمكن أن تساعدك المقاييس أيضًا في منحك نظرة ثاقبة على كيفية أداء خدمتك. بمرور الوقت، يمكنك استخدام المقاييس للتحقق من أن الخدمة تعمل ضمن المعلمات المتوقعة. على سبيل المثال، إذا أظهرت الاتجاهات أنه في الساعة 9 صباحًا من صباح يوم الاثنين، يكون متوسط RPS هو 1000، فيمكنك إعداد تقرير صحي ينبهك إذا كانت RPS أقل من 500 أو أعلى من 1500. قد يكون كل شيء على ما يرام تمامًا، ولكن قد يكون من المفيد إلقاء نظرة للتأكد من أن عملائك يتمتعون بتجربة رائعة. يمكن لخدمتك تحديد مجموعة من المقاييس التي يمكن الإبلاغ عنها لأغراض الفحص الصحي، ولكنها لا تؤثر على موازنة الموارد للمجموعة. للقيام بذلك، اضبط الوزن المتري على صفر. نوصي بأن تبدأ جميع المقاييس بوزن صفر، ولا تزيد الوزن حتى تتأكد من فهمك لكيفية تأثير ترجيح المقاييس على موازنة الموارد لمجموعتك.

تلميح

لا تستخدم الكثير من المقاييس الموزونة. قد يكون من الصعب فهم سبب نقل مثيلات الخدمة لتحقيق التوازن. يمكن لبعض المقاييس أن تقطع شوطًا طويلاً!

أي معلومات يمكن أن تشير إلى صحة وأداء التطبيق الخاص بك هي مرشح للمقاييس والتقارير الصحية. يمكن أن يخبرك عداد أداء وحدة المعالجة المركزية بكيفية استخدام العقدة الخاصة بك، لكنه لا يخبرك ما إذا كانت خدمة معينة سليمة، لأن خدمات متعددة قد تعمل على عقدة واحدة. ولكن، يمكن أن تشير جميع المقاييس مثل RPS والعناصر التي تمت معالجتها ووقت الاستجابة للطلب إلى صحة خدمة معينة.

سجلات دعم Service Fabric

إذا كنت بحاجة إلى الاتصال بدعم Microsoft للحصول على مساعدة بشأن مجموعة Azure Service Fabric، فستكون سجلات الدعم مطلوبة دائمًا تقريبًا. إذا كانت مجموعتك مستضافة في Azure، فسيتم تكوين سجلات الدعم وتجميعها تلقائيًا كجزء من إنشاء نظام مجموعة. يتم تخزين السجلات في حساب تخزين مخصص في مجموعة موارد المجموعة الخاصة بك. لا يحتوي حساب التخزين على اسم ثابت، ولكن في الحساب، ترى حاويات الكائنات الثنائية كبيرة الحجم وجداول بأسماء تبدأ بالنسيج. للحصول على معلومات عن إعداد مجموعات السجل لمجموعة مستقلة، راجع إنشاء وإدارة مجموعة Azure Service Fabric المستقلة وإعدادات التكوين لمجموعة Windows المستقلة. بالنسبة لمثيلات Service Fabric المستقلة، يجب إرسال السجلات إلى مشاركة ملف محلي. أنت مطالب بالحصول على هذه السجلات للحصول على الدعم، ولكن ليس الغرض منها أن تكون قابلة للاستخدام من قبل أي شخص خارج فريق دعم عملاء Microsoft.

قياس الأداء

سيساعدك قياس أداء المجموعة على فهم كيفية قدرتها على التعامل مع الحمل واتخاذ القرارات بشأن توسيع نطاق المجموعة (راجع المزيد عن توسيع نطاق المجموعة على Azure، أو في أماكن العمل). تُعد بيانات الأداء مفيدة أيضًا عند مقارنتها بالإجراءات التي قد تكون اتخذتها أنت أو تطبيقاتك وخدماتك، عند تحليل السجلات في المستقبل.

للحصول على قائمة عدادات الأداء التي يجب تجميعها عند استخدام نسيج الخدمة، راجع عدادات الأداء في Service Fabric

فيما يلي طريقتان شائعتان يمكنك من خلالهما إعداد تجميع بيانات الأداء لمجموعتك:

  • استخدام وكيل
    هذه هي الطريقة المفضلة لجمع الأداء من الجهاز، نظرًا لأن الوكلاء عادةً ما يكون لديهم قائمة بمقاييس الأداء المحتملة التي يمكن جمعها، وهي عملية سهلة نسبيًا لاختيار المقاييس التي تريد جمعها أو تغييرها. اقرأ عن Azure Monitor الذي يقدم سجلات Azure Monitor في تكامل سجلات Azure Monitor من Service Fabric وإعداد وكيل تحليلات السجل لمعرفة المزيد عن وكيل تحليلات السجل، وهو أحد عوامل المراقبة القادرة على تسجيل بيانات الأداء للأجهزة الظاهرية العنقودية والحاويات المنشورة.

  • عدادات الأداء لتخزين جدول Azure
    يمكنك أيضًا إرسال مقاييس الأداء إلى نفس تخزين الجدول مثل الأحداث. يتطلب ذلك تغيير تكوين Azure Diagnostics لانتقاء عدادات الأداء المناسبة من الأجهزة الظاهرية في مجموعتك، وتمكينها من تسجيل إحصائيات عامل الإرساء إذا كنت ستنشر أي حاويات. اقرأ عن تكوين عدادات الأداء في WAD في نسيج الخدمة لإعداد مجموعة عداد الأداء.

الخطوات التالية