ملاحظة
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تسجيل الدخول أو تغيير الدلائل.
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تغيير الدلائل.
ينطبق على توصية قائمة مراجعة Power Platform Well-Architected Reliability:
RE:06 | اختبر سيناريوهات الكفاءة والتوفر من خلال تطبيق مبادئ هندسةفوضى في بيئات الاختبار والإنتاج الخاصة بك. استخدم الاختبار للتأكد من أن إستراتيجيات تنفيذ التدهور الرشيقة الخاصة بك فعالة من خلال إجراء عطل نشط واختبار الحمل المحاكى. |
---|
يصف هذا الدليل التوصيات الخاصة بتصميم إستراتيجية اختبار ثبات النظام من أجل التحقق من صحة ثبات حمل العمل وتحسينه. ويركز اختبار ثبات النظام على مرونة وتوافر حمل العمل الخاص بك، لا سيولتك على وجه التحديد للتدفقات الهامة التي تحددها عند تصميم الحل. يوفر هذا الدليل إرشادات اختبار عامة وإرشادات خاصة باختبارات في هندسة الأخطاء والفوضى.
التعريفات
المصطلح | تعريف |
---|---|
التوافر | الفترة الزمنية التي يعمل فيها حمل عمل التطبيق في حالة سليم دون أوقات توقف كبيرة. |
هندسة الفوضى | ممارسة اخ تخضع التطبيقات والخدمات للواقعيين والفشل. الهدف من الهندسة الفوضويه هو بناء و التحقق من صحة الحالات غير المتحققة والتبعيات المفقودة. |
مهيؤها في العمل | إجراء إدخال خطأ على نظام لاختبار مرونة النظام. |
استرداد | مرادف للكمية. |
المرونة | قدرة حمل عمل تطبيق ما على اعادته من أوضاع الفشل واستردادها. |
استراتيجيات التصميم الأساسية
إن الاختبار أمر أساسي لضمان وقاء حمل العمل لديك ب أهدافه الخاصة بالوثوقية ويمكنه معالجة حالات الفشل برهة. والنوع الذي قد يحدث فيه الخطأ هو نوع من الاختبار الذي يقدم عن عمد وحدات عرض أو خطأ في النظام لديك لمحاكاة سيناريوهات واقعية. ومن خلال استخدام أساليب الكشف عن الأخطاء والفوضى، يمكن اكتشاف المشكلات وإصلاحها بشكل نشط قبل أن تؤثر على بيئة الإنتاج لديك. يوفر هذا القسم إرشادات عامة حول الاختبار، وفحص الأخطاء المهينة، وهندسة الفوضويات لعبء العمل الخاص بك.
إرشادات الاختبار العامة
إجراء الاختبار بشكل روتيني للتحقق من صحة العتبات والأهداف والافتراضات الحالية. عند حدوث تغيير رئيسي في حمل العمل، يمكنك إجراء اختبار منتظم. إجراء معظم الاختبارات في بيئات الاختبار والتندرج. ومن المفيد أيضا تشغيل مجموعة فرعية من الاختبارات مقابل نظام الإنتاج.
أتمتة الاختبار للمساعدة في ضمان تناسق تغطية الاختبار والناسخة. قم بأتمتة مهام الاختبار الشائعة وتكاملها في عمليات البناء الخاصة بك. الاختبار اليدوي للبرنامج أمر شجري ويكشف عن الخطأ، ولكن يمكنك إجراء اختبار استكشافي يدوي. بالنسبة ل الحالات التي تحتاج فيها إلى تطوير اختبار تلقائي، استخدم الاختبار اليدوي لتحديد نطاق الاختبارات التي يجب تطويرها.
اعتماد أسلوب اختبار من اليسار لليسار لإجراء اختبار الكفاءة والتوفر في وقت مبكر من دورة التطوير.
يمكنك استخدام تنسيق وثائق بسيط بحيث يسهل على كل شخص فهم العملية والنتائج الخاصة بكل اختبار منتظم.
شارك الفرق المناسبة النتائج الموثقة، مثل الفرق التشغيلية و القيادة التكنولوجية وأصحاب القرار في مجال الأعمال والمساهمين في استرداد الكوارث. وينبغي أن تبلغ النتائج عن تحسين أهداف الاعتمادية، مثل أهداف مستوى الخدمة (SLOs) واتفاقيات مستوى الخدمة وأهداف وقت الاسترداد (RTOs) وأهداف نقطة الاسترداد.
قم بإنشاء برنامج اختبار منتظم لنسخ الاحتياطي. يمكنك استعادة البيانات إلى أنظمة معزلة للمساعدة في ضمان صلاحية النسخ الاحتياطي وعمل النسخ الاحتياطي.
اوثق معايير وقت الاسترداد وشاركها مع الجهات المعنية باسترداد الكوارث لضمان ملاءمة توقعات الاستعادة.
استخدم إجراءات اختبار النشر على مستوى الصناعة للمساعدة في التأكد من أن لديك عملية نشر تلقائية قابلة للاستخدام قابلا للاستخدام وفعالة.
اختبر قدرة حمل العمل على إجراء عمليات فشل متقطعة. لمزيد من المعلومات، راجع توصيات للتعامل مع الأخطاء العابرة.
اختبر كيف يتعامل حمل العمل مع حالات الفشل في الخدمات التبعية أو التبعيات الأخرى عن طريق استخدام المواد المتعاملة مع الحالات المهينة.
اختبر خطة استرداد الكوارث للاستجابة إلى حالات الفشل الكبيرة وا الحوادث الرئيسية الأخرى.
اختبر قدرة حمل العمل لديك على التعامل مع الأخطاء بشكل غير مهين وتقليل حجمه إلى درجة كبيرة من زيادة حجم المكونات باستخدام التعامل مع الأخطاء التي قد يتم استخدامها أثناء التعامل مع هذه الأخطاء.
الاستفادة من انقطاعات المخطط لها وغير المخطط لها
عندما يكون حمل العمل الخاص بك غير متصل بسبب الصيانة المخطط لها أو انقطاع غير مخطط له، فإن لديك فرصة فريدة لإجراء الاختبارات وتحسين فهمك لعبء العمل الخاص بك. توفر الأقسام التالية توصيات لكل سيناريو.
الصيانة المقررة
عند تخطيط نوافذ الصيانة للتحديثات أو تصحيحات، يمكنك اختبار المكونات والتدفقات غير المشاركة في عمل الصيانة. إجراء اختبارات دون المخاطرة المحتملة بعبء العمل الذي قد يحدث على نحو غير متوقع أو الأخذه في وضع عدم الاتصال بالإنترنت. إذا كان لديك وقت كاف أثناء وقت الصيانة، يمكنك أيضا اختبار المكونات والتدفقات المشاركة في الصيانة بعد اكتمال أعمال الصيانة.
انقطاع غير مخطط له
استخدم كل حادث انقطاع كفررصة لمعرفة المزيد حول حمل العمل الخاص بك وتحسين مرونة هذا الحادث من خلال اتباع هذه الخطوات، التي يتم طلبها حسب الأولوية:
ارجع إلى حمل العمل متصلا بالإنترنت مرة أخرى للمستخدمين. قد تحتاج إلى تنفيذ حل بديل للمشكلة أو حل المشكلة أو بدء عمليات الاسترداد.
حدد السبب الجذري للانقطاع وعالجه. إذا كان بإمكانك إصلاح السبب الجذر كجزء من المصل، فوثق السبب الجذر و القياسات التي قمت بها لإصلاحه. إذا كانت المشكلة تتطلب أخذ نافذة صيانة أخرى لاحقا ، فتأكد من أن تدابير التخفيف الخاصة بك يمكنها التعامل مع الحمل المتوقع عن طريق اختبارها بدقة. تأكد من إعداد مراقبة كافية لتغطية قياسات تلك التي تم الحصول عليها.
ابحث عن نفس المشكلة أو نقاط القوة في التكوين التي قد تكون تأثرت بمواد مماثلة، إن أمكن، عبر جميع المكونات في حمل العمل. استخدم هذه الفرصة لمعالجة هذه المكونات على نحو نشط. راجع محفوظات الحوادث للكشف عن أنماط تشابه المشكلات عبر حمل العمل الخاص بك.
استخدم النتائج الخاصة بك لتحسين إستراتيجية الاختبار. تأكد من أنك قد قمت بمعالجة السبب الجذر والمشكلات المتشابهة بنجاح عن طريق اختبار الفشل نفسه مباشرة.
إرشادات العمل في المنامة وهندسة الفوضى
تتبع اختبارات الفشل القلبي مبادئ الهندسة الفوضوية من خلال قدرة حمل العمل على التفاعل مع فشل المكونات. إجراء اختبار اختبار مفبرك في بيئات ما قبل الإنتاج والإنتاج. قم بتطبيق المعلومات التي تعلمتها من إجراء تحليل وضع الفشل للتأكد من أنك تقوم فقط باختبار البيانات التحليلية التي تحددها حسب أولوياتها وأن لديك إستراتيجيات في التعامل مع الحالات التي يتم التعامل فيها.
الإرشادات الأساسية لهندسة الفوضى هي:
كن استباقيًا. لا تنتظر حتى تحدث حالات الفشل. حاول توقع حالات الفشل من خلال إجراء تجارب فوضوي لاكتشاف المشكلات وإصلاحها قبل أن تؤثر على بيئة الإنتاج.
فشل الفشل في الفشل الفشل في الفشل. اقبل حالات الفشل التي تحدث في نظامك واتعلم منها. يمكنك الاطلاع على حالات الفشل كجزء طبيعيا من الأنظمة المعقدة واستخدامها على أنها فرص للحصول على مزيد من المعلومات حول ثبات النظام لديك وتحسينه.
كسر النظام. كما يتم عن عمد إدخاله داخل النظام أو إلى داخله لاختباره. محاكاة حالات الفشل أو التعطل في الواقع لاختبار إمكانات استرداد حمل العمل لديك وتحسينها.
بناء i يجب أن يكون استخدم تجارب الهندسة الفوضائية لتحسين قدرة حمل العمل لديك على منع حالات الفشل واستردادها.
تعد الهندسة الفوضوية جزءا لا يتجزأ من أعمال فريق حمل العمل، كما أنها ممارسة مستمرة، ولا تعد مجهودا في المدى القصير استجابة لنقطاع فردي. اتبع هذا الأسلوب القياسي عند تصميم تجارب الفوضى:
ابدأ بفرضية. ينبغي أن يكون لكل تجربة هدف واضح، مثل اختبار قدرة التدفق على نقل خسارة مكون معين.
قياس سلوك خط الأساس. تأكد من أن لديك معايير ثبات وأداء متسقة للتدفق والمكونات المضمنة في تجربة ما لمقارنتها بدولة التعامل مع الحالات المضمنة عند تشغيل تجربتك.
الاهتياء بزهار أو استخدامات مهينة. وينبغي أن تستهدف التجربة عن عمد مكونات معينة يمكن استردادها بسرعة، وينبغي أن يكون لديك توقع مطلع بمدى تأثير تلك المكونات التي قد تتسبب فيها تلك المكونات في محاولة للمساعدة في التحكم في مجموعة العبوة الناسنة للتجربة.
راقب السلوك الناتج. جمع قياس قياس الاستخدام حول مكونات سير العمل الفردية وسلوك التدفق النهائي الذي تستهدفه التجربة لفهم تأثيراته بشكل صحيح. قارن القياسات التي تجمعها مع المقاييس الأساسية للحصول على صورة كاملة لنتائج التعامل مع الحالات المهينة.
وثق العملية والتكاتف. إن الاحتفاظ بسجلات تفصيلية من تجاربك سيبلغ القرارات المستقبلية حول تصميم حمل العمل، وضمان معالجة التعامل مع هذه المشكلة التي تم الكشف عنها عبر الوقت.
تحديد النتيجة والعمل عليها. خطط لخطوات الإصلاح التي يمكن إضافتها إلى حمل العمل المتراكم لديك باعتبارها تحسينات. تأكد من مراجعة خطط تحسين التصميم واختبارها في بيئات عدم الإنتاج وفقا لنفس العمليات مثل عمليات النشر الأخرى.
قم بالتحقق بشكل دوري من العملية، وخيارات البنية البرمجية، والكشف السريع عن الدين الفني، وتكامل التقنيات الجديدة، والتطويع مع المتطلبات المتغيرة.
وعند إجراء تجارب اختبارية على الحالات غير المباشرة، يمكنك:
تأكد من أن المراقبة في مكانها وأن التنبيهات قد تم إعدادها.
قم بالتحقق من عملية تعيين فرد مسؤول مباشرة (،،) لتولى ملكية أحد الأحداث.
تأكد من أن الوثائق والعمليات المضمنة لديك م أحدث ما يكون.
تكامل التوصيات والاعتبارات التالية لتحسين استراتيجية اختبار حالة الفوضى الخاصة بك:
تحدي افتراضات النظام. ومن خلال الاختبار، تحاول تحسين مرونة حمل العمل وإستراتيجيات تصميم حمل العمل. ابحث عن فرص الوصول إلى مكونات وتدفقات يفترض أنها موثوق بها استنادا إلى التجارب السابقة. وقد لا تكون موثوق بها في حمل العمل الجديد.
التحقق من صحة التغيير. وبدون إجراء اختبار كامل، بما في ذلك اختبار اختبار الأخطاء غير المضمنة، قد تكون لديك صورة غير مكتملة عن حمل العمل الخاص بك بعد إجراء التغييرات. على سبيل المثال، قد تقوم بتقديم تبعيات جديدة غير واضحة على الفور.
استخدم SLA. اقصر اختبار الفوضى على البقاء ضمن نطاق ولادتك مع تجنب حدوث نتائج عكسية محتملة من انقطاع القدرة على العمل. تساعد أهداف الانسياب واسترداد المكون على تعريف نطاق الاختبار.
وضع موازنة خطأ استثمار في حالة من الفوضى والفوضى. موازنة الخطأ الخاصة بك هي الفرق بين تحقيق 100٪ من SLO و تحقيق SLO المتفق عليه.
قم بوقف التجربة إذا تجاوزت النطاق. والنتائج غير المعروفة هي نتيجة متوقعة لتجربة الفوضى. العمل جاهدا لتحقيق توازن بين جمع بيانات النتائج الأساسية التأثير على عدد قليل من مستخدمي الإنتاج قدر الإمكان.
العمل عن كثب مع فرق التطوير لضمان صلة حالات الفشل التي تم التعامل معها. استخدم الحوادث أو المشاكل السابقة كدليل إرشادي لك. فحص التبعيات وتقييم النتائج عند إزالة هذه التبعيات.
قم بتحديد التبعيات التي لم يتم الكشف عنها من قبل والمستندة بين المكونات المختلفة داخل حمل العمل الخاص بك، التي تم الكشف عنها من خلال اختبار حالة من عدم التناسق.
اضبط خطط الاسترداد حسب الضرورة لحساب التبعيات التي تم اكتشافها أثناء اختبار حالة الفوضى.
استخدم النتائج من التجارب أو الاختبارات كأساس للتجارب أو الاختبارات الجديدة. عند حدوث سلوك غير متوقع، قد تستهدف الاختبارات الجديدة هذه السلوكيات مباشرة وتعطيك الفرصة لتصميم استراتيجيات الإصلاح لهم.
المفاضلة: يمكن أن يكون اختبار الحقن الخاطئ في الإنتاج معطلاً ويمكن أن يتسبب في وقت التوقف عن العمل. واحرص على التعامل مع أصحاب القرار بشأن هذه الإمكانية وضمان وجود إجراءات حماية في مكانها لإنهاء التجارب وخطط العودة إلى العمل بشكل سريع من أجل عكس الفشل الذي تقوم بتقديمه.
تبسيط Power Platform
مكنك استخدام النتائج الساكنة في Power Automate لإرجاع نتيجة ثابتة لاختبار حجم العمل لديك.
Power Apps اختبار المحرك (المعاينة) هو مكون Power Platform IS يمكنك استخدامه لاختبار تطبيقات اللوحة مستقل في Power Apps.
خطط Azure الاختبارية هي حل إدارة اختبار سهل الاستخدام يستند إلى المستعرض ويوفر جميع الإمكانيات المطلوبة للاختبار اليدوي المخطط واختبار قبول المستخدم واختبارات استكشافية وجمع الملاحظات من أصحاب الشأن.
إذا كان حمل العمل الخاص بك يشمل موارد Azure ، يمكنك استخدام Azure Chaos Studio، وهي خدمة مدارة تستخدم الهندسة الفوضوية لمساعدتك في قياس وفهم وتحسين تطبيق الخدمة السحابي ومستخدم الخدمة.
إذا كان حمل العمل الخاص بك يتضمن Microsoft Copilot Studio مندوب، فيمكنك استخدام Power CAT Copilot Studio Kit لتكوين الوكلاء والاختبارات. من خلال إجراء اختبارات فردية مقابل Copilot Studio واجهات برمجة التطبيقات (Direct Line)، يتم تقييم استجابات مندوب مقابل النتائج المتوقعة.
قائمة فحص الموثوقية
راجع مجموعة التوصيات الكاملة.