Jagamisviis:


Soovitused töökindluse testimise strateegia väljatöötamiseks

Kehtib selle Power Platform hästi koostatud töökindluse kontrollnimekirja soovituse kohta.

RE:06 Testige vastupidavuse ja kättesaadavuse stsenaariume, rakendades oma testimis- ja tootmiskeskkondades kaosetehnika põhimõtteid. Kasutage testimist, et tagada teie graatsilise lagunemise rakendamise strateegiate tõhusus, tehes aktiivse rikke ja simuleeritud koormustestimise.

Selles juhendis kirjeldatakse soovitusi töökindluse testimise strateegia kujundamiseks, et kontrollida ja optimeerida töökoormuse töökindlust. Töökindluse testimine keskendub teie töökoormuse vastupidavusele ja kättesaadavusele, täpsemalt kriitilistele voogudele, mille tuvastate lahenduse kujundamisel. See juhend sisaldab üldisi testimisjuhiseid ja juhiseid, mis on spetsiifilised tõrke süstimise ja kaose projekteerimise kohta.

Mõisted

Mõiste Määratlus
Kättesaadavus Aeg, mille jooksul rakenduse töökoormus töötab terves olekus ilma märkimisväärse seisakuta.
Kaose tehnika Rakenduste ja teenuste allutamine reaalsetele pingetele ja tõrgetele. Kaosetehnika eesmärk on luua ja kinnitada vastupidavust ebausaldusväärsetele tingimustele ja puuduvatele sõltuvustele.
Vea süstimine Süsteemi vea sisestamine süsteemi vastupidavuse testimiseks.
Taastatavus Vastupidavuse sünonüüm.
Vastupidavus Rakenduse töökoormuse võime tõrkerežiimidele vastu seista ja neist taastuda.

Peamised disainistrateegiad

Testimine on oluline tagamaks, et teie töökoormus vastab oma töökindluse eesmärkidele ja suudab tõrgetega sujuvalt toime tulla. Vea süstimine on teatud tüüpi testimine, mis toob teie süsteemi tahtlikult vigu või stressi, et simuleerida reaalseid stsenaariume. Kasutades tõrke süstimise ja kaose projekteerimise tehnikaid, saate ennetavalt avastada ja lahendada probleeme enne, kui need teie tootmiskeskkonda mõjutavad. See jaotis annab üldisi juhiseid teie töökoormuse testimise, tõrkesüstimise ja kaose kavandamise kohta.

Üldised testimisjuhised

Tehke regulaarselt testimist, et kinnitada olemasolevaid künnistesse, eesmärke ja eeldusi. Kui teie töökoormuses toimub suur muutus, käivitage regulaarne testimine. Tehke enamik testimisi testimis- ja lavastuskeskkondades. Samuti on kasulik käivitada testide alamhulk tootmissüsteemi vastu.

Automatiseerige testimine, et tagada testide järjepidev katvus ja reprodutseeritavus. Automatiseerige levinud testimisülesanded ja integreerige need oma ehitusprotsessidesse. Tarkvara käsitsi testimine on tüütu ja vastuvõtlik vigadele, kuid saate läbi viia käsitsi uurimusliku testimise. Juhtudel, kui teil on vaja välja töötada automatiseeritud testimine, kasutage käsitsi testimist, et määrata kindlaks arendatavate testide ulatus.

Võtke kasutusele nihke vasakpoolne testimise lähenemisviis, et teha vastupidavuse ja kättesaadavuse testimine arendustsükli alguses.

Kohandage lihtsat dokumentatsioonivormingut, et kõigil oleks lihtne mõista protsessi ja iga regulaarse testi tulemusi.

Jagage dokumenteeritud tulemusi vastavate meeskondadega, nagu operatiivmeeskonnad, tehnoloogiajuhtkonnad, ärihuvirühmad ja avariitaaste sidusrühmad. Tulemused peaksid andma teavet töökindluse eesmärkide, näiteks teenusetaseme eesmärkide (SLO), teenusetaseme lepingute (SLA), taasteaja eesmärkide (RTO) ja taastepunkti eesmärkide (RPO) täpsustamiseks.

Looge oma varukoopiate jaoks regulaarne testimissagedus. Taastage andmed isoleeritud süsteemidesse, et tagada varukoopiate kehtivus ja taastamine.

Dokumenteerige ja jagage taasteaja mõõdikuid oma avariitaaste sidusrühmadega, et tagada taastamise ootuste sobivus.

Kasutage tööstusharu standardseid juurutamise testimise protseduure, et tagada automatiseeritud, prognoositav ja tõhus juurutusprotsess.

Testige oma töökoormuse võimet taluda ajutisi tõrkeid. Lisateabe saamiseks vaadake teemat Soovitused mööduvate tõrgete käsitlemiseks.

Testige, kuidas teie töökoormus käsitleb tõrkeid sõltuvates teenustes või muudes sõltuvustes, kasutades tõrkesüstimist.

Testige oma avariitaasteplaani, et reageerida katastroofilistele tõrgetele ja muudele suurematele intsidentidele.

Testige oma töökoormuse võimet graatsiliselt halveneda ja minimeerida komponendi rikke plahvatusraadiust, kasutades rikkesüstimist.

Kasutage ära planeeritud ja planeerimata katkestusi

Kui teie töökoormus on plaanilise hoolduse või planeerimata katkestuse tõttu võrguühenduseta, on teil ainulaadne võimalus testida ja parandada oma töökoormuse mõistmist. Järgmistes jaotistes antakse soovitusi iga stsenaariumi kohta.

Plaaniline hooldus

Kui olete plaaninud värskenduste või paikade hooldusaknad, saate testida komponente ja vooge, mis ei ole hooldustöödega seotud. Tehke teste ilma võimaliku ohuta, et töökoormus väheneb ootamatult või muutub võrguühenduseta. Kui teil on hooldusakna jooksul piisavalt aega, saate pärast hooldustööde lõpetamist testida ka hooldusega seotud komponente ja vooge.

Planeerimata katkestus

Kasutage iga katkestusjuhtumit võimalusena oma töökoormuse kohta lisateabe saamiseks ja selle vastupidavuse parandamiseks, järgides neid samme, mis on järjestatud prioriteedi järgi.

  1. Viige töökoormus oma kasutajate jaoks uuesti võrku. Võimalik, et peate probleemile lahenduse tegema, probleemi lahendama või taasteprotsessid käivitama.

  2. Tehke kindlaks katkestuse algpõhjus ja tegelege sellega. Kui saate juurpõhjuse uurimise käigus parandada, dokumenteerige algpõhjus ja selle parandamiseks võetud meetmed. Kui probleem nõuab hiljem uut hooldusakent, veenduge, et teie leevendusmeetmed suudaksid eeldatava koormusega toime tulla, testides neid põhjalikult. Veenduge, et olete oma leevendusmeetmete katmiseks seadistanud piisava seire.

  3. Vajaduse korral otsige sama probleemi või konfiguratsiooni nõrkusi, mida sarnased probleemid võivad mõjutada, kõigis oma töökoormuse komponentides. Kasutage seda võimalust nende komponentide ennetavaks käsitlemiseks. Vaadake oma juhtumite ajalugu, et tuvastada sarnaste probleemide mustrid kogu töökoormuses.

  4. Kasutage oma tulemusi oma testimisstrateegia täiustamiseks. Veenduge, et olete edukalt lahendanud algpõhjuse ja sarnased probleemid, testides otse sama tõrget.

Veasüstimise ja kaose tehnilised juhised

Vea süstimise testimine järgib kaosetehnika põhimõtteid, rõhutades töökoormuse võimet reageerida komponentide riketele. Tehke tõrke süstimise testimine tootmiseelses ja tootmiskeskkonnas. Rakendage tõrkerežiimi analüüsist saadud teavet, et testida ainult neid tõrkeid, mida prioriseerib, ja et teil on tõrkeid käsitlevad leevendusstrateegiad.

Kaosetehnika peamised juhised on järgmised:

  • Olge ennetav. Ärge oodake, kuni ebaõnnestumised juhtuvad. Proovige tõrkeid ette näha, tehes kaosekatseid, et avastada ja lahendada probleeme enne, kui need teie tootmiskeskkonda mõjutavad.

  • Võtke omaks ebaõnnestumine. Aktsepteerige oma süsteemis esinevaid tõrkeid ja õppige neist. Vaadake tõrkeid keerukate süsteemide loomuliku osana ja kasutage neid kui võimalusi õppimiseks ja oma süsteemi töökindluse parandamiseks.

  • Lõhkuge süsteem. Süstige oma süsteemi tahtlikult vigu või stressi, et testida selle vastupidavust. Simuleerige reaalseid tõrkeid või katkestusi, et testida ja täiustada oma töökoormuse taastamisvõimalusi.

  • Ehitage immuunsust. Kasutage kaosetehnika katseid, et parandada oma töökoormuse võimet tõrkeid ennetada ja neist taastada.

Kaosetehnika on töökoormuse meeskonnakultuuri lahutamatu osa ja pidev praktika, mitte lühiajaline taktikaline pingutus vastuseks ühele katkestusele. Järgige kaosekatsete kavandamisel järgmist standardmeetodit.

  1. Alustage hüpoteesiga. Igal katsel peaks olema selge eesmärk, näiteks testida voo võimet taluda konkreetse komponendi kadumist.

  2. Mõõtke algkäitumist. Veenduge, et teil oleks katses osaleva voo ja komponentide jaoks järjepidevad töökindluse ja jõudluse mõõdikud, mida saate katse käivitamisel võrrelda halvenenud olekuga.

  3. Süstige viga või vead. Katse peaks tahtlikult olema suunatud konkreetsetele komponentidele, mida saab kiiresti taastada, ja teil peaks olema teadlik ootus vea süstimise mõju kohta, et aidata kontrollida katse plahvatusraadiust.

  4. Jälgige saadud käitumist. Koguge telemeetriat üksikute vookomponentide ja katse sihtrühma otsast lõpuni voo käitumise kohta, et õigesti mõista vea mõju. Võrrelge kogutud mõõdikuid baasmõõdikutega, et saada täielik ülevaade tõrkesüsti tulemustest.

  5. Dokumenteerige protsess ja tähelepanekud. Katsete kohta üksikasjaliku arvestuse pidamine annab teavet tulevaste töökoormuse kujundamise otsuste tegemiseks, tagades, et kõrvaldate aja jooksul ilmnenud lüngad.

  6. Tuvastage tulemus ja tegutsege selle järgi. Kavandage parandustoimingud, mida saab täiustusena töökoormuse mahajäämusse lisada. Veenduge, et disaini täiustamise plaanid vaadatakse üle ja testitakse mittetootmiskeskkondades samade protsesside kohaselt nagu muud juurutused.

Kontrollige perioodiliselt oma protsessi, arhitektuurivalikuid ja koodi, et kiiresti tuvastada tehniline võlg, integreerida uusi tehnoloogiaid ja kohaneda muutuvate nõuetega.

Kui teete veasüstimise katseid, tehke järgmist:

  • Veenduge, et jälgimine on paigas ja hoiatused on seadistatud.

  • Kinnitage oma protsess, mille käigus määratakse otseselt vastutav isik (DRI) intsidendi eest vastutama.

  • Veenduge, et teie dokumentatsioon ja uurimisprotsessid oleksid ajakohased.

Integreerige järgmised soovitused ja kaalutlused, et optimeerida oma kaose testimise strateegiat:

  • Vaidlustage süsteemi eeldused. Testimise abil püüate parandada oma töökoormuse ja töökoormuse kujundamise strateegiate vastupidavust. Otsige võimalusi vigade sisestamiseks komponentidesse ja voogudesse, mida eeldate varasemate kogemuste põhjal usaldusväärseks. Need ei pruugi teie uues töökoormuses usaldusväärsed olla.

  • Kinnitage muudatus. Ilma põhjaliku testimiseta, sealhulgas veasüsti testimiseta, võib teil pärast muudatuste tegemist olla oma töökoormusest puudulik pilt. Näiteks võite tutvustada uusi sõltuvusi, mis pole kohe nähtavad.

  • Kasutage SLA puhvreid. Piirake kaose testimist, et püsida oma SLA-de piires ja vältida katkestuste võimalikke kahjulikke mõjusid. Teie voo ja komponentide taastamise eesmärgid aitavad määratleda testimise ulatust.

  • Koostage veaeelarve kui investeering kaosesse ja rikete süstimisse. Teie veaeelarve on erinevus 100% SLO saavutamise ja kokkulepitud SLO saavutamise vahel.

  • Peatage katse, kui see ületab ulatust. Teadmata tulemused on kaosekatsete eeldatav tulemus. Püüdke saavutada tasakaal oluliste tulemuste andmete kogumise ja võimalikult väheste tootmiskasutajate mõjutamise vahel.

  • Tehke tihedat koostööd arendusmeeskondadega, et tagada süstitud rikete asjakohasus. Kasutage juhendina varasemaid juhtumeid või probleeme. Uurige sõltuvusi ja hinnake nende sõltuvuste eemaldamise tulemusi.

  • Tuvastage ja dokumenteerige varem avastamata sõltuvused oma töökoormuse erinevate komponentide vahel, mis ilmnevad kaose testimise käigus.

  • Kohandage taasteplaane vastavalt vajadusele, et võtta arvesse kaose testimise käigus avastatud sõltuvusi.

  • Kasutage katsete ja testide tulemusi uute katsete ja testide alusena. Ootamatu käitumise ilmnemisel võivad uued testid neid käitumisi otse sihtida ja anda teile võimaluse kujundada nende jaoks parandusstrateegiaid.

Kompromiss: Rikete süstimise testimine tootmises võib olla häiriv ja põhjustada seisakuid. Olge sidusrühmadega selle võimaluse osas läbipaistev ja veenduge, et teil on olemas kaitsemeetmed katsete lõpetamiseks ja tagasipööramisplaanid, et teie esitatud tõrked kiiresti tagasi pöörata.

Power Platform Hõlbustamine

Saate kasutada staatilisi tulemusi Power Automate fikseeritud tulemuse tagastamiseks, et testida oma töökoormust.

Power Appsi testimismootor on Power Platform CLI komponent, mida saate kasutada autonoomsete lõuendirakenduste testimiseks Power Appsis.

Azure’i testiplaanid on hõlpsasti kasutatav brauseripõhine testihalduslahendus, mis pakub kõiki võimalusi, mis on vajalikud planeeritud käsitsi testimiseks, kasutajate vastuvõtutestimiseks, uurimuslikuks testimiseks ja sidusrühmadelt tagasiside kogumiseks.

Kui teie töökoormus sisaldab Azure’i ressursse, saate kasutada Azure Chaos Studiot, hallatavat teenust, mis kasutab kaosetehnikat, et aidata teil mõõta, mõista ja parandada oma pilverakenduse ja -teenuse vastupidavust.

Kui teie töökoormus sisaldab Microsoft Copilot Studio agenti, saate agentide ja testide konfigureerimiseks kasutada Power CAT Copilot Studio komplekti . Käivitades üksikuid teste API-de suhtes Copilot Studio (Direct Line), hinnatakse agendi vastuseid oodatud tulemuste alusel.

Töökindluse kontrollnimekiri

Vaadake kõiki soovitusi.