Controlelijst voor ontwerpbeoordeling voor betrouwbaarheid

Deze controlelijst bevat een reeks aanbevelingen die u kunt gebruiken om de strategieën voor betrouwbaarheid, tolerantie en foutherstel in uw architectuurontwerp te evalueren. Om betrouwbaarheid te garanderen, identificeert u de beste infrastructuur en toepassingsontwerp voor uw workload. Neem deze beslissingen op basis van uw bedrijfsvereisten die zijn toegewezen aan metrische gegevens over beschikbaarheid en herstelmogelijkheden.

Als u een betrouwbaar ontwerp wilt implementeren, moet u goed nadenken over beslissingspunten in uw ontwerp en bewust zijn van de invloed van deze beslissingen op uw workload. Deze controlelijst en de bijbehorende handleidingen bieden bronnen om u te helpen bij het nemen van deze beslissingen. Zorg ervoor dat betrouwbaarheid van workloads centraal staat tijdens het ontwerp, de ontwikkeling en de operationele levenscyclus van de workload.

Controlelijst

Benader uw ontwerp met een focus op betrouwbaarheid om ervoor te zorgen dat u een werkbelasting ontwerpt die tolerant, beheersbaar en herhaalbaar is. Als u geen betrouwbaarheidspraktijken opneemt en rekening houdt met de compromissen, loopt uw ontwerp mogelijk risico. Overweeg zorgvuldig alle punten die in de controlelijst worden behandeld om vertrouwen te wekken in het succes van uw systeem.

  Code Aanbeveling
RE:01 Ontwerp uw workload op basis van bedrijfsdoelstellingen en vermijd onnodige complexiteit of overhead. Gebruik een praktische en evenwichtige aanpak om ontwerpbeslissingen te nemen die de gewenste resultaten opleveren. Beperk uw ontwerp aan de benodigdheden om inefficiënties en potentiële problemen te verminderen.
RE:02 Gebruikers- en systeemstromen identificeren en beoordelen. Gebruik een kritieke schaal op basis van uw bedrijfsvereisten om prioriteit te geven aan de stromen.
RE:03 Gebruik foutmodusanalyse (FMA) om mogelijke fouten in uw oplossingsonderdelen te identificeren en prioriteit te geven. Voer FMA uit om u te helpen het risico en effect van elke foutmodus te beoordelen. Bepaal hoe de workload reageert en herstelt.
RE:04 Definieer betrouwbaarheids- en hersteldoelen voor de onderdelen, de stromen en de algehele oplossing. Visualiseer de doelen om te onderhandelen, consensus te bereiken, verwachtingen te stellen en acties aan te zetten om de ideale status te bereiken. Gebruik de gedefinieerde doelen om het statusmodel te bouwen. Het statusmodel definieert hoe statussen in orde, gedegradeerd en beschadigd eruitzien.
RE:05
RE:05
RE:05
Voeg redundantie toe op verschillende niveaus, met name voor kritieke stromen. Redundantie toepassen op de reken-, gegevens-, netwerk- en andere infrastructuurlagen in overeenstemming met de geïdentificeerde betrouwbaarheidsdoelen.
RE:06
RE:06
Implementeer een tijdige en betrouwbare schaalstrategie op toepassings-, gegevens- en infrastructuurniveau.
RE:07
RE:07
RE:07
Verbeter de tolerantie en herstelbaarheid van uw workload door zelfbehoud en zelfherstelmaatregelen te implementeren. Bouw mogelijkheden in de oplossing in door gebruik te maken van op infrastructuur gebaseerde betrouwbaarheidspatronen en ontwerppatronen op basis van software om fouten en tijdelijke fouten van onderdelen af te handelen. Bouw mogelijkheden in het systeem in om fouten met oplossingsonderdelen te detecteren en automatisch corrigerende actie te starten terwijl de workload met volledige of verminderde functionaliteit blijft werken.
RE:08 Test op tolerantie- en beschikbaarheidsscenario's door de principes van chaos-engineering toe te passen in uw test- en productieomgevingen. Gebruik testen om ervoor te zorgen dat uw implementatie- en schaalstrategieën voor degradatie effectief zijn door actieve storingen en gesimuleerde belastingstests uit te voeren.
RE:09 Implementeer gestructureerde, geteste en gedocumenteerde BCDR-plannen (business continuity and disaster recovery) die zijn afgestemd op de hersteldoelen. Plannen moeten alle onderdelen en het systeem als geheel omvatten.
RE:10 Meet en modelleer de statussignalen van de oplossing. Leg continu uptime- en andere betrouwbaarheidsgegevens vast van de hele workload en ook van afzonderlijke onderdelen en sleutelstromen.

Volgende stappen

We raden u aan de afwegingen tussen betrouwbaarheid te bekijken om andere concepten te verkennen.