Introductie
De Dickerson-hiërarchie van betrouwbaarheid biedt een kaart voor het navigeren door uitdagingen met betrekking tot betrouwbaarheid; wat moet worden aangepakt en in welke volgorde. Net als bij andere hiërarchieën van dit soort is het belangrijk dat het niveau waarop u werkt solide is voordat u de piramide omhoog gaat.
Vanaf de basis zijn de zeven lagen:
- Monitoring: Je kunt niet verbeteren wat je niet kunt zien.
- Reactie op incidenten: betrouwbare, herhaalbare processen om te reageren wanneer waarschuwingen worden geactiveerd.
- Beoordeling na incidenten: Leren van de incidenten die optreden (de focus van deze module).
- Testen en vrijgeven: Regressies vangen voordat ze productie bereiken.
- Capaciteitsplanning: ervoor zorgen dat het systeem over de resources beschikt die nodig zijn om aan de vraag te voldoen.
- Ontwikkeling: Betrouwbare software schrijven.
- Product: Het bouwen van het juiste ding voor gebruikers.
In deze module wordt de laag ongeveer in het midden van de piramide behandeld. Nadat u uw bewaking en uw incidentrespons hebt aangepakt (mogelijk met behulp van andere Learn-modules in dit leertraject), hebt u nu de mogelijkheid om u te richten op principes en procedures die u kunnen helpen uw operationele praktijk op te schalen.
De hiërarchie is aangepast aan de hiërarchie van betrouwbaarheidsbehoeften van Mikey Dickerson.
In deze module richten we ons op incidentbeoordelingen die u kunnen helpen bij het leren van fouten, wat resulteert in verbeterde betrouwbaarheid.
Wanneer u deze module hebt voltooid, gaat u het volgende doen:
- Ontdek het belang van het leren van incidenten.
- Inzicht in de aspecten van complexe systemen die leren van fouten belangrijk maken.
- Meer informatie over wanneer en hoe u een incidentbeoordeling uitvoert.
- Inzicht in het doel en de doelstellingen van een incidentbeoordeling.
- Leer de componenten die deel uitmaken van een goede nabespreking van een incident.
- Verken de Azure hulpprogramma's die u kunnen helpen om aan de slag te gaan met incidentbeoordelingen.
- Word je bewust van veelvoorkomende valkuilen om te vermijden.
- Identificeer nuttige procedures om een betere beoordeling uit te voeren.
Een inleidend verhaal
Als u de scène voor deze module wilt instellen, ziet u hier een waar verhaal (of de helft ervan, in feite, we gaan verderop in deze module naar het tweede deel):
Tijdens de Tweede Wereldoorlog was het B-17 "Vliegende fort" betrokken bij een reeks ongevallen. We weten niet alle details van deze ongevallen en we weten niet precies hoeveel er waren. Het was oorlogstijd, en veel van de details waren geheim en blijven geheim. Wat we wel weten, is dat er een aanzienlijk aantal soortgelijke incidenten was waarbij veel afzonderlijke vliegtuigen betrokken waren. Historische optellingen richten zich meestal op beschadigde vliegtuigen in plaats van ernstige verwondingen, maar het oorlogstijdrecord is onvolledig.
In elk geval zou dit gebeuren: een B-17 zou komen om te landen, zou succesvol landen en vervolgens, op de landingsbaan of taxiënd terug naar de hangar, zou er iets vreemds gebeuren. Er zou iets ernstigs gebeuren. De B-17 zou op de grond zijn en plotseling zou het landingsgestel worden ingetrokken, en het vliegtuig zou instorten op de landingsbaan.
In elk geval zouden de onderzoekers zoeken naar bewijs van mechanische of elektrische storingen, en in elk geval konden ze er geen vinden. Wat ze dus hebben geconcludeerd was dat dit een geval was van een pilotfout, dat de piloten het landingsgestel per ongeluk hadden ingetrokken.
Hier volgen twee extra gegevens: de onderzoekers waren juist dat er geen mechanische of elektrische storingen zijn opgetreden. De ongevallen bleven gebeuren.
Deze informatie kan ertoe leiden dat u ontevreden bent over de eerste conclusie die is bereikt over deze ongevallen, misschien laat u zich afvragen of dit het hele verhaal is. In deze module gaan we voorstellen dat er iets ontbreekt in deze conclusie en in de onderzoeken die ertoe hebben geleid.