Esplorare l'eccellenza operativa
Le procedure DevOps non solo riguardano la compilazione, il test e la distribuzione del software, ma si estendono anche agli aspetti operativi della vita dell'organizzazione. In particolare, DevOps può aiutare a raggiungere l'eccellenza operativa seguendo i suoi principi nelle operazioni quotidiane. L'organizzazione descritta nello scenario di esempio trarrà vantaggio dall'adozione di questo approccio per affrontare le sfide attuali. In questa unità vengono illustrati gli aspetti principali dell'eccellenza operativa nel contesto di DevOps.
Che cos'è l'eccellenza operativa?
L'eccellenza operativa è un set di procedure che promuovono efficienza, resilienza e miglioramento continuo nelle operazioni quotidiane. Gli aspetti chiave dell'eccellenza operativa si sovrappongono in gran parte alle procedure DevOps, ad esempio automazione, collaborazione, miglioramento continuo, scalabilità e flessibilità. Tuttavia, ci sono alcuni argomenti trattati qui a causa del loro significato operativo. Questi aspetti includono:
- operazioni continue: consente di creare e gestire un ambiente in cui la necessità di tempi di inattività viene ridotta o eliminata.
- monitoraggio continuo, osservabilità: evidenzia l'importanza del monitoraggio delle applicazioni e dell'infrastruttura sottostante in tempo reale. L'obiettivo finale è quello di rilevare in modo proattivo (anziché reattivo) eventuali problemi in sospeso.
- modellazione della salute: implica la creazione di modelli che rappresentano il comportamento previsto e le prestazioni di un sistema target in condizioni diverse. Questa operazione funge da baseline per rilevare eventuali anomalie, che potrebbero indicare potenziali problemi.
- Ingegneria dell'affidabilità: usa le pratiche di chaos engineering e iniezione di guasti per applicare misure proattive che portano a una maggiore resilienza.
- gestione degli eventi imprevisti: è incentrata su una risposta e una risoluzione efficienti degli eventi imprevisti, tra cui la gestione degli eventi imprevisti ben definita, i canali di comunicazione affidabili, la correzione automatizzata e l'apprendimento continuo per ridurre al minimo la possibilità di problemi ricorrenti.
- Integrazione della sicurezza: incorpora le procedure di sicurezza nel ciclo di vita delle operazioni.
- Test di spostamento a destra: usa procedure come l'avvio scuro e i flag di funzionalità nell'ambiente di produzione.