Exploración de la excelencia operativa
Las prácticas de DevOps no solo abarcan la compilación, las pruebas y la entrega de software, sino que también se extienden a aspectos operativos de la vida de la organización. En concreto, DevOps puede ayudar a alcanzar la excelencia operativa siguiendo sus principios en las operaciones diarias. La organización descrita en el escenario de ejemplo se beneficiaría de adoptar este enfoque para abordar sus desafíos actuales. En esta unidad, obtenga información sobre los aspectos básicos de la excelencia operativa en el contexto de DevOps.
¿Qué es la excelencia operativa?
La excelencia operativa es un conjunto de prácticas que promueven la eficiencia, la resistencia y la mejora continua en las operaciones diarias. Los aspectos clave de la excelencia operativa se superponen en gran medida con prácticas de DevOps, como la automatización, la colaboración, la mejora continua, la escalabilidad y la flexibilidad. Sin embargo, hay algunas que se tratan aquí debido a su importancia operativa. Estos aspectos incluyen:
- Operaciones continuas: tiene como objetivo crear y mantener un entorno en el que la necesidad de tiempo de inactividad se minimiza o incluso se elimina.
- Supervisión continua, observabilidad: destaca la importancia de supervisar aplicaciones y la infraestructura subyacente en tiempo real. El objetivo final es detectar de forma proactiva (en lugar de reactiva) cualquier problema inminente.
- Modelado de salud: implica la creación de modelos que representan el comportamiento esperado y el rendimiento de un sistema objetivo en diferentes condiciones. Esto sirve como línea base para detectar anomalías, lo que podría indicar posibles problemas.
- Ingeniería de confiabilidad: usa la ingeniería de caos y las prácticas de inyección de errores para aplicar medidas proactivas que conducen a un aumento de la resistencia.
- Administración de incidentes: se centra en una respuesta y resolución de incidentes eficaces, incluida la administración de incidentes bien definida, los canales de comunicación confiables, la corrección automatizada y el aprendizaje continuo para minimizar la posibilidad de problemas periódicos.
- Integración de seguridad: incorpora prácticas de seguridad en el ciclo de vida de las operaciones.
- Pruebas de desplazamiento a la derecha: usa prácticas como el lanzamiento oscuro o las marcas de características en el entorno de producción.