Lista de comprobación de revisión de diseño para la excelencia operativa

Esta lista de comprobación presenta un conjunto de recomendaciones que le ayudarán a crear una cultura de excelencia operativa. Comience con un enfoque de DevOps para integrar especializaciones de varias materias. Este enfoque crea un diseño riguroso y una práctica de desarrollo. Este enfoque conduce a implementaciones repetibles, confiables y seguras de infraestructura y código.

Priorice la intervención humana en áreas que se beneficien de ella e incorporen la automatización en otras áreas. La observabilidad sirve de excelencia operativa mediante la supervisión de eventos de mantenimiento y también para validar el diseño y la implementación actuales de la carga de trabajo para informar sobre el desarrollo futuro de productos.

Si no tiene en cuenta las ventajas y recomendaciones para la excelencia operativa, la carga de trabajo podría estar en riesgo. Considere detenidamente los puntos descritos en la siguiente lista de comprobación para infundir confianza en el éxito del diseño.

Lista de comprobación

  Código Recomendación
OE:01 Determine las especializaciones de los miembros del equipo de carga de trabajo e intégrelas en un sólido conjunto de prácticas para diseñar, desarrollar, implementar y operar la carga de trabajo en especificaciones. Los miembros del equipo deben tener claridad en la toma de decisiones y las responsabilidades, la mejora continua y la optimización, y adoptar una cultura sin culpa que incorpore el aprendizaje continuo.
OE:02 Formalice la forma de ejecutar tareas operativas de rutina, según sea necesario y de emergencia , mediante documentación, listas de comprobación o automatización. Esfuércese por la coherencia y la previsibilidad de los procesos de equipo y las entregas mediante la adopción de procedimientos y enfoques líderes del sector, como un enfoque de desplazamiento a la izquierda .
OE:03 Formalizar procesos de planificación y ideación de software. A partir de estándares establecidos del sector y de la organización. Use un trabajo pendiente común, con prioridad y especificaciones suficientemente detalladas. En función de los resultados, impulse las mejoras continuas en el proceso de planeamiento.
OE:04
OE:04
OE:04
Optimice el desarrollo de software y los procesos de control de calidad siguiendo las prácticas probadas por el sector para el desarrollo y las pruebas. Para una designación de roles inequívoca, normalice las prácticas entre componentes, como herramientas, control de código fuente, patrones de diseño de aplicaciones, documentación y guías de estilo.
OE:05 Prepare los recursos y sus configuraciones mediante un enfoque estandarizado de infraestructura como código (IaC). Al igual que otro código, diseñe IaC con estilos coherentes, modularización adecuada y control de calidad. Prefiere un enfoque declarativo cuando sea posible.
OE:06 Cree una cadena de suministro de carga de trabajo que impulse los cambios propuestos a través de canalizaciones predecibles y automatizadas. Las canalizaciones prueban y promueven esos cambios entre entornos. Optimice una cadena de suministro para que la carga de trabajo sea confiable, segura, rentable y eficaz.
OE:07
OE:07
Diseñe e implemente un sistema de supervisión para validar las opciones de diseño e informar sobre el diseño futuro y las decisiones empresariales. Este sistema captura y expone la telemetría operativa, las métricas y los registros que emiten desde la infraestructura y el código de la carga de trabajo.
OE:08 Desarrollar una práctica eficaz de operaciones de emergencia. Asegúrese de que la carga de trabajo emite señales de estado significativas en toda la infraestructura y el código. Recopile los datos resultantes y úselo para generar alertas accionables que apliquen respuestas de emergencia a través de paneles y consultas. Defina claramente responsabilidades humanas, como rotaciones de llamadas, administración de incidentes, acceso a recursos de emergencia y ejecución de postmortems.
OE:09 Automatizar todas las tareas que no se benefician de la información y la adaptabilidad de la intervención humana, son muy procedimentales y tienen una vida útil que produce un retorno de la inversión en automatización. Cuando sea posible, elija software listo para usar para la automatización frente a implementaciones personalizadas. Trate toda la automatización igual que los componentes de carga de trabajo y aplique los pilares de Well-Architected Framework a su diseño e implementación.
OE:10 Diseñe e implemente la automatización por adelantado para operaciones como problemas de ciclo de vida, arranque y aplicación de barreras de gobernanza y cumplimiento. No intentes actualizar la automatización más adelante. Elija las características de automatización que proporciona la plataforma.
OE:11 Defina claramente los procedimientos de implementación seguros de la carga de trabajo. Resalte los ideales de métodos de liberación pequeños, incrementales y de calidad. Use patrones de implementación modernos y técnicas de exposición progresivas para controlar el riesgo. Tenga en cuenta las implementaciones rutinarias y las implementaciones de emergencia, o revisiones.
OE:12 Implemente una estrategia de mitigación de errores de implementación que solucione problemas inesperados de implementación intermedia con una recuperación rápida. Combine varios enfoques, como la reversión, la deshabilitación de características o el uso de las funcionalidades nativas del patrón de implementación.

Pasos siguientes

Se recomienda revisar los inconvenientes de excelencia operativa para explorar otros conceptos.