Compartir a través de


Lista de comprobación de revisión de diseño para confiabilidad

Esta lista de comprobación presenta un conjunto de recomendaciones que puede usar para evaluar las estrategias de confiabilidad, resistencia y recuperación de errores en el diseño de la arquitectura. Para garantizar la confiabilidad, identifique la mejor infraestructura y diseño de aplicaciones para la carga de trabajo. Tome estas decisiones en función de los requisitos empresariales que se asignan a las métricas de destino de disponibilidad y capacidad de recuperación.

Para implementar un diseño confiable, considere exhaustivamente los puntos de decisión del diseño y tenga en cuenta cómo afectan esas decisiones a la carga de trabajo. Esta lista de comprobación y las guías complementarias proporcionan recursos para ayudarle a tomar esas decisiones. Convierta la confiabilidad de la carga de trabajo en una consideración central durante el diseño, el desarrollo y el ciclo de vida de las operaciones de la carga de trabajo.

Lista de verificación

Enfoque del diseño con un enfoque en la confiabilidad para ayudar a garantizar que diseñe una carga de trabajo resistente, manejable y repetible. Si no incluye prácticas de confiabilidad y tiene en cuenta las ventajas, el diseño podría correr el riesgo. Considere cuidadosamente todos los puntos descritos en la lista de comprobación para infundir confianza en el éxito de su sistema.

  Código Recomendación
RE:01 Céntrese en el diseño de la carga de trabajo en la simplicidad y la eficacia. Use un enfoque práctico para evitar la complejidad innecesaria al cumplir los objetivos y requisitos empresariales.
RE:02 Identificar y evaluar los flujos de usuario y del sistema. Use una escala de importancia en función de los requisitos empresariales para priorizar los flujos.
RE:03 Use el análisis del modo de error (FMA) para identificar posibles errores en la carga de trabajo. Identifique las dependencias y los puntos de error y desarrolle estrategias de mitigación para esos errores.
RE:04 Defina objetivos de confiabilidad y recuperación para la carga de trabajo. Use los destinos para informar al diseño y como base del modelo de mantenimiento.
RE:05
RE:05
RE:05
Agregue redundancia en distintos niveles, especialmente para flujos críticos, para ayudar a satisfacer los objetivos de confiabilidad. Considere la posibilidad de tener en cuenta los componentes de infraestructura redundantes, como el proceso y la red, y varias instancias de la solución.
RE:06 Implemente una estrategia de escalado oportuna y confiable en los niveles de aplicación, datos e infraestructura. Base la estrategia de escalado en patrones de uso reales o previstos y minimice la intervención manual.
RE:07 Reforzar la resistencia de la carga de trabajo mediante la implementación de medidas de autoconservación y recuperación automática. Use características integradas y patrones de nube bien establecidos para ayudar a la carga de trabajo a permanecer funcional durante los incidentes y recuperarse de los incidentes.
RE:08 Pruebe los escenarios de resistencia y disponibilidad aplicando los principios de ingeniería de caos. Asegúrese de que las estrategias de implementación y escalado de degradación correcta son eficaces mediante la realización de un mal funcionamiento activo y pruebas de carga simuladas.
RE:09 Implemente planes estructurados, probados y documentados de continuidad empresarial y recuperación ante desastres (BCDR) que se alinean con los objetivos de recuperación. Los planes deben cubrir todos los componentes y el sistema en su conjunto.
OBJETO 10 Mida y modele las señales de mantenimiento de la solución. Capture continuamente el tiempo de actividad y otros datos de fiabilidad de toda la carga de trabajo y también de componentes individuales y flujos clave.

Pasos siguientes

Se recomienda revisar los inconvenientes de confiabilidad para explorar otros conceptos.