Partilhar via


Princípios de design de fiabilidade

Uma carga de trabalho confiável deve ser resiliente para que possa detetar e se recuperar de interrupções e avarias e fornecer funcionalidade de forma consistente. Deve ser capaz de recuperar de avarias num prazo razoável. Deve igualmente estar disponível para que os utilizadores possam aceder de forma coerente e fiável à carga de trabalho durante o período de tempo acordado e ao nível de qualidade acordado.

Use os seguintes princípios de design do Microsoft Azure Well-Architected Framework para ajudar a garantir a confiabilidade durante todo o ciclo de vida. Comece com as melhores práticas recomendadas e justifique os benefícios de cada princípio de confiabilidade. Depois de definir sua estratégia, use a lista de verificação de confiabilidade como sua próxima etapa.

Se você não aplicar esses princípios ao seu design, a carga de trabalho provavelmente não estará preparada para antecipar ou lidar com problemas na produção. O resultado pode ser a interrupção de serviços que conduz a perdas financeiras. No caso de cargas de trabalho críticas, a não aplicação destes princípios pode pôr em risco a segurança.

Estruturar para os requisitos de negócio

Ícone ObjetivoColete e compreenda as necessidades de negócios com foco no uso esperado da carga de trabalho.

Os requisitos devem incluir a experiência do usuário, fluxos de trabalho, dados e recursos específicos da carga de trabalho. Os objetivos devem ser realistas e acordados com todas as partes interessadas, com base num determinado orçamento. Os requisitos devem definir claramente as expectativas com a equipa e as partes interessadas. Documente os requisitos para orientar as escolhas, implementações e operações tecnológicas.

Saiba mais sobre como projetar para requisitos de negócios no Azure Well-Architected Framework.

Estruturar para a resiliência

Ícone ObjetivoA carga de trabalho deve responder a falhas e continuar a operar com funcionalidade total ou reduzida.

Projete sua carga de trabalho para poder identificar falhas e interrupções de componentes. Torne o sistema resiliente para que possa tolerar falhas e lidar com elas sem problemas. Informe os usuários sobre o estado do sistema e defina as expectativas de quais componentes não estão disponíveis e quanto tempo a recuperação esperada levará.

Saiba mais sobre como projetar para resiliência no Azure Well-Architected Framework.

Estruturar para a recuperação

Ícone ObjetivoA carga de trabalho deve ser capaz de se recuperar de falhas com o mínimo de interrupção na experiência do usuário e nos objetivos de negócios.

Implementar planos de recuperação estruturados, testados e documentados que levem a uma recuperação rápida. Certifique-se de que suas equipes de suporte e operações tenham acesso a esses planos e que os exercícios de recuperação sejam realizados com frequência para evitar confusão e caos durante uma interrupção real.

Saiba mais sobre design para recuperação no Azure Well-Architected Framework.

Estruturar para a operações

Ícone ObjetivoA carga de trabalho deve ser observável e as equipes de desenvolvimento devem ser capazes de aprender com as falhas.

Crie o monitoramento em sua carga de trabalho para que as equipes de desenvolvimento e suporte tenham dados suficientes para analisar quando, por que e qual componente está falhando. Crie alertas significativos para notificar as equipes de suporte em caso de falha. Use análises e insights para impulsionar melhorias.

Saiba mais sobre como projetar para operações no Azure Well-Architected Framework.

Simplificar

Ícone ObjetivoEvite a engenharia excessiva do projeto de arquitetura, do código do aplicativo e das operações.

Concentre-se nos requisitos de negócios e remova recursos e componentes que não são necessários. Estabeleça padrões para desenvolvimento e implantação que aumentem a consistência. Aproveite os recursos fornecidos pela plataforma e os ativos pré-criados para minimizar o tempo de desenvolvimento.

Saiba mais sobre como mantê-lo simples no Azure Well-Architected Framework.

Próximos passos