Compartilhar via


Prontidão para incidentes do Microsoft Azure – Unificada

Quando um incidente do Azure é declarado, comunicamos atualizações para assinaturas ou locatários afetados por meio da folha Problemas de Serviço na Integridade do Serviço do Azure (no portal do Azure).

Antes de um incidente

Recomendamos que as seguintes etapas sejam preparadas e ajudem a proteger sua organização:

Seja notificado e mantenha-se atualizado para incidentes que afetam seus serviços do Azure

  1. Familiarize-se com a Integridade do Serviço do Azure no portal do Azure – seu local de "acesso" em caso de problemas.

  2. Configure alertas de alertas da Integridade do Serviço para notificá-lo sobre quaisquer problemas – por email, SMS, webhook etc. no nível da assinatura, por serviço(s) e/ou por região(ões).

    • O tipo de notificação de problemas de serviço alertará sua organização de que seus recursos são afetados por incidentes de serviço.

    • O tipo de notificação de aviso de segurança alertará sua organização de que seus serviços são afetados por um incidente de segurança ou incidente de privacidade.

    Aqui estão as recomendações de configuração de alerta fundamental:

    • Para tipos de problemas de serviço, consultoria de integridade de manutenção planejada:

      • Suas cargas de trabalho críticas – alertas de instalação para seu(s) serviço(s) de assinatura(s) que alimenta(m) sua(s) carga(s) de trabalho crítica(s).
      • Configurar alertas para serviços básicos na pilha do Azure:
        • Serviço "Infraestrutura de Rede" – camada fundamental na pilha do Azure na qual todos os tipos de cargas de trabalho aplicativos de IaaS para SaaS dependem.
        • Serviço "Portal do Microsoft Azure" – serviço fundamental usado para gerenciar Azure Resources. Sua versatilidade o posiciona como um serviço "catch-all", abrangendo uma variedade de cenários, impactando experiências de resumo que serão comunicadas sob esse serviço.
    • Para o tipo de Avisos de Segurança:

      • All Azure Todas as assinaturas e serviços do Azure – normalmente maus atores têm como destino recursos menos usados, por isso é importante que esse tipo de alerta cubra todos os Azure Resources

    Além disso, a solução Alertas de Linha de Base do Azure Monitor fornece diretrizes e códigos abrangentes para implementar uma linha de base de alertas de plataforma, bem como alerta de integridade do serviço por meio de políticas e iniciativas em ambientes do Azure, com opções para implantação automatizada ou manual.

  3. Verifique se as funções a seguir têm as informações de contato certas e são revisadas regularmente para permanecerem atuais. Para obter mais informações, examine Permanecer informado sobre problemas de segurança do Azure – Integridade do Serviço do Azure | Microsoft Learn)

    • Administrador de Assinatura e Proprietário de Assinatura – contatos que serão usados para receber notificações (por meio do Portal do Azure e/ou email, dependendo dos requisitos de comunicação) para problemas de segurança que afetam o nível da assinatura.

    • Locatário Global Administração e Contato Técnico – contatos que serão usados para receber notificações (por meio do Portal do Azure e/ou email, dependendo dos requisitos de comunicação) para problemas de segurança que afetam o nível do locatário.

    • Administrador de segurança – pode examinar e fazer alterações na política de segurança, aplicar recomendações e exibir e descartar alertas.

  4. Considere usar Alertas de Integridade ou Eventos Agendados para se manter informado sobre problemas específicos do recurso para que suas pessoas e sistemas possam ser informados sobre problemas específicos e eventos de manutenção futuros.

Para entender os princípios de comunicação do Azure, examine o Avanço da experiência de interrupção — automação, comunicação e transparência | Blog do Azure e Atualizações | Microsoft Azure.

Aumentar sua postura de segurança e resiliência para potencialmente evitar ou minimizar o impacto de incidentes

  1. Examine e implemente as Melhores Práticas de Segurança Operacional para proteger seus dados, aplicativos e outros ativos, especialmente estes:

    • Impor a Autenticação Multifator para aliviar as preocupações com a exposição.

    • Implemente alertas para usuários de alto risco. Configure o acesso condicional para garantir que você seja notificado quando houver um "usuário arriscado" em seu ambiente.

    • Controle a movimentação de assinaturas de e para diretórios. Para fins de governança, os administradores globais podem permitir ou impedir que usuários de diretório alterem os diretórios desconhecidos em sua organização. Isso garante que sua organização tenha visibilidade total das assinaturas que são usadas nos diretórios da sua organização e impede a movimentação de assinaturas que possam ir para um diretório desconhecido.

  2. Otimize a confiabilidade crítica da carga de trabalho, a segurança mais usando o WAF (Azure Well-Architected Framework) e a Revisão. Considere também essas ações para complementar o trabalho no WAF.

    • Aproveite a pasta de trabalho Confiabilidade, que está integrada ao portal do Azure na folha do Assistente do Azure, para examinar a postura de confiabilidade de seus aplicativos, avaliar riscos e planejar melhorias.

    • Expanda a carga de trabalho/implantações entre regiões para a continuidade dos negócios e a recuperação de desastres (BCDR). Use a lista completa publicada de pares da região do Azure.

    • Expanda a carga de trabalho / implantações em uma região entre Zonas de Disponibilidade.

    • Considere Isolamento para VMs no Azure – Máquinas Virtuais do Azure | Microsoft Learn para cargas de trabalho críticas aos negócios.

    • Considere configurações de manutenção para a capacidade de controlar e gerenciar atualizações para muitas máquinas virtuais do Azure

    • Use o Azure Chaos Studio para avaliar a resiliência dos aplicativos do Azure. Envie seus aplicativos do Azure a falhas controladas, reais ou simuladas, para observar a resiliência do aplicativo e a resposta a interrupções como latência de rede, interrupção de armazenamento, segredos expirados e interrupção do datacenter.

    • Utilize a Pasta de Trabalho de Aposentadoria do Serviço, que está integrada no portal do Azure na folha do Assistente do Azure, como a exibição de nível de recurso centralizado único das desativações de serviço. Isso ajuda você a avaliar o impacto, avaliar as opções e planejar a migração dos serviços e recursos desativados.

Siga o Blog de Confiabilidade avançado do Azure para manter-se atualizado com os esforços do Azure em esforços contínuos de resiliência.

Durante um incidente

Quando suas principais assinaturas são afetadas por um incidente, é importante que você saiba onde e como encontrar as comunicações relevantes em torno deste incidente:

  1. Examine os alertas da Integridade do Serviço do Azure no portal do Azure para obter as atualizações mais recentes de nossos engenheiros.

    • É importante observar que contatos de função específicos mencionados na seção "antes de um incidente" (ou seja, administrador/proprietário da assinatura, contato técnico/privacidade, administrador de locatário) também podem obter notificações por email para incidentes de segurança ou privacidade.
  2. Se houver problemas ao acessar o portal, veifique a página pública do status do Azure azure.status. microsoft como backup.

  3. Se houver problemas com a página Status, marque para quaisquer atualizações por meio de @AzureSupport no "X" (anteriormente Twitter).

Por que usar a Integridade do Serviço em vez da página pública de Status?

Muitos clientes marcam nossas páginas de status de acesso público (como azure.status. microsoft) nos primeiros sinais de possíveis problemas, para ver se há problemas conhecidos com nossos serviços de nuvem. Essas páginas só mostram problemas generalizados que atendem a determinados critérios, não incidentes menores que afetam menos clientes.

A Integridade do Serviço do Azure (dentro do portal do Azure) sabe quais assinaturas e locatários você gerencia, portanto, mostra uma visão muito mais precisa de quaisquer problemas conhecidos que afetam sua interrupção. Também é permitida a configuração de alertas para que você possa ser notificado automaticamente.

Quando é útil abrir um caso de suporte?

Se o incidente de serviço já estiver sendo comunicado por meio da Integridade do serviço, todas as informações mais recentes serão fornecidas aqui e não haverá necessidade de abrir uma solicitação de suporte. Se você acredita que foi afetado por um incidente de serviço, mas não vê o problema representado na página Integridade do serviço, abra uma solicitação de suporte.

Se houver perguntas não abordadas pelos materiais de problema de segurança recebidos, abra uma solicitação de suporte fazendo referência à ID de rastreamento.

Após um incidente

  1. Leia o PIR (Post Incident Review) no painel Histórico de integridade do Azure Service Health (ou por meio de alertas de Integridade do Serviço configurados pelo cliente) para entender o que aprendemos.

  2. Para incidentes importantes que atenderam aos critérios da página Status público, junte-se a um livestream da Retrospectiva de Incidentes do Azure para obter respostas a perguntas ou veja a gravação.

  3. Se você achar que pode ser qualificado para um crédito SLA, crie uma nova solicitação de suporte com um tipo de problema de "Solicitação de Reembolso" e inclua o ID de rastreamento de incidentes.