Gotowość na wystąpienie incydentu na platformie Microsoft Azure — pomoc techniczna Unified

Po zadeklarowaniu zdarzenia dotyczącego platformy Azure informujemy o aktualizacjach subskrypcje lub dzierżawy, których dotyczy problem, za pośrednictwem bloku Problemy z usługą w usłudze Azure Service Health (w ramach portalu Azure).

Przed zdarzeniem

Zalecamy wykonanie następujących instrukcji zapewniających gotowość i pomagających w ochronie Twojej organizacji:

Otrzymywanie powiadomienia i aktualizacji dotyczących incydentów mających wpływ na Twoje usługi platformy Azure

  1. Zapoznaj się z usługą Azure Service Health w portalu Azure — miejsce, do którego musisz się udać w przypadku wystąpienia problemów.

  2. Skonfiguruj alerty pulpitu Kondycji usługi w celu powiadamiania o wszelkich problemach — pocztą e-mail, wiadomością SMS, elementem webhook itp. na poziomie subskrypcji, według usług(i) i/lub według regionu(-ów).

    • Typ powiadomienia o problemach z usługą spowoduje wysłanie powiadomienie do Twojej organizacji o tym, że Twoje usługi są zagrożone przez zdarzenie dotyczące usługi.

    • Typ powiadomienia z poradami dotyczącymi zabezpieczeń będzie ostrzegał Twoją organizację o tym, że Twoje usługi są zagrożone incydentem dotyczącym zabezpieczeń lub prywatności.

    Poniżej przedstawiono podstawowe zalecenia dotyczące konfiguracji alertów:

    • W przypadku typów Problemy z usługą, Planowana konserwacja i Zalecenie dotyczące kondycji:

      • Obciążenia krytyczne — skonfiguruj alerty dla subskrypcji i usług, które obsługują krytyczne obciążenia.
      • Konfigurowanie alertów dla podstawowych usług w stosie platformy Azure:
        • Usługa „Infrastruktura sieciowa” — podstawowa warstwa w stosie platformy Azure, na której polegają wszystkie typy obciążeń i aplikacji od usług typu IaaS po usługi typu SaaS.
        • Usługa „Microsoft Azure Portal” — podstawowa usługa używana do zarządzania zasobami platformy Azure. Jej wszechstronność określa ją jako usługę typu „catch-all” (zawierającą wszystko), obejmującą różne scenariusze, środowiska podsumowania wpływu, które będą przekazywane w ramach tej usługi
    • W polu Porady dotyczące zabezpieczeń wpisz:

      • Wszystkie subskrypcje i usługi platformy Azure — zazwyczaj „złoczyńcy” obierają za cel mało używane zasoby, dlatego ważne jest, aby ten typ alertu obejmował wszystkie zasoby platformy Azure

    Ponadto rozwiązanie Azure Monitor Baseline Alerts zapewnia kompleksowe wskazówki i kod implementowania planu bazowego alertów platformy, a także alertów dotyczących kondycji usługi za pośrednictwem zasad i inicjatyw w środowiskach platformy Azure, z opcjami zautomatyzowanego lub ręcznego ich wdrażania.

  3. Upewnij się, że następujące role mają odpowiednie informacje kontaktowe, które są regularnie przeglądane, aby zachować ich aktualność. Aby uzyskać więcej informacji, zapoznaj się z artykułem Bądź na bieżąco z problemami z zabezpieczeniami platformy Azure — usługa Azure Service Health | portal Microsoft Learn)

    • Administrator subskrypcji i właściciel subskrypcji — kontakty, które będą używane do otrzymywania powiadomień (za pośrednictwem portalu Azure i/lub poczty e-mail, w zależności od wymagań dotyczących komunikacji) w przypadku problemów z zabezpieczeniami mających negatywny wpływ na poziomie subskrypcji.

    • Globalny administrator dzierżawy i osoba kontaktowa ds. technicznych — kontakty, które będą używane do otrzymywania powiadomień (za pośrednictwem portalu Azure i/lub poczty e-mail, w zależności od wymagań dotyczących komunikacji) w przypadku problemów z zabezpieczeniami mających negatywny wpływ na poziomie dzierżawy.

    • Administrator zabezpieczeń — może przeglądać i wprowadzać zmiany w zasadach zabezpieczeń, stosować zalecenia oraz wyświetlać i odrzucać alerty.

  4. Rozważ użycie alertów pulpitu Kondycja zasobu lub Zaplanowanych zdarzeń, aby być na bieżąco z problemami specyficznymi dla zasobów, aby osoby i systemy mogły być informowane o problemach związanych z zasobami i nadchodzących przerwach związanych z konserwacją.

Aby zrozumieć zasady komunikacji platformy Azure, zapoznaj się z artykułem Postęp w zakresie przerw w działaniu usług — automatyzacja, komunikacja i transparentność | Blog i aktualizacje platformy Azure | portal Microsoft Azure.

Zwiększ poziom zabezpieczeń i odporność, aby potencjalnie uniknąć lub zminimalizować negatywny wpływ incydentów

  1. Przejrzyj i zaimplementuj dobre rozwiązania dotyczące zabezpieczeń operacyjnych dotyczące ochrony danych, aplikacji i innych zasobów, zwłaszcza te:

    • Wymuś uwierzytelnianie wieloskładnikowe, aby złagodzić obawy dotyczące możliwego wystąpienia zdarzenia.

    • Implementuj alerty dla użytkowników wysokiego ryzyka. Skonfiguruj dostęp warunkowy, aby mieć pewność, że otrzymasz powiadomienie o „ryzykownym użytkowniku” w twoim środowisku.

    • Kontroluj przenoszenia subskrypcji z i do katalogów. W celu zapewnienia ładu administratorzy globalni mogą zezwalać lub zakazywać użytkownikom zmiany katalogów nieznanych im w organizacji. Dzięki temu Twoja organizacja ma pełny wgląd w subskrypcje używane w katalogach organizacji i uniemożliwia przenoszenie subskrypcji, które mogą przejść do nieznanego katalogu.

  2. Optymalizuj niezawodność krytycznych obciążeń, zabezpieczeń i nie tylko przy użyciu platformy Azure Well-Architected Framework (WAF) i przeglądnij ten zasób. Rozważ również te działania, aby uzupełnić swoją pracę w Zaporze aplikacji sieci Web.

    • Skorzystaj ze skoroszytu niezawodność zintegrowanego z portalem Azure w bloku usługi Azure Advisor, aby przejrzeć stan niezawodności użytkowanych aplikacji, ocenić ryzyko i zaplanować ulepszenia.

    • Rozszerz wdrożenia obciążeń/zasobów na różne regiony w celu zapewnienia ciągłości działania i odzyskiwania po awarii (BCDR). Użyj opublikowanej pełnej listy par regionów platformy Azure.

    • Rozszerz wdrożenia obciążeń/zasobów w regionie w Strefach dostępności.

    • Rozważ izolację maszyn wirtualnych na platformie Azure – usługa Azure Virtual Machines | portal Microsoft Learn dla obciążeń o krytycznym znaczeniu dla firmy

    • Rozważ użycie konfiguracje konserwacji, aby móc kontrolować aktualizacje i zarządzać nimi w przypadku wielu maszyn wirtualnych platformy Azure

    • Użyj usługi Azure Chaos Studio, aby ocenić bezpieczeństwo użytkowanych aplikacji platformy Azure. Poddaj aplikacje platformy Azure kontrolowanym błędom, rzeczywistym lub symulowanym, aby obserwować bezpieczeństwo aplikacji i ich reakcje na zakłócenia, takie jak opóźnienie sieci, awaria magazynu, wygasające wpisy tajne i awaria centrum danych.

    • Użyj skoroszytu wycofania usługi, który jest zintegrowany z witryną Azure Portal w bloku usługi Azure Advisor, jako widok pojedynczego scentralizowanego poziomu zasobów dla wycofywanych usług. Ułatwia to ocenę negatywnego wpływu, opcji i planowanie migracji z wycofywanych usług i funkcji.

Postępuj zgodnie z blogiem dotyczącym rozwijania niezawodności platformy Azure, aby być na bieżąco z działaniami platformy Azure dotyczącymi ciągłego wysiłku w zakresie bezpieczeństwa.

Podczas incydentu

Gdy zdarzenie ma wpływ na Twoje kluczowe subskrypcje, ważne jest, aby wiedzieć, gdzie i jak znaleźć odpowiednie komunikaty związaną z tym incydentem:

  1. Przejrzyj alerty usługi Azure Service Health w portalu Azure, aby uzyskać najnowsze aktualizacje od naszych inżynierów.

    • Należy pamiętać, że określone kontakty dla danej roli wymienione w rozdziale "przed incydentem" (tj. administrator subskrypcji / właściciel, osoba kontaktowa ds. technicznych/prywatności, administrator dzierżawy) mogą również otrzymywać powiadomienia e-mail dotyczące zdarzeń związanych z bezpieczeństwem lub prywatnością.
  2. Jeśli występują problemy z dostępem do portalu, sprawdź publiczną stronę stanu platformy Azure azure.status.microsoft, jako dodatkowe źródło.

  3. Jeśli kiedykolwiek wystąpią problemy ze stroną przedstawiającą Stan, sprawdź, czy są dostępne jakiekolwiek aktualizacje za pośrednictwem konta @AzureSupport w serwisie X (dawniej Twitter).

Dlaczego warto używać usługi Service Health zamiast publicznej strony stanu?

Wielu klientów sprawdza nasze publicznie dostępne strony stanu (na przykład azure.status.microsoft) przy pierwszych oznakach potencjalnych problemów, aby sprawdzić, czy istnieją znane problemy z naszymi usługami w chmurze. Te strony pokazują tylko powszechne problemy spełniające określone kryteria, a nie mniejsze zdarzenia, które mają wpływ na mniejszą liczbę klientów.

Usługa Azure Service Health (w ramach portalu Azure) wie, którymi subskrypcjami i dzierżawami zarządzasz, dlatego przedstawia znacznie dokładniejszy widok znanych problemów wpływających na Twoje zasoby. Umożliwia również skonfigurowanie alertów, aby można było otrzymywać powiadomienia automatycznie.

Kiedy warto otworzyć zgłoszenie o pomoc techniczną?

Jeśli zdarzenie usługi jest już widoczne za pośrednictwem usługi Service health, wszystkie najnowsze informacje zostaną podane tutaj i nie ma potrzeby otwierania wniosku o pomoc techniczną. Jeśli uważasz, że masz doświadczasz negatywnego wpływu zdarzenia usługi, ale nie widzisz problemu reprezentowanego na stronie Kondycja usługi, otwórz wniosek o pomoc techniczną.

Jeśli pewne pytania nie zostały uwzględnione w otrzymanych materiałach dotyczących problemów z zabezpieczeniami, otwórz wniosek o pomoc techniczną odwołujący się do identyfikatora śledzenia.

Po incydencie

  1. Przeczytaj artykuł Raport po incydencie (PIR) z okienka Historia kondycji usługi Azure Service Health (lub za pośrednictwem alertów usługi Service Health skonfigurowanych przez klienta), aby zrozumieć, czego się dowiedzieliśmy.

  2. W przypadku poważnych incydentów spełniających nasze publiczne kryteria Strony stanu dołącz do transmisji strumieniowej z Retrospektywą incydentu platformy Azure, aby uzyskać odpowiedzi na wszelkie pytania lub zobacz jego zarchiwizowaną transmisję.

  3. Jeśli uważasz, że możesz kwalifikować się do uzyskania środków na korzystanie z umowy SLA,utwórz nowy wniosek o pomoc techniczną z typem problemu „Żądanie zwrotu” — i dołącz identyfikator śledzenia incydentu.