Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ten artykuł pomaga ustanowić i utrzymać skuteczne operacje zarządzania infrastrukturą w chmurze platformy Azure. Pomyślne operacje w chmurze wymagają jasno zdefiniowanych obowiązków i procesów dla każdego obszaru zarządzania chmurą.
Identyfikowanie obowiązków związanych z zarządzaniem
Efektywne zarządzanie środowiskiem Azure obejmuje obowiązki na poziomie całej platformy oraz obowiązki dotyczące obciążeń. Obowiązki centralne wspierają całą infrastrukturę chmurową Azure. Odpowiedzialności związane z obciążeniem pracą koncentrują się na indywidualnym obciążeniu pracą. Użyj tabeli 1, aby uwzględnić istotne obowiązki związane z operacjami w chmurze.
Tabela 1. Podstawowe obowiązki związane z zarządzaniem chmurą
Obszary zarządzania chmurą | Obowiązki centralne | Obowiązki związane z obciążeniem |
---|---|---|
Zgodność | ▪ Definiowanie procedur operacyjnych. ▪ Wymuszanie zasad ładu. ▪ Monitoruj zgodność i koryguj lub eskaluj zgodnie z potrzebami. |
▪ Postępuj zgodnie z procedurami operacyjnymi. ▪ Dopasowanie projektu do zasad ładu. |
Bezpieczeństwo | ▪ Zarządzanie operacjami zabezpieczeń w całej organizacji. ▪ Zarządzanie tożsamościami w usłudze Microsoft Entra ID. ▪ Udzielanie dostępu do subskrypcji platformy Azure. ▪ Definiowanie i utrzymywanie punktów odniesienia zabezpieczeń za pośrednictwem usług Azure Policy i Microsoft Defender for Cloud. ▪ Nadzorowanie integracji ochrony przed zagrożeniami i reagowania na zdarzenia w usłudze Microsoft Sentinel. |
▪ Implementowanie bezpiecznego projektu obciążenia. ▪ Reaguj na alerty i zdarzenia dotyczące zabezpieczeń związane z obciążeniami. ▪ Ciągła ocena luk w zabezpieczeniach w pracy. |
Zarządzanie zasobami | ▪ Definiowanie i obsługa hierarchii zasobów. ▪ Utwórz subskrypcje obciążeń roboczych zgodnie z otrzymanymi żądaniami. ▪ Definiowanie strategii nazewnictwa i tagowania. ▪ Zdefiniuj topologię sieci. ▪ Konfigurowanie sieci udostępnionej (komunikacja równorzędna sieci wirtualnych, łączność lokalna). ▪ Zarządzanie między obciążeniami lub udostępnionymi zasobami/usługami. ▪ Monitorowanie limitów subskrypcji i obsługa żądań zwiększenia limitu przydziału. |
▪ Zarządzanie subskrypcjami specyficznymi dla obciążenia (jeśli są delegowane). ▪ Zarządzaj grupami zasobów i zasobami dla każdego obciążenia. ▪ Przestrzegaj standardów nazewnictwa i tagowania oraz stosowania ich. ▪ Zarządzanie wykorzystaniem zasobów na poziomie aplikacji, zapewniając, że zasoby pozostają w ramach limitów przydziału subskrypcji. |
Wdrożenie | ▪ Standaryzacja i zarządzanie potokami CI/CD i narzędziami (Azure DevOps, GitHub Actions). ▪ Zdefiniuj szablony infrastruktury referencyjnej jako kodu (szablony Bicep, Terraform, ARM). ▪ Zapewnianie centralnych najlepszych rozwiązań dotyczących zabezpieczeń potoku (skanowanie kodu, zarządzanie wpisami tajnymi). |
▪ Użyj centralnej struktury CI/CD i szablonów IaC na potrzeby wdrożeń obciążeń roboczych. ▪ Implementowanie zadań wdrażania specyficznych dla obciążenia (konfigurowanie ustawień aplikacji, bazy danych). ▪ Dostosowywanie szablonów referencyjnych do potrzeb związanych z obciążeniami przy jednoczesnym przestrzeganiu centralnych wytycznych. |
Rozwój | ▪ Zapewnianie i wymuszanie ustandaryzowanych łańcuchów narzędzi i struktur programistycznych w celu przyspieszenia spójności (standardy kodowania, najlepsze rozwiązania devOps). ▪ Obsługa repozytoriów wewnętrznych lub źródeł pakietów dla udostępnionych bibliotek lub modułów. |
▪ Adoptowanie i dostosowywanie standardowych łańcuchów narzędzi na potrzeby opracowywania zadań. ▪ Należy do cyklu życia aplikacji i uwzględnij najlepsze rozwiązania (testowanie jednostkowe, testowanie integracji). ▪ Zarządzanie ciągłym ulepszaniem bazy kodu obciążenia. |
Nadzorowanie | ▪ Planowanie strategii monitorowania. ▪ Alert dotyczący scentralizowanych obowiązków. ▪ Udostępnianie pulpitów nawigacyjnych dla typowych metryk operacyjnych w całym środowisku. |
▪ Monitorowanie obciążenia ▪ Rozszerzanie lub dostosowywanie alertów centralnych w celu przechwytywania warunków specyficznych dla obciążenia. ▪ Analizowanie i korygowanie incydentów na poziomie obciążenia na podstawie alertów i dzienników. |
Koszt | ▪ Przydzielanie budżetów chmury na poziomie globalnym lub subskrypcji ▪ Monitorowanie wydatków na chmurę w całej organizacji i tworzenie raportów kosztów. ▪ Przydziel koszty jednostkom biznesowym lub produktom, zazwyczaj przy użyciu tagów lub niestandardowych modeli alokacji kosztów. ▪ Zastosuj strategię tagowania na potrzeby alokacji kosztów. |
▪ Optymalizacja kosztów — projektowanie obciążeń ▪ Przestrzegaj ograniczeń budżetowych. |
Niezawodność | ▪ Definiowanie wymagań dotyczących niezawodności (SLO, RPO, RTO) na priorytet obciążenia. ▪ Podaj wskazówki dotyczące ciągłości działania i odzyskiwania po awarii (BCDR). ▪ Zarządzanie scentralizowanymi rozwiązaniami odzyskiwania po awarii . ▪ Obsługa zarządzania głównymi zdarzeniami we wszystkich obciążeniach. |
▪ Projektowanie obciążenia w celu spełnienia wymagań dotyczących niezawodności. |
Wydajność | ▪ Monitorowanie i utrzymywanie wydajności w scentralizowanych składnikach (sieć centralna, usługi wspólne). ▪ Podaj wytyczne dotyczące optymalizacji wydajności i planowania pojemności. ▪ Monitorowanie limitu przydziału |
▪ Projektowanie obciążenia pod kątem wydajności. |
Ustanawianie operacji w chmurze
Użyj obowiązków opisanych w tabeli 1 , aby utworzyć efektywną podstawę operacyjną. Jasno zdefiniuj zespoły, standardy i procesy, wykonując następujące kroki:
Zdefiniuj model operacji w chmurze. Wybierz scentralizowany lub współużytkowany model zarządzania na podstawie rozmiaru i dojrzałości organizacji, opisanego w poniższej tabeli:
Podejście do operacji Obowiązki i zakres Najlepsze dla Zalety Minusy Scentralizowany Jeden zespół zarządza wszystkimi zadaniami. Startupy lub niewielka obecność w chmurze. Upraszcza zarządzanie chmurą. Ryzyko związane z tworzeniem wąskich gardeł. Wspólne zarządzanie Oddzielne zespoły centralne (platformy) i zespoły odpowiedzialne za obciążenia Organizacje z różnymi obciążeniami. Równoważy zarządzanie i elastyczność. Wymaga jasnego przypisania odpowiedzialności Ustanów centralne obowiązki. Utwórz dedykowany zespół do obsługi zadań zarządzania centralnego. Opracuj macierz umiejętności z tabeli 1 , aby zidentyfikować wymaganą wiedzę.
Ustanów obowiązki związane z obciążeniem. Skonfiguruj wyspecjalizowane zespoły na potrzeby zadań specyficznych dla obciążeń. Zidentyfikuj obowiązki przy użyciu tabeli 1 , a następnie odpowiednio zwerbuj.
Przeprowadzanie przeglądu usługi Azure Well-Architected. Użyj narzędzia do ocenyWell-Architected , aby ponownie ocenić każde obciążenie podczas opracowywania i testowania zmian projektu.
Użyj platformy Azure Well-Architected Framework. Skorzystaj z filaru doskonałości operacyjnej , aby kierować się obowiązkami w zakresie zarządzania obciążeniami.
Przypisz odpowiedzialność. Nazwij określonych właścicieli wszystkich obowiązków związanych z zarządzaniem chmurą. W modelu współzarządzania zespoły robocze powinny mieć autonomię w zarządzaniu swoimi subskrypcjami.
Dokumentowanie operacji w chmurze
Jasno udokumentować operacje w chmurze, aby umożliwić wydajną reakcję kryzysową i bezproblemową implementację zmian. Ustanów nadrzędne procedury i utwórz szczegółowe przewodniki dotyczące częstych i określonych zadań.
Dokumentowanie procedur operacyjnych
Zdefiniuj procedury operacyjne dotyczące zarządzania zmianami, odzyskiwaniem po awarii i rutynowymi zadaniami konserwacji, które nie mogą obsłużyć automatyzacji. Wykonaj te kroki:
Definiowanie procedur zarządzania zmianami. Zmiana jest główną przyczyną awarii w chmurze. Opracuj ustandaryzowany proces zarządzania zmianami, aby uniknąć błędów w środowisku chmury. Zobacz Zarządzanie zmianami.
Definiowanie procedur wdrażania (zarządzanie wydaniami). Aby zachować spójną konfigurację, standaryzację wdrożeń, wydań i promocji środowiska. Zobacz Zarządzanie wdrożeniami.
Zdefiniuj procedury odzyskiwania po awarii i ciągłości działania. Aby obsłużyć potencjalne awarie, przygotuj standardowy plan odpowiedzi. Zobacz Zarządzanie odzyskiwaniem po awarii i ciągłością działalności biznesowej.
Zdefiniuj dodatkowe procedury. Dokumentowanie procesów zarządzania żądaniami obsługi, stosowaniem poprawek i zarządzaniem konfiguracją. Jasno udokumentować te procesy, aby upewnić się, że uczestnicy projektu wiedzą, jak zainicjować lub ukończyć każde zadanie.
Dokumentowanie przewodników operacyjnych
Utwórz szczegółowe przewodniki krok po kroku (runbooki lub playbooki) dla kluczowych zadań operacyjnych. To przygotowanie zapewnia spójne wykonywanie, poprawia wydajność i skraca czas rozwiązywania problemów podczas krytycznych zdarzeń.
Zdefiniuj codzienne zadania. Przygotuj podręczniki obejmujące codzienne obowiązki, takie jak żądania eskalacji uprawnień i przeglądy dzienników. Ustanów standardowe procedury operacyjne (SOP) na potrzeby monitorowania metryk, progów alertów i pulpitów nawigacyjnych dla każdego systemu.
Utwórz bibliotekę runbooków skupionych na Azure. Tworzenie runbooków specyficznych dla platformy Azure, które dotyczą takich scenariuszy, jak:
Scenariusz Przykład Wysokie użycie procesora Zarządzanie skalowaniem w górę w usłudze Azure App Service Przełączenie awaryjne i powrót po awarii Przechodzenie w tryb failover i powrót po awarii w usłudze Azure Site Recovery Wdrożenia niebieskie/zielone Niebieskie/zielone wdrożenie w usłudze Azure Front Door Przywracanie kopii zapasowej Przywracanie kopii zapasowej w usłudze Azure Blob Storage i usłudze Azure Cosmos DB Przechowuj te runbooki w centralnym repozytorium. Utrzymuj runbooki w centralnym repozytorium, które są dostępne dla dyżurujących inżynierów do natychmiastowego użycia w trakcie incydentów.
Zaimplementuj operacje programowo. Zintegruj infrastrukturę jako kod z runbookami, aby spójnie i dokładnie wdrażać typowe zasoby za każdym razem.
Przejrzyj i zaktualizuj. Okresowo przejrzyj i popraw dokumentację, aby odzwierciedlić korekty operacyjne i aktualizacje usług w chmurze.
Narzędzia i rozwiązania dokumentów
Jasna dokumentacja zapewnia spójność, zmniejsza ryzyko operacyjne i zwiększa wydajność zespołu. Tworzenie i obsługa kompleksowej dokumentacji narzędzi w chmurze. Regularnie aktualizuj dokumentację, aby odzwierciedlać bieżące rozwiązania i zapewnić łatwy dostęp dla wszystkich członków zespołu.
Obszar | Przykładowe korzyści |
---|---|
Integracja | Standaryzacja upraszcza integrację, konsolidując dzienniki i repozytoria kodu. |
Automatyzacja | Ponowne używanie szablonów IaC w zespołach, skryptach automatyzacji i najlepszych praktykach w projektach. |
Zarządzanie zdarzeniami | Przechwytywanie problemów i generowanie działań naprawczych, które integrują się z cyklami wydawniczymi. |
Zarządzanie operacjami w chmurze
Efektywne zarządzanie chmurą optymalizuje wydajność operacyjną, zmniejsza przestoje i wyjaśnia role i obowiązki. Ustandaryzuj operacje w chmurze dzięki automatyzacji i ustrukturyzowanym procesom wsparcia. Postępuj zgodnie z następującymi wytycznymi operacyjnymi:
Zapewnij ciągłe wsparcie w chmurze. Ustanów zakres wsparcia technicznego 24/7 za pośrednictwem globalnych zespołów przyjmujących model follow-the-sun lub ustrukturyzowane dyżury. Jasno zdefiniuj obowiązki w celu zapewnienia terminowej reakcji i rozwiązania krytycznych zdarzeń. Skonfiguruj automatyczne alerty w celu natychmiastowego powiadamiania wyznaczonego personelu pomocy technicznej.
Automatyzowanie powtarzalnej pracy. Korzystanie z możliwości automatyzacji platformy Azure w celu zminimalizowania ręcznych procesów i zmniejszenia obciążenia operacyjnego. Automatyzuj rutynowe działania, aby wyeliminować błędy, usprawnić przepływy pracy i umożliwić zespołom skoncentrowanie się na strategicznych priorytetach.
Przypadek użycia Przykłady Automatyzacja Automatyzowanie przepływów pracy w usłudze Azure Boards lub systemie ITSM. Szablony elementów roboczych "Żądanie zmiany" i "Zdarzenie". Reagowanie na zdarzenia Aby automatycznie generować zgłoszenia incydentów z wypełnionymi standardowymi polami, zintegruj Azure Monitor i Azure Service Health z systemem zgłoszeń. Zarządzanie zmianami Użyj usługi Azure Logic Apps , aby automatycznie aprowizować zmiany niskiego ryzyka lub autoremediatować niektóre zdarzenia. Zgodność Użyj usługi Azure Policy, aby wymusić i monitorować zgodność z chmurą. Bezpieczeństwo Użyj usługi Microsoft Defender for Cloud i Microsoft Sentinel, aby zautomatyzować wykrywanie i reagowanie na zagrożenia bezpieczeństwa. Użyj usługi Microsoft Entra ID Governance, aby przejrzeć uprawnienia i zautomatyzować zarządzanie uprawnieniami.
Ulepszanie operacji
Zoptymalizuj środowisko chmury platformy Azure, promując ciągłe ulepszanie. Regularnie oceniaj operacje i ustalaj priorytety bieżących szkoleń i opinii. Wykonaj te kroki:
Przejrzyj operacje, aby ulepszyć. Postępuj zgodnie z najlepszymi rozwiązaniami, aby monitorować kondycję, zgodność, zabezpieczenia, koszty, dane i zasoby w chmurze. Przeprowadzanie cotygodniowych przeglądów operacyjnych w celu omówienia kluczowych metryk, ostatnich zdarzeń, wdrożonych zmian i przewidywanych zagrożeń. Aktywnie rozwiązywać rozrastanie zasobów i dług techniczny.
Trenowanie pod kątem operacji. Wspieranie ciągłego rozwoju umiejętności przez nadania priorytetów podstawowym zasobom edukacyjnym. Obsługa dynamicznych operacji w chmurze za pomocą praktycznych środowisk szkoleniowych. Poniższa tabela zawiera zasoby na potrzeby trenowania operacji.
Szkolenie z zakresu operacji Opis Pobieranie poświadczeń Ustaw cele dla poświadczeń firmy Microsoft, takich jak zastosowane umiejętności i certyfikaty firmy Microsoft, aby budować wiedzę. Korzystanie z zasobów operacyjnych Zobacz Zasoby zarządzania platformą Azure. Korzystanie z dokumentacji produktu Skorzystaj z usługi Microsoft Learn , aby znaleźć wskazówki dotyczące usług platformy Azure. Zajmij się praktycznymi ćwiczeniami Zachęcaj do praktycznej nauki w nieprodukcyjnych środowiskach piaskownicy.
Zasoby zarządzania platformą Azure
Kategoria | Zasób zarządzania | Opis |
---|---|---|
Zgodność | Rządzenie CAF | Struktura zarządzania chmurą firmy Microsoft |
Bezpieczeństwo | Zarządzanie operacjami zabezpieczeń | Wskazówki dotyczące zarządzania operacjami zabezpieczeń |
Bezpieczeństwo | Narzędzie zabezpieczeń firmy Microsoft | Lista narzędzi zabezpieczeń firmy Microsoft i platformy Azure |
Bezpieczeństwo | Zabezpieczenia obciążeń | Wskazówki dotyczące obciążenia pracą w zakresie bezpieczeństwa |
Zarządzanie zasobami | Strategia nazewnictwa i tagowania | Zalecenia dotyczące nazewnictwa i tagowania do zarządzania zasobami |
Zarządzanie zasobami | Skrót platformy Azure | Lista skrótów zasobów platformy Azure |
Zarządzanie zasobami | Azure Advisor | Asystent cyfrowy zgodny z najlepszymi praktykami dla platformy Azure. |
Zarządzanie zasobami | Reguły nazewnictwa platformy Azure | Reguły nazewnictwa dla wszystkich zasobów platformy Azure |
Zarządzanie zasobami | Przewodniki dotyczące usług platformy Azure | Wskazówki dotyczące decyzji dotyczących konfiguracji usługi |
Rozwój | Tworzenie oprogramowania do zarządzania obciążeniami | Wskazówki dotyczące obciążeń na potrzeby tworzenia oprogramowania |
Rozwój | Centrum Architektury Azure | Architektury i przewodniki dla różnych przypadków użycia |
Rozwój | Centrum zasobów dla deweloperów | Centrum narzędzi i zasobów dla deweloperów |
Wdrożenie | Szablony Bicep, Terraform i ARM | Szablony IaC dla każdego zasobu platformy Azure |
Wdrożenie | Pary regionów platformy Azure | Lista sparowanych regionów platformy Azure |
Wdrożenie | Katalog usług Azure Cloud Services | Katalog wszystkich usług platformy Azure |
Wdrożenie | Wdrażanie obciążeń | Wskazówki dotyczące obciążenia na potrzeby ciągłej integracji |
Nadzorowanie | Monitoruj swój majątek w chmurze Azure | Kompleksowe wskazówki dotyczące monitorowania platformy Azure |
Nadzorowanie | Monitorowanie obciążenia | Wskazówki dotyczące obciążenia do monitorowania |
Koszt | Zarządzanie kosztami | Wskazówki dotyczące zarządzania kosztami |
Koszt | Optymalizacja kosztów obciążeń | Wskazówki dotyczące obciążenia pracą w celu optymalizacji kosztów |
Niezawodność | Zarządzanie niezawodnością danych | Wskazówki dotyczące utrzymania niezawodności danych |
Niezawodność | Zarządzanie niezawodnością zasobów w chmurze | Wskazówki dotyczące utrzymania niezawodności zasobów |
Niezawodność | Zarządzanie zdarzeniami zabezpieczeń | Zalecenia dotyczące reagowania na zdarzenia związane z bezpieczeństwem |
Wydajność | Wydajność obciążenia | Wskazówki dotyczące efektywnej wydajności przy obciążeniu |