Operacje obciążeń w zarządzaniu chmurą
Niektóre obciążenia mają kluczowe znaczenie dla sukcesu firmy. W przypadku tych obciążeń punkt odniesienia zarządzania jest niewystarczający do spełnienia wymaganych zobowiązań biznesowych związanych z zarządzaniem chmurą. Operacje platformy mogą nawet nie być wystarczające do spełnienia zobowiązań biznesowych. Ten bardzo ważny podzbiór obciążeń wymaga wyspecjalizowanego skupienia się na sposobie działania obciążenia i jego obsługi.
W zamian inwestycje w operacje obciążeń mogą prowadzić do poprawy wydajności, zmniejszenia ryzyka przerw w działaniu firmy i szybszego odzyskiwania po wystąpieniu awarii systemu. W tym artykule omówiono podejście do inwestowania w ciągłe operacje tych obciążeń o wysokim priorytecie w celu zwiększenia zobowiązań biznesowych.
Kiedy inwestować w operacje obciążeń
Zasada Pareto (znana również jako zasada 80/20) stwierdza, że 80 procent skutków pochodzi z 20 procent przyczyn. Gdy portfolio IT może rosnąć w miarę upływu czasu, ta reguła jest często ilustrowana w przeglądzie portfela IT. W zależności od wpływu, który wymaga inwestycji, przyczyna może się różnić, ale zasada ogólna jest prawdziwa:
- 80% awarii systemu jest wynikiem 20 procent typowych błędów lub błędów.
- 80 procent wartości biznesowej zwykle pochodzi z 20 procent obciążeń w portfelu.
- 80 procent nakładu pracy na migrację do chmury pochodzi z 20 procent przenoszonych obciążeń.
- 80 procent działań związanych z zarządzaniem chmurą będzie obsługiwać 20 procent zdarzeń usługi lub biletów problemów.
- 80 procent wpływu na działalność biznesową z awarii będzie pochodzić z 20 procent systemów dotkniętych awarią.
Operacje obciążeń powinny być stosowane tylko wtedy, gdy strategia wdrażania chmury, wyniki biznesowe i metryki operacyjne są dobrze zrozumiałe. Jest to zmiana paradygmatu z klasycznego widoku IT. Tradycyjnie it zakładało, że wszystkie obciążenia doświadczyły tego samego stopnia obsługi i wymagały podobnych poziomów priorytetu.
Zanim zainwestują w głębokie operacje obciążeń, zarówno it, jak i firma powinny zrozumieć uzasadnienie biznesowe i oczekiwania dotyczące zwiększonego inwestowania w zarządzanie chmurą.
Rozpoczynanie pracy z danymi
Operacje obciążeń zaczynają się od dogłębnego zrozumienia wydajności obciążeń i wymagań dotyczących obsługi. Zanim zespół zainwestuje w operacje obciążeń, musi mieć bogate dane dotyczące zależności obciążeń, wydajności aplikacji, diagnostyki bazy danych, telemetrii maszyny wirtualnej i historii zdarzeń.
Te dane są informacjami, które napędzają decyzje dotyczące operacji obciążeń.
Kontynuacja obserwacji
Początkowe dane i trwające dane telemetryczne mogą pomóc w sformułowaniu i przetestowaniu teorii dotyczących wydajności obciążenia. Jednak bieżące operacje obciążeń są zakorzenione w ciągłej i rozszerzonej obserwacji wydajności obciążenia, z dużym naciskiem na wydajność aplikacji i danych.
Testowanie automatyzacji
Na poziomie aplikacji pierwsze wymagania dotyczące operacji obciążeń to inwestycja w głębokie testowanie. W przypadku każdej aplikacji obsługiwanej za pomocą operacji obciążeń należy ustanowić i regularnie wykonywać plan testowania w celu zapewnienia funkcjonalnych i skalowanych testów w aplikacjach.
Regularne dane telemetryczne testowe mogą zapewnić natychmiastową walidację różnych hipotez dotyczących działania obciążenia. Ulepszanie wzorców operacyjnych i architektonicznych można wykonywać i testować. Wynikowe różnice zapewniają wyraźną analizę wpływu w celu kierowania ciągłymi inwestycjami.
Informacje o wydaniach
Jasne zrozumienie cykli wydania i potoków wydania jest ważnym elementem operacji obciążeń.
Zrozumienie cykli może przygotować się na potencjalne przerwy i umożliwić zespołowi proaktywne reagowanie na wszelkie wydania, które mogą mieć negatywny wpływ na operacje. Dzięki temu zespół zarządzający chmurą może współpracować z zespołami wdrożeniowymi w celu ciągłego ulepszania jakości produktu i rozwiązywania wszelkich usterek, które mogą mieć wpływ na stabilność.
Co ważniejsze, zrozumienie potoków wydania może znacznie poprawić cel punktu odzyskiwania (RPO) obciążenia. W wielu scenariuszach najszybszą i najbardziej dokładną ścieżką do odzyskiwania aplikacji jest potok wydania. W przypadku warstw aplikacji, które zmieniają się tylko wtedy, gdy wystąpi nowe wydanie, warto zainwestować bardziej intensywnie w optymalizację potoku niż w przypadku odzyskiwania aplikacji z tradycyjnych procesów tworzenia kopii zapasowych.
Chociaż potok wdrażania może być najszybszą ścieżką do odzyskiwania, może być również najszybszą ścieżką do korygowania. Gdy aplikacja ma szybki, wydajny i niezawodny potok wydania, zespół zarządzania chmurą może zautomatyzować wdrażanie na nowym hoście jako formę zautomatyzowanego korygowania.
Może istnieć wiele innych szybszych, bardziej skutecznych mechanizmów korygowania i odzyskiwania. Jeśli jednak użycie istniejącego potoku może spełnić zobowiązania biznesowe i wykorzystać istniejące inwestycje w metodykę DevOps, istniejący potok może być realną alternatywą.
Jasno komunikują się ze zmianami w obciążeniu
Zmiana dowolnego obciążenia jest jednym z największych zagrożeń dla operacji obciążeń. W przypadku dowolnego obciążenia na poziomie operacji obciążeń zarządzania chmurą zespół zarządzający chmurą powinien ściśle dopasować się do zespołów ds. wdrażania chmury, aby zrozumieć zmiany pochodzące z każdej wersji. Ta inwestycja w proaktywne zrozumienie będzie miała bezpośredni, pozytywny wpływ na stabilność operacyjną.
Ulepszanie wyników
Inwestycje w dane i komunikację w obciążeniu dadzą sugestie dotyczące ulepszeń bieżących operacji w jednym z trzech obszarów:
- Techniczne rozwiązanie długu
- Automatyczne korygowanie
- Ulepszony projekt systemu
Techniczne rozwiązanie długu
Najlepsze plany operacji obciążeń nadal wymagają korygowania. Ponieważ zespół zarządzający chmurą stara się być w kontakcie, aby zrozumieć nakłady pracy i wydania związane z wdrażaniem, zespół powinien regularnie dzielić się wymaganiami korygacyjnymi, aby upewnić się, że dług techniczny i błędy są nadal priorytetem dla zespołów programistycznych.
Automatyczne korygowanie
Stosując zasadę Pareto, możemy powiedzieć, że 80 procent negatywnego wpływu na działalność biznesową prawdopodobnie pochodzi z 20 procent zdarzeń serwisowych. Jeśli nie można rozwiązać tych zdarzeń w normalnych cyklach programowania, inwestycje w automatyzację korygowania mogą znacznie zmniejszyć przerwy w działaniu firmy.
Ulepszony projekt systemu
W przypadku technicznego rozwiązywania długów i zautomatyzowanego korygowania błędy systemu są najczęstszą przyczyną większości awarii systemu. Możesz mieć największy wpływ na ogólne operacje obciążeń, stosując się do kilku zasad projektowania:
- Skalowalność: Zdolność systemu do obsługi zwiększonego obciążenia.
- Dostępność: Procent czasu, przez jaki system działa i działa.
- Elastyczność: Zdolność systemu do odzyskiwania po awariach i kontynuowania działania.
- Zarządzania: Procesy operacyjne, które utrzymują działanie systemu w środowisku produkcyjnym.
- Zabezpieczeń: Ochrona aplikacji i danych przed zagrożeniami.
Aby pomóc w ulepszaniu ogólnych operacji, platforma Microsoft Azure Well-Architected Framework zapewnia podejście do oceny określonych obciążeń pod kątem przestrzegania tych filarów. Zastosuj filary zarówno do operacji platformy, jak i operacji obciążeń.
Następne kroki
Mając pełną wiedzę na temat metodologii zarządzania w ramach Cloud Adoption Framework, możesz teraz zaimplementować zasady zarządzania chmurą. Dowiedz się, jak sprawić, aby ta metodologia umożliwiała podejmowanie działań w środowisku operacyjnym.