Udostępnij za pośrednictwem


Operacje obciążeń w zarządzaniu chmurą

Niektóre obciążenia mają kluczowe znaczenie dla sukcesu firmy. W przypadku tych obciążeń punkt odniesienia zarządzania jest niewystarczający do spełnienia wymaganych zobowiązań biznesowych związanych z zarządzaniem chmurą. Operacje platformy mogą nawet nie być wystarczające do spełnienia zobowiązań biznesowych. Ten bardzo ważny podzbiór obciążeń wymaga wyspecjalizowanego skupienia się na sposobie działania obciążenia i jego obsługi.

W zamian inwestycje w operacje obciążeń mogą prowadzić do poprawy wydajności, zmniejszenia ryzyka przerw w działaniu firmy i szybszego odzyskiwania po wystąpieniu awarii systemu. W tym artykule omówiono podejście do inwestowania w ciągłe operacje tych obciążeń o wysokim priorytecie w celu zwiększenia zobowiązań biznesowych.

Kiedy inwestować w operacje obciążeń

Zasada Pareto (znana również jako zasada 80/20) stwierdza, że 80 procent skutków pochodzi z 20 procent przyczyn. Gdy portfolio IT może rosnąć w miarę upływu czasu, ta reguła jest często ilustrowana w przeglądzie portfela IT. W zależności od wpływu, który wymaga inwestycji, przyczyna może się różnić, ale zasada ogólna jest prawdziwa:

  • 80% awarii systemu jest wynikiem 20 procent typowych błędów lub błędów.
  • 80 procent wartości biznesowej zwykle pochodzi z 20 procent obciążeń w portfelu.
  • 80 procent nakładu pracy na migrację do chmury pochodzi z 20 procent przenoszonych obciążeń.
  • 80 procent działań związanych z zarządzaniem chmurą będzie obsługiwać 20 procent zdarzeń usługi lub biletów problemów.
  • 80 procent wpływu na działalność biznesową z awarii będzie pochodzić z 20 procent systemów dotkniętych awarią.

Operacje obciążeń powinny być stosowane tylko wtedy, gdy strategia wdrażania chmury, wyniki biznesowe i metryki operacyjne są dobrze zrozumiałe. Jest to zmiana paradygmatu z klasycznego widoku IT. Tradycyjnie it zakładało, że wszystkie obciążenia doświadczyły tego samego stopnia obsługi i wymagały podobnych poziomów priorytetu.

Zanim zainwestują w głębokie operacje obciążeń, zarówno it, jak i firma powinny zrozumieć uzasadnienie biznesowe i oczekiwania dotyczące zwiększonego inwestowania w zarządzanie chmurą.

Rozpoczynanie pracy z danymi

Operacje obciążeń zaczynają się od dogłębnego zrozumienia wydajności obciążeń i wymagań dotyczących obsługi. Zanim zespół zainwestuje w operacje obciążeń, musi mieć bogate dane dotyczące zależności obciążeń, wydajności aplikacji, diagnostyki bazy danych, telemetrii maszyny wirtualnej i historii zdarzeń.

Te dane są informacjami, które napędzają decyzje dotyczące operacji obciążeń.

Kontynuacja obserwacji

Początkowe dane i trwające dane telemetryczne mogą pomóc w sformułowaniu i przetestowaniu teorii dotyczących wydajności obciążenia. Jednak bieżące operacje obciążeń są zakorzenione w ciągłej i rozszerzonej obserwacji wydajności obciążenia, z dużym naciskiem na wydajność aplikacji i danych.

Testowanie automatyzacji

Na poziomie aplikacji pierwsze wymagania dotyczące operacji obciążeń to inwestycja w głębokie testowanie. W przypadku każdej aplikacji obsługiwanej za pomocą operacji obciążeń należy ustanowić i regularnie wykonywać plan testowania w celu zapewnienia funkcjonalnych i skalowanych testów w aplikacjach.

Regularne dane telemetryczne testowe mogą zapewnić natychmiastową walidację różnych hipotez dotyczących działania obciążenia. Ulepszanie wzorców operacyjnych i architektonicznych można wykonywać i testować. Wynikowe różnice zapewniają wyraźną analizę wpływu w celu kierowania ciągłymi inwestycjami.

Informacje o wydaniach

Jasne zrozumienie cykli wydania i potoków wydania jest ważnym elementem operacji obciążeń.

Zrozumienie cykli może przygotować się na potencjalne przerwy i umożliwić zespołowi proaktywne reagowanie na wszelkie wydania, które mogą mieć negatywny wpływ na operacje. Dzięki temu zespół zarządzający chmurą może współpracować z zespołami wdrożeniowymi w celu ciągłego ulepszania jakości produktu i rozwiązywania wszelkich usterek, które mogą mieć wpływ na stabilność.

Co ważniejsze, zrozumienie potoków wydania może znacznie poprawić cel punktu odzyskiwania (RPO) obciążenia. W wielu scenariuszach najszybszą i najbardziej dokładną ścieżką do odzyskiwania aplikacji jest potok wydania. W przypadku warstw aplikacji, które zmieniają się tylko wtedy, gdy wystąpi nowe wydanie, warto zainwestować bardziej intensywnie w optymalizację potoku niż w przypadku odzyskiwania aplikacji z tradycyjnych procesów tworzenia kopii zapasowych.

Chociaż potok wdrażania może być najszybszą ścieżką do odzyskiwania, może być również najszybszą ścieżką do korygowania. Gdy aplikacja ma szybki, wydajny i niezawodny potok wydania, zespół zarządzania chmurą może zautomatyzować wdrażanie na nowym hoście jako formę zautomatyzowanego korygowania.

Może istnieć wiele innych szybszych, bardziej skutecznych mechanizmów korygowania i odzyskiwania. Jeśli jednak użycie istniejącego potoku może spełnić zobowiązania biznesowe i wykorzystać istniejące inwestycje w metodykę DevOps, istniejący potok może być realną alternatywą.

Jasno komunikują się ze zmianami w obciążeniu

Zmiana dowolnego obciążenia jest jednym z największych zagrożeń dla operacji obciążeń. W przypadku dowolnego obciążenia na poziomie operacji obciążeń zarządzania chmurą zespół zarządzający chmurą powinien ściśle dopasować się do zespołów ds. wdrażania chmury, aby zrozumieć zmiany pochodzące z każdej wersji. Ta inwestycja w proaktywne zrozumienie będzie miała bezpośredni, pozytywny wpływ na stabilność operacyjną.

Ulepszanie wyników

Inwestycje w dane i komunikację w obciążeniu dadzą sugestie dotyczące ulepszeń bieżących operacji w jednym z trzech obszarów:

  • Techniczne rozwiązanie długu
  • Automatyczne korygowanie
  • Ulepszony projekt systemu

Techniczne rozwiązanie długu

Najlepsze plany operacji obciążeń nadal wymagają korygowania. Ponieważ zespół zarządzający chmurą stara się być w kontakcie, aby zrozumieć nakłady pracy i wydania związane z wdrażaniem, zespół powinien regularnie dzielić się wymaganiami korygacyjnymi, aby upewnić się, że dług techniczny i błędy są nadal priorytetem dla zespołów programistycznych.

Automatyczne korygowanie

Stosując zasadę Pareto, możemy powiedzieć, że 80 procent negatywnego wpływu na działalność biznesową prawdopodobnie pochodzi z 20 procent zdarzeń serwisowych. Jeśli nie można rozwiązać tych zdarzeń w normalnych cyklach programowania, inwestycje w automatyzację korygowania mogą znacznie zmniejszyć przerwy w działaniu firmy.

Ulepszony projekt systemu

W przypadku technicznego rozwiązywania długów i zautomatyzowanego korygowania błędy systemu są najczęstszą przyczyną większości awarii systemu. Możesz mieć największy wpływ na ogólne operacje obciążeń, stosując się do kilku zasad projektowania:

  • Skalowalność: Zdolność systemu do obsługi zwiększonego obciążenia.
  • Dostępność: Procent czasu, przez jaki system działa i działa.
  • Elastyczność: Zdolność systemu do odzyskiwania po awariach i kontynuowania działania.
  • Zarządzania: Procesy operacyjne, które utrzymują działanie systemu w środowisku produkcyjnym.
  • Zabezpieczeń: Ochrona aplikacji i danych przed zagrożeniami.

Aby pomóc w ulepszaniu ogólnych operacji, platforma Microsoft Azure Well-Architected Framework zapewnia podejście do oceny określonych obciążeń pod kątem przestrzegania tych filarów. Zastosuj filary zarówno do operacji platformy, jak i operacji obciążeń.

Następne kroki

Mając pełną wiedzę na temat metodologii zarządzania w ramach Cloud Adoption Framework, możesz teraz zaimplementować zasady zarządzania chmurą. Dowiedz się, jak sprawić, aby ta metodologia umożliwiała podejmowanie działań w środowisku operacyjnym.