Eksplorowanie doskonałości operacyjnej

Ukończone

Rozwiązania DevOps nie tylko obejmują tworzenie, testowanie i dostarczanie oprogramowania, ale także rozszerzają się na aspekty operacyjne życia organizacji. W szczególności metodyka DevOps może pomóc w osiągnięciu doskonałości operacyjnej, postępując zgodnie z jej zasadami w codziennych operacjach. Organizacja opisana w przykładowym scenariuszu skorzystałaby z przyjęcia tego podejścia, aby sprostać obecnym wyzwaniom. W tej lekcji poznasz podstawowe aspekty doskonałości operacyjnej w kontekście metodyki DevOps.

Co to jest doskonałość operacyjna?

Diagram przedstawiający reprezentację grafu monitorowania.

Doskonałość operacyjna to zestaw praktyk, które promują efektywność, odporność i ciągłe ulepszanie w codziennych operacjach. Kluczowe aspekty doskonałości operacyjnej pokrywają się w dużym stopniu z praktykami DevOps, takimi jak automatyzacja, współpraca, ciągłe ulepszanie, skalowalność i elastyczność. Istnieje jednak kilka omówionych tutaj ze względu na ich znaczenie operacyjne. Te aspekty obejmują:

  • Ciągłe operacje: cele tworzenia i utrzymywania środowiska, w którym potrzeba przestoju jest zminimalizowana lub nawet wyeliminowana.
  • Ciągłe monitorowanie, obserwowanie: podkreśla znaczenie monitorowania aplikacji i podstawowej infrastruktury w czasie rzeczywistym. Ostatecznym celem jest proaktywne (a nie reaktywne) wykrywanie wszelkich zbliżających się problemów.
  • Modelowanie kondycji: obejmuje tworzenie modeli reprezentujących oczekiwane zachowanie i wydajność systemu docelowego w różnych warunkach. Służy to jako punkt odniesienia do wykrywania wszelkich anomalii, które mogą wskazywać na potencjalne problemy.
  • Inżynieria niezawodności: stosuje rozwiązania inżynierii chaosu i iniekcji błędów w celu zastosowania proaktywnych środków, które prowadzą do zwiększenia odporności.
  • Zarządzanie zdarzeniami: koncentruje się na wydajnym reagowaniu na zdarzenia i rozwiązywaniu problemów, w tym na dobrze zdefiniowanym zarządzaniu zdarzeniami, niezawodnych kanałach komunikacyjnych, zautomatyzowanym korygowaniu i ciągłym uczeniu się, aby zminimalizować możliwość powtarzających się problemów.
  • Integracja z zabezpieczeniami: obejmuje praktyki zabezpieczeń w cyklu życia operacji.
  • testowania z prawej strony: używa rozwiązań, takich jak ciemne uruchamianie i flagi funkcji w środowisku produkcyjnym.