Projekt i operacje klastra

W tym artykule opisano konfigurację klastra i projekt sieci. Dowiedz się, jak zapewnić skalowalność w przyszłości, automatyzując aprowizację infrastruktury. Aprowizowanie to proces konfigurowania żądanej infrastruktury IT. Automatyczna aprowizacja infrastruktury obsługuje instalację zdalną i konfiguruje środowiska wirtualne. Pomaga również zachować wysoką dostępność, planując ciągłość działalności biznesowej i odzyskiwanie po awarii.

Planowanie, szkolenie i dowód

Podczas rozpoczynania pracy lista kontrolna i zasoby kubernetes poniżej ułatwią zaplanowanie projektu klastra. Po zakończeniu tej sekcji będziesz w stanie odpowiedzieć na następujące pytania:

  • Czy zidentyfikowano wymagania projektowe dotyczące sieci dla klastra?
  • Czy masz usługi o różnych wymaganiach? Ile pul węzłów zamierzasz użyć?

Lista kontrolna:

  • Identyfikowanie zagadnień dotyczących projektowania sieci. Zapoznaj się z zagadnieniami dotyczącymi projektowania sieci klastra, porównaj modele sieciowe i wybierz wtyczkę sieciową Kubernetes, która odpowiada Twoim potrzebom. W przypadku sieci interfejsu Azure Container Networking Interface (CNI) należy wziąć pod uwagę liczbę adresów IP wymaganych jako wiele maksymalnych zasobników na węzeł (domyślnie 30) i liczbę węzłów. Dodaj jeden węzeł wymagany podczas uaktualniania. Podczas wybierania usług modułu równoważenia obciążenia rozważ użycie kontrolera ruchu przychodzącego, gdy istnieje zbyt wiele usług, aby zmniejszyć liczbę uwidocznionych punktów końcowych. W przypadku sieci CNI platformy Azure usługa CIDR musi być unikatowa w sieci wirtualnej i wszystkich połączonych sieciach wirtualnych, aby zapewnić odpowiedni routing.

    Aby dowiedzieć się więcej, zobacz:

  • Utwórz wiele pul węzłów. Aby obsługiwać aplikacje o różnych wymaganiach obliczeniowych lub magazynowych, możesz opcjonalnie skonfigurować klaster z wieloma pulami węzłów. Na przykład użyj większej liczby pul węzłów, aby zapewnić procesory GPU dla aplikacji intensywnie korzystających z obliczeń lub dostęp do magazynu SSD o wysokiej wydajności. Aby uzyskać więcej informacji, zobacz Tworzenie wielu pul węzłów i zarządzanie nimi dla klastra w Azure Kubernetes Service.

  • Zdecyduj o wymaganiach dotyczących dostępności. Co najmniej dwa zasobniki za Azure Kubernetes Service zapewniają wysoką dostępność aplikacji, jeśli wystąpią błędy zasobnika lub ponowne uruchomienie. Użyj co najmniej trzech zasobników do obsługi obciążenia podczas awarii zasobnika i ponownego uruchomienia. W przypadku konfiguracji klastra co najmniej dwa węzły w zestawie dostępności lub zestawie skalowania maszyn wirtualnych są wymagane do spełnienia umowy dotyczącej poziomu usług wynoszącej 99,95%. Użyj co najmniej trzech zasobników, aby zapewnić planowanie zasobników podczas awarii węzła i ponownego uruchamiania.

    Aby zapewnić wyższy poziom dostępności aplikacji, klastry mogą być dystrybuowane między Strefy dostępności. Te strefy są fizycznie oddzielone centrami danych w danym regionie. Gdy składniki klastra są rozproszone w wielu strefach, klaster może tolerować awarię w jednej ze stref. Aplikacje i operacje zarządzania pozostają dostępne, nawet jeśli całe centrum danych wystąpi awaria. Aby uzyskać więcej informacji, zobacz Tworzenie klastra Azure Kubernetes Service (AKS), który używa Strefy dostępności.

Przejdź do środowiska produkcyjnego i zastosuj najlepsze rozwiązania dotyczące infrastruktury

Podczas przygotowywania aplikacji do produkcji zaimplementuj minimalny zestaw najlepszych rozwiązań. Użyj tej listy kontrolnej na tym etapie. Po zakończeniu tej sekcji będziesz w stanie odpowiedzieć na następujące pytania:

  • Czy możesz bezpiecznie ponownie wdrożyć infrastrukturę klastra?
  • Czy zastosowano limity przydziału zasobów?

Lista kontrolna:

Optymalizowanie i skalowanie

Kiedy aplikacja jest w środowisku produkcyjnym, jak można zoptymalizować przepływ pracy i przygotować aplikację i zespół do skalowania? Użyj listy kontrolnej optymalizacji i skalowania, aby przygotować się. Po zakończeniu tej sekcji będziesz w stanie odpowiedzieć na następujące pytania:

  • Czy masz plan ciągłości działania i odzyskiwania po awarii?
  • Czy klaster może być skalowany w celu spełnienia wymagań aplikacji?
  • Czy możesz monitorować kondycję klastra i aplikacji oraz otrzymywać alerty?

Lista kontrolna: