Wzorzec grodziowy

Wzorzec bulkhead jest typem projektu aplikacji, który jest odporny na awarie. W architekturze grodziowej, znanej również jako architektura oparta na komórkach, elementy aplikacji są izolowane do pul, dzięki czemu w przypadku awarii pozostałe elementy będą nadal działać. Wzorzec bulkhead jest nazwany po podzielonych partycjach (grodziach) kadłuba statku. Jeśli dojdzie do naruszenia kadłuba statku, tylko uszkodzone sekcje wypełnią się wodą — dzięki temu statek nie zatonie.

Kontekst i problem

Aplikacja oparta na chmurze może zawierać wiele usług, a każda usługa ma co najmniej jednego użytkownika. Nadmierne obciążenie lub awaria usługi wpływa na wszystkich użytkowników usługi.

Ponadto użytkownik może wysyłać żądania do wielu usług jednocześnie i używać zasobów dla każdego żądania. Gdy użytkownik wysyła żądanie do nieprawidłowo skonfigurowanej lub nieodpowiadanej usługi, zasoby używane przez żądanie klienta mogą pozostać niedostępne przez dłuższy czas. W miarę kontynuowania żądań do usługi te zasoby mogą zostać wyczerpane. Na przykład pula połączeń klienta może zostać wyczerpana. W tym momencie żądania konsumenta do innych usług są pod wpływem. W końcu konsument nie może wysyłać żądań do żadnych innych usług, nie tylko oryginalnej usługi, która nie odpowiada.

Wyczerpanie zasobów wpływa na usługi, które mają wielu użytkowników. Wiele żądań od jednego klienta może wyczerpać dostępne zasoby w usłudze. Wyczerpanie zasobów może oznaczać, że inni konsumenci nie mogą korzystać z usługi, co powoduje efekt awarii kaskadowej.

Rozwiązanie

Partycjonowanie wystąpień usługi w różne grupy na podstawie wymagań dotyczących obciążenia użytkowników i dostępności. Ten projekt pomaga wyizolować błędy. Możesz utrzymać funkcjonalność usługi dla niektórych użytkowników, nawet podczas awarii.

Użytkownik może również partycjonować zasoby, aby upewnić się, że zasoby używane do wywoływania jednej usługi nie wpływają na zasoby używane do wywoływania innej usługi. Na przykład użytkownik, który korzysta z wielu usług, może mieć przypisaną oddzielną pulę połączeń dla każdej z nich. Jeśli usługa zacznie wieść się niepowodzeniem, ma wpływ tylko na pulę połączeń przypisaną dla tej usługi. Użytkownik może nadal korzystać z innych usług.

Ten wzorzec zapewnia następujące korzyści:

Izolowanie użytkowników i usług zabezpiecza przed awariami kaskadowymi. Problem, który ma wpływ na konsumenta lub usługę, można odizolować, tworząc niezależną barierę, aby zapobiec awarii całego rozwiązania.
Zachowuje niektóre funkcje, jeśli wystąpi awaria usługi. Inne usługi i funkcje aplikacji nadal działają.
Zapewnia różne poziomy usług na potrzeby korzystania z aplikacji. Możesz skonfigurować pulę odbiorców o wysokim priorytcie do korzystania z usług o wysokim priorytcie.

Na poniższym diagramie przedstawiono strukturę zabezpieczeń w kontekście pul połączeń do wywoływania poszczególnych usług. W przypadku awarii usługi A lub wystąpienia problemu pula połączeń jest izolowana, więc dotyczy to tylko obciążeń korzystających z puli wątków przypisanej do usługi A. Nie ma to wpływu na obciążenia korzystające z usług B i C i mogą kontynuować pracę bez przerwy.

Diagram przedstawiający strukturę grodzi wokół pul połączeń, które wywołują poszczególne usługi.

Na poniższym diagramie przedstawiono wielu klientów, którzy wywołują pojedynczy serwis. Każdy klient jest przypisywany do oddzielnego wystąpienia usługi. Klient 1 wykonuje zbyt wiele żądań i przeciąża swoją instancję. Ponieważ każda instancja usługi jest odizolowana od innych, klienci mogą nadal wykonywać wywołania.

Diagram przedstawiający wielu klientów wywołujących jedną usługę.

Problemy i zagadnienia

Podczas podejmowania decyzji o zaimplementowaniu tego wzorca należy wziąć pod uwagę następujące kwestie:

Zdefiniuj partycje w oparciu o biznesowe i techniczne wymagania aplikacji.
Jeśli używasz taktycznego projektu opartego na domenie do projektowania mikrousług, granice partycji powinny być zgodne z powiązanymi kontekstami.
W przypadku partycjonowania usług lub użytkowników w grodziki należy wziąć pod uwagę poziom izolacji oferowany przez technologię oraz obciążenie związane z kosztami, wydajnością i możliwościami zarządzania.
Aby zapewnić bardziej zaawansowaną obsługę błędów, rozważ połączenie grodzi z ponawianiem prób, wyłącznikiem i wzorcami ograniczania przepustowości.
Podczas podziału konsumentów na przegrody rozważ użycie procesów, puli wątków i semaforów. Projekty takie jak resilience4j i Polly oferują platformę do tworzenia grodzi konsumenckich.
Podczas podziału usług na odrębne segmenty rozważ wdrożenie ich w osobnych maszynach wirtualnych, kontenerach lub procesach. Kontenery oferują dobrą równowagę między izolacją zasobu a dość małym narzutem.
Usługi, które komunikują się za pomocą asynchronicznych komunikatów, mogą być odizolowane poprzez różne zestawy kolejek. Każda kolejka może mieć dedykowany zestaw instancji, które przetwarzają komunikaty w kolejce lub jedną grupę instancji, które używają algorytmu do zdejmowania wiadomości z kolejki i rozdzielania ich do przetwarzania.
Określ stopień szczegółowości dla przegrodzić. Jeśli na przykład chcesz rozdzielić najemców między partycje, możesz przydzielić każdego najemcę do oddzielnej partycji lub umieścić kilku najemców w jednej partycji.
Monitoruj wydajność i umowę dotyczącą poziomu usług (SLA) każdej partycji.
Użyj wbudowanych kontrolek platformy, takich jak limity szybkości usługi Azure API Management, izolacja jednostek żądań (RU) usługi Azure Cosmos DB i limity zasobów w usłudze Azure Kubernetes Service (AKS) lub Azure Container Apps. Nie twórz ponownie tych mechanizmów ograniczania i izolacji w kodzie aplikacji.
Obciążenia związane z AI i procesami wnioskowania często wymagają rygorystycznej separacji z powodu przydziałów na poziomie wdrożenia i limitów współbieżności, na przykład izolowania wdrożeń usługi Azure OpenAI na obciążenie lub dla każdego najemcy.

Kiedy należy używać tego wzorca

Użyj tego wzorca, gdy:

Chcesz odizolować zasoby dla określonych zależności, aby zakłócenia w jednej usłudze nie wpływały na całą aplikację.
Chcesz odizolować użytkowników o krytycznym znaczeniu od użytkowników standardowych.
Należy chronić aplikację przed awariami kaskadowymi.

Ten wzorzec może nie być odpowiedni w następujących przypadkach:

Mniej wydajne wykorzystanie zasobów może nie być akceptowalne w projekcie.
Dodatkowa złożoność nie jest konieczna.

Projektowanie obciążeń roboczych

Oceń, jak używać wzorca bulkhead w projekcie obciążenia, aby sprostać celom i zasadom opisanym w filarach platformy Azure Well-Architected Framework. Poniższa tabela zawiera wskazówki dotyczące tego, jak ten wzorzec obsługuje cele poszczególnych filarów.

Filar	Jak ten wzorzec obsługuje cele filaru
Decyzje projektowe dotyczące niezawodności pomagają obciążeniom stały się odporne na awarię i zapewniają, że zostanie ono przywrócone do w pełni funkcjonalnego stanu po wystąpieniu awarii.	Strategia izolacji błędów wprowadzona przez celową i kompletną segmentację między składnikami próbuje zawierać błędy na grodzie, które napotyka problem, co zapobiega wpływowi na inne grodzi. - RE:02 Przepływy krytyczne - RE:07 Instynkt samozachowawczy
Decyzje dotyczące projektowania zabezpieczeń pomagają zapewnić poufność, integralność i dostępność danych i systemów obciążenia.	Segmentacja między składnikami pomaga ograniczyć incydenty bezpieczeństwa do zagrożonej przegrody. - Segmentacja SE:04
Efektywność wydajności pomaga wydajnie sprostać wymaganiom dzięki optymalizacjom skalowania, danych i kodu.	Każdą grodę można skalować indywidualnie, aby efektywnie zaspokoić potrzeby zadania znajdującego się w grodzie. - PE:02 Planowanie pojemności - PE:05 Skalowanie i partycjonowanie

Jeśli ten wzorzec wprowadza kompromisy w ramach filaru, rozważ je przed celami innych filarów.

Przykład

Następujący plik konfiguracji Kubernetes tworzy wyizolowany kontener, aby uruchomić jedną usługę z własnym procesorem CPU, zasobami pamięci i limitami.

apiVersion: v1
kind: Pod
metadata:
  name: drone-management
spec:
  containers:
  - name: drone-management-container
    image: drone-service
    resources:
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "1"

Następne kroki

Użyj zasad limitu szybkości usługi API Management , aby kontrolować przepływność żądań na klienta.
Użyj kontrolek współbieżności usługi Azure Functions , aby ograniczyć wykonywanie równoległe.
Ustaw limity zasobów usługi Container Apps , aby kontrolować użycie procesora CPU i pamięci na obciążenie.
Przypisz przepływność RU usługi Azure Cosmos DB dla kontenera, aby zapewnić przewidywalną izolację.

Opinia

Czy ta strona była pomocna?

Last updated on 2026-03-19