Strategie obsługi częściowych niepowodzeń

Wskazówka

Ta treść jest fragmentem eBooka "Architektura mikrousług .NET dla konteneryzowanych aplikacji .NET", dostępnego na .NET Docs lub jako bezpłatny plik PDF do pobrania i czytania w trybie offline.

Pobierz plik PDF

Aby poradzić sobie z częściowymi awariami, użyj jednej ze strategii opisanych tutaj.

Użyj komunikacji asynchronicznej (na przykład komunikacji opartej na komunikatach) w ramach wewnętrznych mikrousług. Zdecydowanie nie zaleca się tworzenia długich łańcuchów synchronicznych wywołań HTTP wewnętrznych mikrousług, ponieważ niepoprawny projekt ostatecznie stanie się główną przyczyną nieprawidłowych awarii. Wręcz przeciwnie, z wyjątkiem komunikacji frontonu między aplikacjami klienckimi a pierwszym poziomem mikrousług lub precyzyjnych bram interfejsów API, zaleca się używanie tylko asynchronicznej (opartej na komunikatach) komunikacji po przejściu do początkowego cyklu żądania/odpowiedzi w ramach wewnętrznych mikrousług. Spójność ostateczna i architektury sterowane zdarzeniami pomogą zminimalizować efekty falowania. Te podejścia wymuszają wyższy poziom autonomii mikrousług i w związku z tym zapobiegają wystąpieniu problemu w tym miejscu.

Użyj ponownych prób z wykładniczym opóźnieniem. Ta technika pomaga uniknąć krótkich i sporadycznie niepowodzeń, wykonując ponowną próbę wywołania określoną liczbę razy, w przypadku gdy usługa nie była dostępna tylko przez krótki czas. Może się to zdarzyć z powodu sporadycznych problemów z siecią lub przeniesienia mikrousługi/kontenera do innego węzła w klastrze. Jeśli jednak te próby nie są prawidłowo zaprojektowane z wyłącznikami, może to pogorszyć efekty falowania, ostatecznie nawet powodując odmowę usługi (DoS).

Radzenie sobie z limitami czasu sieci. Ogólnie rzecz biorąc, klienci powinni nie blokować przez czas nieokreślony i zawsze używać limitów czasu podczas oczekiwania na odpowiedź. Użycie czasowych ograniczeń gwarantuje, że zasoby nigdy nie są zajęte przez czas nieokreślony.

Użyj wzorca wyłącznika. W tym podejściu proces klienta śledzi liczbę żądań zakończonych niepowodzeniem. Jeśli wskaźnik błędów przekracza skonfigurowany limit, "wyłącznik obwodu" się przełącza, aby dalsze próby natychmiast się nie powiodły. (Jeśli duża liczba żądań kończy się niepowodzeniem, sugeruje to, że usługa jest niedostępna i że wysyłanie żądań jest bezcelowe). Po upływie limitu czasu klient powinien ponowić próbę i, jeśli nowe żądania zakończą się pomyślnie, zamknij wyłącznik.

Zapewnij opcje zapasowe. W tym podejściu proces klienta wykonuje logikę rezerwową, gdy żądanie kończy się niepowodzeniem, na przykład zwraca buforowane dane lub wartość domyślną. Jest to podejście odpowiednie dla zapytań i jest bardziej złożone w przypadku aktualizacji lub poleceń.

Ogranicz liczbę żądań w kolejce. Klienci powinni również nałożyć górną granicę liczby zaległych żądań, które mikrousługi klienta mogą wysyłać do określonej usługi. Jeśli limit został osiągnięty, prawdopodobnie nie ma sensu wykonywać dodatkowych żądań, a próby te powinny zakończyć się niepowodzeniem natychmiast. Jeśli chodzi o implementację, politykę Izolacji Przegrody Polly można użyć, aby spełnić to wymaganie. Takie podejście jest zasadniczo regulatorem równoległości z SemaphoreSlim jako implementacją. Zezwala również na "kolejkę" poza grodziem. Możesz aktywnie zredukować nadmiar obciążenia nawet przed rozpoczęciem wykonania (na przykład, gdy pojemność jest uznana za pełną). Sprawia to, że jego reakcja na niektóre scenariusze awarii jest szybsza niż wyłącznik, ponieważ wyłącznik czeka na awarie. Obiekt BulkheadPolicy w Polly ujawnia, jak pełne są przegrody i kolejki, i oferuje zdarzenia w przypadku przepełnienia, dzięki czemu może być również używany do napędzania automatycznego skalowania poziomego.

Dodatkowe zasoby

Wzorce odporności
https://learn.microsoft.com/azure/architecture/framework/resiliency/reliability-patterns
Dodawanie odporności i optymalizowanie wydajności
https://learn.microsoft.com/previous-versions/msp-n-p/jj591574(v=pandp.10)
Grodzi. Repozytorium GitHub. Implementacja z polityką Polly.
https://github.com/App-vNext/Polly/wiki/Bulkhead
Projektowanie aplikacji odpornych na błędy dla platformy Azure
https://learn.microsoft.com/azure/architecture/framework/resiliency/app-design
obsługa błędów przejściowych
https://learn.microsoft.com/azure/architecture/best-practices/transient-faults

Poprzedni Następny

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2025-06-17

Udostępnij przez

Strategie obsługi częściowych niepowodzeń

Dodatkowe zasoby

Sprzężenie zwrotne

Dodatkowe źródła