Udostępnij za pomocą


Klaster trybu failover systemu Windows Server z programem SQL Server

Dotyczy:SQL Server

Ten artykuł zawiera omówienie korzystania z klastra trybu failover systemu Windows Server (WSFC) z programem SQL Server w celu zapewnienia wysokiej dostępności i odzyskiwania po awarii. Klaster trybu failover systemu Windows Server (WSFC) to grupa niezależnych serwerów, które współpracują ze sobą w celu zwiększenia dostępności aplikacji i usług. Program SQL Server korzysta z usług I możliwości WSFC do obsługi zawsze włączonych grup dostępności i wystąpień klastra trybu failover programu SQL Server.

Terminy i definicje

Klaster z funkcją przełączania awaryjnego systemu Windows Server (WSFC) WSFC to grupa niezależnych serwerów, które działają razem, aby zwiększyć dostępność aplikacji i usług.

Node
Serwer uczestniczący w programie WSFC.

Zasób klastra
Jednostka fizyczna lub logiczna, która może być posiadana przez węzeł, przechodzić do trybu online i offline, być przemieszczana między węzłami oraz zarządzana jako obiekt klastra. Zasób klastra może być własnością tylko jednego węzła w dowolnym momencie.

Role
Kolekcja zasobów klastra zarządzanych jako pojedynczy obiekt klastra w celu zapewnienia określonych funkcji. W przypadku programu SQL Server rola będzie grupą dostępności Always On (AG) lub wystąpieniem klastra Always On failover (FCI). Rola zawiera wszystkie zasoby klastra wymagane dla AG lub instancji FCI. Tryb failover i powrót po awarii zawsze działają w kontekście ról. W przypadku FCI rola zawiera zasób adresu IP, zasób nazwy sieci oraz zasoby programu SQL Server. Rola AG zawiera zasób grupy dostępności (AG), a jeśli skonfigurowano odbiornik, zasób IP i nazwę sieci.

Zasób nazwy sieci
Nazwa serwera logicznego zarządzana jako zasób klastra. Zasób nazwy sieciowej musi być używany z zasobem adresu IP. Te wpisy mogą wymagać obiektów w usługach Active Directory Domain Services i/lub DNS.

Zależność zasobu
Zasób, od którego zależy inny zasób. Jeśli zasób A zależy od zasobu B, B jest zależnością A. Zasób A nie będzie mógł uruchomić się bez zasobu B.

Preferowany właściciel
Węzeł, na którym grupa zasobów jest preferowana do uruchamiania. Każda grupa zasobów jest skojarzona z listą preferowanych właścicieli posortowanych w kolejności preferencji. Podczas automatycznego przełączania w tryb failover grupa zasobów zostanie przeniesiona do następnego preferowanego węzła na liście preferowanych właścicieli.

Możliwy właściciel
Węzeł pomocniczy, na którym można uruchomić zasób. Każda grupa zasobów jest skojarzona z listą możliwych właścicieli. Role mogą przejść w tryb failover tylko do węzłów, które są wymienione jako możliwe właścicieli.

Tryb kworum
Konfiguracja kworum w klastrze trybu failover określająca liczbę awarii węzłów, które klaster może wytrzymać.

Wymuszenie kworum
Proces uruchamiania klastra, mimo że tylko mniejszość elementów wymaganych do kworum jest w komunikacji.

Omówienie klastra trybu failover systemu Windows Server

Klaster trybu failover systemu Windows Server udostępnia funkcje infrastruktury, które obsługują scenariusze wysokiej dostępności i odzyskiwania po awarii hostowanych aplikacji serwera, takich jak Microsoft SQL Server i Microsoft Exchange. Jeśli węzeł lub usługa klastra ulegnie awarii, usługi hostowane na tym węźle mogą być automatycznie lub ręcznie przenoszone na inny dostępny węzeł w procesie zwanym tryb failover.

Węzły w usłudze WSFC współpracują ze sobą, aby zapewnić te typy możliwości:

  • Rozproszone metadane i powiadomienia. Metadane usługi WSFC i hostowanej aplikacji są przechowywane w każdym węźle w klastrze. Te metadane obejmują konfigurację i stan usługi WSFC oprócz ustawień hostowanej aplikacji. Zmiany metadanych lub stanu węzła są automatycznie propagowane do innych węzłów w programie WSFC.

  • Zarządzanie zasobami. Poszczególne węzły w usłudze WSFC mogą zapewniać zasoby fizyczne, takie jak pamięć masowa z bezpośrednim dostępem, interfejsy sieciowe i dostęp do współdzielonej pamięci dyskowej. hostowane aplikacje rejestrują się jako zasób klastra i mogą konfigurować zależności uruchamiania i stanu w odniesieniu do innych zasobów.

  • Monitorowanie kondycji. Ocena kondycji węzłów międzywęzłowych i głównych jest realizowana poprzez połączenie komunikacji sieciowej w stylu 'heartbeat' i monitorowania zasobów. Ogólna kondycja klastra WSFC jest określana na podstawie głosów kworum węzłów w klastrze WSFC.

  • Koordynacja przełączania awaryjnego. Każdy zasób jest skonfigurowany do hostowania w węźle podstawowym, a każdy z nich może być automatycznie lub ręcznie przesyłany do co najmniej jednego węzła pomocniczego. Zasady przełączania awaryjnego oparte na stanie zdrowia sterują automatycznym transferem własności zasobów między węzłami. Węzły i hostowane aplikacje są powiadamiane, gdy nastąpi przejście w tryb failover, aby mogły odpowiednio reagować.

Aby uzyskać więcej informacji, zobacz także: Omówienie klastrowania trybu failover — Windows Server.

Technologie SQL Server Always On i WSFC

Zawsze włączone program SQL Server to rozwiązanie wysokiej dostępności i odzyskiwania po awarii, które korzysta z usługi WSFC. Funkcje Always On zapewniają zintegrowane, elastyczne rozwiązania, które zwiększają dostępność aplikacji, zapewniają lepsze zwroty z inwestycji w sprzęt i upraszczają wdrażanie i zarządzanie wysoką dostępnością.

Zarówno Always On grupy dostępności, jak i Always On wystąpienia klastra skonfigurowanego do przełączania awaryjnego używają WSFC jako technologii platformy, zarejestrowawszy składniki jako zasoby klastra WSFC. Powiązane zasoby są łączone w rolę, która może być zależna od innych zasobów klastra WSFC. Usługa WSFC może następnie wykryć i zasygnalizować konieczność ponownego uruchomienia instancji SQL Server lub automatycznego przełączenia go na inny węzeł serwera w WSFC.

Ważne

Aby w pełni korzystać z technologii Always On programu SQL Server, należy zastosować kilka wymagań wstępnych związanych z usługą WSFC.

Aby uzyskać więcej informacji, zobacz Wymagania wstępne, ograniczenia i zalecenia dla grup dostępności Always On.

Wysoka dostępność na poziomie instancji z instancjami klastra trybu failover Always On

Zawsze aktywne wystąpienie klastra trybu failover (FCI) to wystąpienie programu SQL Server zainstalowane w węzłach w klastrze WSFC. Ten typ wystąpienia zależy od zasobów na potrzeby przechowywania i nazwy sieci wirtualnej. Magazyn może używać protokołu Fibre Channel, iSCSI, FCoE lub SAS do magazynu dysków współdzielonych lub korzystać z lokalnie dołączonego magazynu z funkcją Storage Spaces Direct (S2D). Zasób nazwy sieci wirtualnej zależy od co najmniej jednego wirtualnego adresu IP, z których każdy znajduje się w innej podsieci. Usługa SQL Server i usługa SQL Server Agent są również zasobami, a obie są zależne od zasobów pamięci masowej i nazwy sieci wirtualnej.

W przypadku przejścia w tryb failover usługa WSFC przenosi własność zasobów wystąpienia na wyznaczony węzeł awaryjny. Wystąpienie programu SQL Server jest następnie ponownie uruchamiane na węźle awaryjnym, a bazy danych są przywracane do stanu normalnego. W dowolnym momencie tylko jeden węzeł w klastrze może hostować instancję przełączeniową klastra i zasoby podstawowe.

Uwaga / Notatka

Wystąpienie klastra trybu Always On wymaga symetrycznego współdzielonego magazynu dyskowego, takiego jak sieć magazynowania (SAN) lub udział plików SMB. Udostępnione woluminy magazynu dysków muszą być dostępne dla wszystkich potencjalnych węzłów failover w klastrze WSFC.

Aby uzyskać więcej informacji, zobacz: Zawsze włączone wystąpienia klastra trybu failover.

Wysoka dostępność na poziomie bazy danych z grupami dostępności Always On

Zawsze aktywna grupa dostępności to zbiór jednej lub kilku baz danych użytkownika, które przełączają się wspólnie w trybie awaryjnym. Grupa dostępności składa się z podstawowej repliki dostępności i jednej do czterech replik pomocniczych, które są obsługiwane za pośrednictwem ruchu danych opartego na dziennikach SQL Server w celu ochrony danych bez potrzeby wspólnej pamięci masowej. Każda replika jest hostowana przez wystąpienie programu SQL Server w innym węźle klastra WSFC. Grupa dostępności i odpowiadająca jej nazwa sieci wirtualnej są rejestrowane jako zasoby w klastrze WSFC.

Odbiornik grupy dostępności w węźle repliki podstawowej odpowiada na przychodzące żądania klientów w celu nawiązania połączenia z nazwą sieci wirtualnej i na podstawie atrybutów w parametrach połączenia przekierowuje każde żądanie do odpowiedniego wystąpienia programu SQL Server.

W przypadku awarii zamiast przenoszenia własności współużytkowanych zasobów fizycznych do innego węzła, usługa WSFC jest wykorzystywana do skonfigurowania repliki pomocniczej na innym wystąpieniu programu SQL Server tak, aby stała się repliką podstawową w grupie dostępności. Zasób nazwy sieci wirtualnej grupy dostępności jest następnie transferowany do tego wystąpienia.

W danym momencie tylko jedno wystąpienie programu SQL Server może hostować replikę podstawową baz danych grupy dostępności, wszystkie skojarzone repliki pomocnicze muszą znajdować się w osobnym wystąpieniu, a każde wystąpienie musi znajdować się w oddzielnych węzłach fizycznych.

Uwaga / Notatka

Grupy dostępności Always On nie wymagają wdrożenia klastra w trybie failover ani użycia symetrycznego współdzielonego magazynu (SAN lub SMB).

Wystąpienie klastra trybu failover (FCI) może być używane razem z grupą dostępności w celu poprawy dostępności repliki dostępności. Jednak aby zapobiec potencjalnym warunkom wyścigu w klastrze WSFC, automatyczne przełączenie awaryjne grupy dostępności nie jest obsługiwane z lub do repliki dostępności hostowanej w klastrze FCI.

Aby uzyskać więcej informacji, zobacz Omówienie zawsze włączonych grup dostępności.

Monitorowanie kondycji i przechodzenie w tryb failover w programie WSFC

Wysoka dostępność rozwiązania Always On odbywa się poprzez proaktywne monitorowanie kondycji zasobów klastra fizycznego i logicznego WSFC oraz automatyczne przełączanie w tryb failover na i ponowne konfigurowanie nadmiarowego sprzętu. Administrator systemu może również zainicjować ręczną zmianę stanu awarii grupy dostępności lub wystąpienia programu SQL Server z jednego węzła na inny.

Polityki przełączania awaryjnego dla węzłów, instancji klastra przełączania awaryjnego i grup dostępności

Zasady przełączania awaryjnego są konfigurowane w węźle WSFC, wystąpieniu klastra trybu przełączania awaryjnego programu SQL Server (FCI) oraz na poziomach grup dostępności. Te zasady, na podstawie stopnia powagi, czasu trwania oraz częstotliwości sytuacji złej kondycji zasobów klastra i reaktywności węzłów, mogą wyzwolić ponowne uruchomienie usługi lub automatyczny failover zasobów klastra z jednego węzła na inny, lub mogą wyzwolić przeniesienie repliki podstawowej grupy dostępności z jednego wystąpienia SQL Server do innego.

Przełączenie awaryjne repliki grupy dostępności nie ma wpływu na podstawowe wystąpienie serwera SQL Server. Przełączenie instancji FCI powoduje przeniesienie replik grup dostępności.

Aby uzyskać więcej informacji, zobacz: Zasady trybu failover dla wystąpień klastrów.

Wykrywanie kondycji zasobów WSFC

Każdy zasób w klastrze WSFC może okresowo lub na żądanie zgłaszać swój stan i kondycję. Różne okoliczności mogą wskazywać na awarię zasobu; na przykład awaria zasilania, błędy dysku lub pamięci, błędy komunikacji sieciowej lub usługi nieodpowiadjące.

Zasoby WSFC, takie jak sieci, magazyn lub usługi, mogą być zależne od siebie. Skumulowane zdrowie zasobu jest określane przez sukcesywne sumowanie jego zdrowia ze zdrowiem każdej z jego zależności zasobów.

Wykrywanie kondycji węzłów w WSFC i głosowanie kworum

Każdy węzeł w usłudze WSFC uczestniczy w okresowej komunikacji pulsu w celu udostępnienia stanu kondycji węzła innym węzłom. Węzły nieodpowiadające są uważane za będące w stanie awarii.

Kworum to mechanizm, który pomaga zapewnić, że WSFC działa i jest dostępna, zapewniając, że wystarczająca ilość zasobów jest online w WSFC. Jeśli WSFC ma wystarczającą liczbę głosów, jest w dobrej kondycji i jest w stanie zapewnić tolerancję błędów na poziomie węzłów.

Tryb kworum jest skonfigurowany w usłudze WSFC i określa metodologię stosowaną do głosowania kworum oraz kiedy należy przeprowadzić automatyczne przełączenie awaryjne lub wyłączyć klaster.

Wskazówka

Dobrą praktyką jest zawsze posiadanie nieparzystej liczby głosów kworum w WSFC. Na potrzeby głosowania kworum program SQL Server nie musi być zainstalowany na wszystkich węzłach w klastrze. Dodatkowy serwer może pełnić rolę członka kworum lub można skonfigurować model kworum WSFC do używania zdalnego udziału plików jako rozstrzygającego.

Aby uzyskać więcej informacji, zobacz: Tryby kworum WSFC i Konfiguracja głosowania.

Odzyskiwanie po awarii przez wymuszanie kworum

W zależności od praktyk operacyjnych i konfiguracji WSFC można narazić zarówno automatyczne, jak i ręczne przechodzenie w tryb failover, i nadal utrzymywać niezawodne, odporne na błędy rozwiązanie SQL Server Always On. Jeśli jednak kworum kwalifikujących się węzłów głosowania w usłudze WSFC nie może komunikować się ze sobą lub jeśli klaster WSFC w przeciwnym razie zakończy się niepowodzeniem weryfikacji kondycji, usługa WSFC może przejść w tryb offline.

Jeśli usługa WSFC przejdzie w tryb offline z powodu nieplanowanej awarii lub z powodu trwałej awarii sprzętu lub komunikacji, wymagana jest ręczna interwencja administracyjna w celu wymuszenia kworum i przywrócenia ocalałych węzłów klastra w trybie online w konfiguracji odpornej na błędy.

Następnie należy wykonać szereg kroków w celu ponownego skonfigurowania usługi WSFC, odzyskania replik bazy danych, których dotyczy problem, oraz ponownego ustanowienia nowego kworum.

Aby uzyskać więcej informacji, zobacz: WSFC Disaster Recovery through Forced Quorum (Odzyskiwanie po awarii WSFC za pośrednictwem wymuszonego kworum).

Relacja zawsze włączonych składników programu SQL Server do usługi WSFC

Istnieje kilka warstw relacji między funkcjami i składnikami programu SQL Server Always On i WSFC.

Zawsze włączone grupy dostępności są hostowane na instancjach programu SQL Server.
Żądanie klienta określające nazwę sieci odbiornika logicznej grupy dostępności w celu nawiązania połączenia z podstawową lub pomocniczą bazą danych jest przekierowywane do odpowiedniej nazwy sieciowej wystąpienia bazowego wystąpienia programu SQL Server lub wystąpienia klastra trybu failover programu SQL Server.

Wystąpienia programu SQL Server są aktywnie hostowane w jednym węźle.
Jeśli jest obecne, samodzielne wystąpienie SQL Server zawsze znajduje się na jednym węźle ze statyczną nazwą sieciową wystąpienia. Jeśli jest obecne, wystąpienie FCI programu SQL Server jest aktywne na jednym z co najmniej dwóch potencjalnych węzłów trybu failover z jedną nazwą sieci instancji wirtualnej.

Węzły są członkami klastra WSFC.
Metadane i stan konfiguracji programu WSFC dla wszystkich węzłów są przechowywane w każdym węźle. Każdy serwer może udostępniać asymetryczne woluminy magazynu lub magazynu współużytkowanego (SAN) dla baz danych użytkowników lub systemów. Każdy serwer ma co najmniej jeden fizyczny interfejs sieciowy w co najmniej jednej podsieci IP.

WSFC monitoruje kondycję i zarządza konfiguracją dla grupy serwerów.
Mechanizmy WSFC propagują zmiany metadanych i stanu konfiguracji usługi WSFC do wszystkich węzłów w programie WSFC. Jeśli jest używany świadek dyskowy, metadane również są tam przechowywane. Domyślnie każdy węzeł WSFC otrzymuje głos w kworum, a świadek będzie używany i skonfigurowany w razie potrzeby.

Klucze rejestru Always On grup dostępności są podkluczami klastra WSFC.

Jeśli usuniesz i ponownie utworzysz klaster WSFC, musisz wyłączyć i ponownie włączyć funkcję grupy dostępności Always On w każdym wystąpieniu serwera, które zostało włączone dla grupy dostępności Always On w oryginalnym klastrze WSFC. Aby uzyskać więcej informacji, zobacz Włączanie i wyłączanie zawsze włączonych grup dostępności.

Zrzut ekranu przedstawiający klaster trybu failover systemu Windows Server.

Powiązane zadania