Sdílet prostřednictvím


Clustering s podporou převzetí služeb při selhání Windows Serveru s SQL Serverem

platí pro:SQL Server

Tento článek obsahuje přehled použití clusteru windows serveru s podporou převzetí služeb při selhání (WSFC) s SQL Serverem pro zajištění vysoké dostupnosti a zotavení po havárii. Cluster služby převzetí služeb při selhání Windows Serveru (WSFC) je skupina nezávislých serverů, které spolupracují na zvýšení dostupnosti aplikací a služeb. SQL Server využívá služby a možnosti WSFC k podpoře skupin dostupnosti AlwaysOn a instancí clusteru s podporou převzetí služeb při selhání SQL Serveru.

Pojmy a definice

Cluster s vysokou dostupností Windows Server (WSFC) WSFC je skupina nezávislých serverů, které spolupracují na zvýšení dostupnosti aplikací a služeb.

Node
Server, který se účastní WSFC.

Prostředek clusteru
Fyzická nebo logická entita, kterou může vlastnit uzel, převést do režimu online a převést do režimu offline, přesunout mezi uzly a spravovat ji jako objekt clusteru. Prostředek clusteru může být vlastněn pouze jedním uzlem v kterémkoli okamžiku.

Role
Kolekce prostředků clusteru spravovaná jako jeden objekt clusteru, která poskytuje konkrétní funkce. Pro SQL Server bude role buď skupina dostupnosti Always On (AG), nebo instance clusteru Always On pro převzetí služeb při selhání (FCI). Role obsahuje všechny prostředky clusteru, které jsou potřebné pro Availabilní skupinu nebo FCI. Převzetí služeb při selhání a navrácení služeb po obnovení vždy funguje v kontextu rolí. Role pro FCI obsahuje prostředek IP adresy, prostředek síťového názvu a prostředky SQL Serveru. Role skupiny dostupnosti (AG) obsahuje prostředek skupiny dostupnosti AG, a pokud je posluchač nakonfigurován, název sítě a IP prostředek.

Prostředek síťového názvu
Název logického serveru, který se spravuje jako prostředek clusteru. Prostředek síťového názvu musí být použit s prostředkem IP adresy. Tyto položky můžou vyžadovat objekty ve službě Active Directory Domain Services nebo DNS.

Závislost prostředků
Prostředek, na kterém závisí jiný prostředek. Pokud prostředek A závisí na prostředku B, pak B je závislostí A. Prostředek A nebude moct být spuštěn bez prostředku B.

Upřednostňovaný vlastník
Uzel, na kterém skupina prostředků preferuje běh. Každá skupina prostředků je přidružená k seznamu upřednostňovaných vlastníků seřazených v pořadí podle priority. Během automatického převzetí služeb při selhání se skupina prostředků přesune do dalšího upřednostňovaného uzlu v seznamu upřednostňovaných vlastníků.

Možný vlastník
Sekundární uzel, na kterém může prostředek běžet. Každá skupina prostředků je přidružená k seznamu možných vlastníků. Role můžou převzít služby při selhání pouze uzlům, které jsou uvedeny jako možné vlastníky.

Režim kvora
Konfigurace kvora v clusteru s podporou převzetí služeb při selhání, která určuje počet selhání uzlů, které může cluster udržovat.

Vynucení kvora
Proces spuštění clusteru, i když v komunikaci je zapojena pouze menšina uzlů potřebných pro kvorum.

Přehled clustrování při selhání Windows Server

Převzetí služeb při selhání v systému Windows Server poskytuje infrastrukturní funkce, které podporují scénáře vysoké dostupnosti a zotavení po havárii hostovaných serverových aplikací, jako je Microsoft SQL Server a Microsoft Exchange. Pokud uzel nebo služba clusteru selže, můžou se služby hostované na daném uzlu automaticky nebo ručně přenést do jiného dostupného uzlu v procesu označovaného jako převzetí služeb při selhání.

Uzly ve WSFC spolupracují, aby společně poskytovaly tyto typy funkcí:

  • Distribuovaná metadata a oznámení Na každém uzlu v clusteru se udržují metadata služby WSFC a hostovaných aplikací. Tato metadata kromě nastavení hostované aplikace zahrnují konfiguraci a stav WSFC. Změny metadat nebo stavu uzlu se automaticky rozšíří do ostatních uzlů ve WSFC.

  • Správa prostředků Jednotlivé uzly ve WSFC můžou poskytovat fyzické prostředky, jako jsou přímo připojené úložiště, síťová rozhraní a přístup ke sdílenému diskovém úložišti. Hostované aplikace se zaregistrují jako prostředek clusteru a můžou nakonfigurovat závislosti spouštění a stavu na jiných prostředcích.

  • Monitorování stavu Detekce stavu mezi uzly a primárním uzlem se provádí kombinací síťové komunikace typu heartbeat a monitorování prostředků. Celkový stav WSFC je určen hlasy kvora uzlů ve WSFC.

  • Koordinace převzetí služeb při selhání Každý prostředek je nakonfigurovaný tak, aby byl hostován na primárním uzlu a každý z nich může být automaticky nebo ručně přenesen do jednoho nebo více sekundárních uzlů. Zásady převzetí služeb při selhání založené na zdraví systému řídí automatický přenos vlastnictví prostředků mezi uzly. Uzly a hostované aplikace jsou upozorněny, když dojde k převzetí služeb při selhání, aby mohly správně reagovat.

Další informace najdete v tématu: Přehled clusteringu s podporou převzetí služeb při selhání – Windows Server.

Technologie AlwaysOn SQL Serveru a WSFC

SQL Server AlwaysOn je řešení vysoké dostupnosti a zotavení po havárii, které využívá WSFC. Funkce AlwaysOn poskytují integrovaná flexibilní řešení, která zvyšují dostupnost aplikací, poskytují lepší návratnost investic do hardwaru a zjednodušují nasazení a správu vysoké dostupnosti.

Skupiny dostupnosti Always On i instance clusteru s podporou převzetí služeb při selhání Always On používají WSFC jako platformovou technologii a registrují komponenty jako prostředky clusteru WSFC. Související prostředky se kombinují do role, která může být závislá na jiných prostředcích clusteru WSFC. WSFC pak může zjistit a signalizovat potřebu restartovat instanci SQL Serveru nebo ji automaticky převést na jiný uzel serveru ve WSFC.

Důležité

Pokud chcete plně využít výhod technologií AlwaysOn SQL Serveru, měli byste použít několik požadavků souvisejících s WSFC.

Další informace najdete v tématu : Požadavky, omezení a doporučení pro skupiny dostupnosti AlwaysOn.

Vysoká dostupnost na úrovni instance s instancemi failover clusteru Always On

Instance clusteru s podporou převzetí služeb při selhání AlwaysOn (FCI) je instance SQL Serveru, která je nainstalovaná napříč uzly ve WSFC. Tento typ instance závisí na prostředcích pro úložiště a název virtuální sítě. Úložiště může používat pro sdílené diskové úložiště technologie Fibre Channel, iSCSI, FCoE nebo SAS, nebo místně připojené úložiště s Storage Spaces Direct (S2D). Prostředek názvu virtuální sítě závisí na jedné nebo více virtuálních IP adresách, každá v jiné podsíti. Služba SQL Server a služba agenta SQL Serveru jsou také prostředky a oba jsou závislé na prostředcích úložiště a názvu virtuální sítě.

V případě převzetí služeb při selhání služba WSFC přenese vlastnictví prostředků instance do určeného uzlu převzetí služeb při selhání. Instance SQL Serveru se na uzlu převzetí restartuje a databáze se obnoví obvyklým způsobem. V každém okamžiku může FCI a podkladové prostředky hostovat pouze jeden uzel v clusteru.

Poznámka:

Always On failover cluster instance vyžaduje symetrické sdílené diskové úložiště, jako je SAN (Storage Area Network) nebo sdílená složka SMB. Svazky sdíleného diskového úložiště musí být dostupné pro všechny potenciální uzly převzetí služeb při selhání v clusteru WSFC.

Další informace najdete v tématu: Instance clusteru s podporou převzetí služeb při selhání AlwaysOn.

Vysoká dostupnost na úrovni databáze se skupinami dostupnosti AlwaysOn

Always On skupina dostupnosti (AG) je seskupení jedné nebo více uživatelských databází, které při selhání automaticky převezmou služby společně. Skupina dostupnosti se skládá z primární repliky dostupnosti a jedné až čtyř sekundárních replik, které jsou udržovány prostřednictvím přesunu dat založených na protokolu SQL Serveru pro ochranu dat bez nutnosti sdíleného úložiště. Každá replika je hostovaná instancí SQL Serveru na jiném uzlu WSFC. Skupina dostupnosti a odpovídající název virtuální sítě jsou zaregistrované jako prostředky v clusteru WSFC.

Naslouchací proces skupiny dostupnosti na uzlu primární repliky reaguje na příchozí požadavky klientů pro připojení k názvu virtuální sítě a na základě atributů v připojovacím řetězci přesměruje každý požadavek na příslušnou instanci SQL Serveru.

V případě převzetí služeb při selhání se místo převodu vlastnictví sdílených fyzických prostředků do jiného uzlu používá WSFC k překonfigurování sekundární repliky na jiné instanci SQL Serveru tak, aby se stala primární replikou skupiny dostupnosti. Prostředek názvu virtuální sítě skupiny dostupnosti se pak do této instance převede.

V každém okamžiku může primární repliku databází skupiny dostupnosti hostovat pouze jedna instance SQL Serveru, všechny přidružené sekundární repliky se musí nacházet v samostatné instanci a každá instance se musí nacházet na samostatných fyzických uzlech.

Poznámka:

Skupiny dostupnosti Always On nevyžadují nasazení instance clusteru pro převzetí služeb při selhání ani použití symetrického sdíleného úložiště (SAN nebo SMB).

Instance clusteru s podporou převzetí služeb při selhání (FCI) se může použít společně se skupinou dostupnosti k vylepšení dostupnosti repliky. Aby se však zabránilo potenciálním podmínkám závodu v clusteru WSFC, automatické převzetí při selhání skupiny dostupnosti není podporováno na ani z repliky dostupnosti hostované v FCI.

Další informace najdete v tématu: Přehled skupin dostupnosti AlwaysOn.

Monitorování stavu WSFC a převzetí služeb při selhání

Vysoká dostupnost řešení Always On je zajištěna pomocí proaktivního sledování stavu fyzických a logických prostředků clusteru WSFC, spolu s automatickým převzetím služeb při selhání a rekonfigurací redundantního hardwaru. Správce systému může také iniciovat ruční převzetí služeb při selhání dostupnostní skupiny nebo instance SQL Serveru z jednoho uzlu do druhého.

Zásady převzetí služeb při selhání pro uzly, instance převzetí služeb při selhání a skupiny dostupnosti.

Zásady převzetí služeb při selhání se konfigurují na uzlu WSFC, instanci clusteru s podporou převzetí služeb při selhání SQL Serveru (FCI) a na úrovni skupin dostupnosti. Tyto zásady, na základě závažnosti, doby trvání a frekvence nezdravého stavu prostředků clusteru a odezvy uzlů, mohou spustit restartování služby nebo automatické převzetí služeb při selhání prostředků clusteru z jednoho uzlu na druhý, nebo mohou vyvolat přesun primární repliky skupiny dostupnosti z jedné instance serveru SQL do jiné.

Převzetí služeb při selhání repliky dostupnostní skupiny nemá vliv na SQL Server instance. FCI při selhání přesune repliky skupiny dostupnosti hostované s instancí.

Další informace najdete v tématu zásady převzetí služeb při selhání pro instance failover clusteru.

Detekce stavu prostředků WSFC

Každý prostředek ve WSFC může hlásit svůj stav a zdraví, pravidelně nebo na vyžádání. Různé okolnosti můžou znamenat selhání prostředků; Například selhání napájení, chyby disku nebo paměti, chyby síťové komunikace nebo nereagující služby.

Prostředky WSFC, jako jsou sítě, úložiště nebo služby, mohou být vzájemně závislé. Kumulativní stav prostředku se určuje postupným sčítáním jeho stavu s jednotlivými stavy jeho závislostí na prostředcích.

Zjišťování stavu mezi uzly WSFC a hlasování kvora

Každý uzel ve WSFC se účastní pravidelné heartbeat komunikace k sdílení zdravotního stavu uzlu s ostatními uzly. Nereagující uzly se považují za selhané.

Kvorum je mechanismus, který pomáhá zajistit, že služba WSFC je v provozu tím, že zajistí dostatečné množství online zdrojů ve WSFC. Pokud má WSFC dostatek hlasů, je v pořádku a dokáže poskytnout odolnost proti chybám na úrovni uzlu.

Ve WSFC je nakonfigurovaný quorum mode, který určuje metodologii použité pro hlasování kvora a kdy provést automatické přepnutí při selhání nebo vypnout cluster.

Návod

Osvědčeným postupem je vždy mít lichý počet hlasů kvora ve WSFC. Pro účely hlasování kvora nemusí být SQL Server nainstalovaný na všech uzlech v clusteru. Další server může fungovat jako člen kvora nebo je možné nakonfigurovat model kvora WSFC tak, aby používal vzdálenou sdílenou složku jako jistič.

Další informace najdete v tématu: Režimy kvora WSFC a konfigurace hlasování.

Zotavení po havárii prostřednictvím vynucení kvora

V závislosti na provozních postupech a konfiguraci WSFC můžete mít jak automatické, tak ruční převzetí služeb při selhání a stále udržovat robustní a proti chybám odolné řešení SQL Server Always On. Pokud však kvorum oprávněných hlasovacích uzlů ve WSFC nemůže vzájemně komunikovat nebo pokud cluster WSFC jinak selže ověření stavu, může wsFC přejít do režimu offline.

Pokud WSFC přejde do offline režimu z důvodu neplánované havárie nebo kvůli trvalému selhání hardwaru nebo komunikace, je potřeba ruční zásah správce k vynucení kvora a vrácení přeživších uzlů clusteru zpět do režimu online v konfiguraci odolné proti chybám.

Následně je potřeba provést také řadu kroků pro překonfigurování WSFC, obnovení ovlivněných replik databáze a opětovné vytvoření nového kvora.

Další informace najdete v tématu Zotavení po havárii WSFC prostřednictvím vynuceného kvora.

Vztah součástí AlwaysOn SQL Serveru s WSFC

Mezi SQL Serverem Always On a funkcemi a komponentami WSFC existuje několik vrstev vztahů.

Skupiny dostupnosti AlwaysOn jsou hostované v instancích SQL Serveru.
Požadavek klienta, který určuje naslouchací název logické skupiny dostupnosti pro připojení k primární či sekundární databázi, se přesměruje na příslušný název sítě instance podkladové instance SQL Serveru nebo FCI SQL Serveru.

Instance SQL Serveru jsou aktivně hostované na jednom uzlu.
Pokud existuje, samostatná instance SQL Serveru se vždy nachází na jednom uzlu se statickým názvem síťové instance. Pokud je k dispozici, je FCI SQL Serveru aktivní na jednom ze dvou nebo více možných uzlů pro převzetí služeb při selhání s jedním virtuálním názvem instance sítě.

Uzly jsou členy clusteru WSFC.
Metadata a stav konfigurace WSFC pro všechny uzly jsou uložena na každém uzlu. Každý server může poskytovat asymetrické úložiště nebo sdílené svazky úložiště (SAN) pro uživatelské nebo systémové databáze. Každý server má alespoň jedno fyzické síťové rozhraní v jedné nebo více podsítích PROTOKOLU IP.

WSFC monitoruje stav a spravuje konfiguraci pro skupinu serverů.
Mechanismy WSFC šíří změny metadat konfigurace WSFC a stavu do všech uzlů ve WSFC. Pokud je použit disky svědek, metadata se uloží také tam. Ve výchozím nastavení má každý uzel WSFC hlas pro dosažení kvoru a v případě potřeby a konfigurace se použije svědek.

Klíče registru skupin dostupnosti AlwaysOn jsou podklíče clusteru WSFC.

Pokud odstraníte a znovu vytvoříte WSFC, musíte zakázat a znovu povolit funkci skupiny dostupnosti AlwaysOn na každé instanci serveru, která byla povolena pro skupiny dostupnosti AlwaysOn v původní WSFC. Další informace najdete v tématu Povolení a zakázání skupin dostupnosti AlwaysOn.

Snímek obrazovky s clusterem s podporou převzetí služeb při selhání Windows Serveru

Související úkoly