Nastavení zotavení po havárii ve velkém měřítku pro virtuální počítače nebo fyzické servery VMware

Článek
27. 09. 2024

Tento článek popisuje, jak nastavit zotavení po havárii do Azure pro velká čísla (> 1000) místních virtuálních počítačů VMware nebo fyzických serverů ve vašem produkčním prostředí pomocí služby Azure Site Recovery .

Definování strategie BCDR

V rámci strategie provozní kontinuity a zotavení po havárii (BCDR) definujete cíle bodů obnovení (RPO) a plánovanou dobu obnovení (RTO) pro obchodní aplikace a úlohy. RtO měří dobu trvání doby a úrovně služby, ve které je potřeba obnovit a zpřístupnit obchodní aplikaci nebo proces, aby se zabránilo problémům s kontinuitou.

Site Recovery poskytuje průběžnou replikaci pro virtuální počítače VMware a fyzické servery a smlouvu SLA pro RTO.
Při plánování rozsáhlého zotavení po havárii pro virtuální počítače VMware a zjištění potřebných prostředků Azure můžete zadat hodnotu RTO, která se použije pro výpočty kapacity.

Osvědčené postupy

Některé obecné osvědčené postupy pro rozsáhlé zotavení po havárii. Tyto osvědčené postupy jsou podrobněji popsány v dalších částech dokumentu.

Identifikace cílových požadavků: Před nastavením zotavení po havárii odhadněte kapacitu a potřeby prostředků v Azure.
Plánování komponent Site Recovery: Zjistěte, jaké součásti Site Recovery (konfigurační server, procesové servery), které potřebujete ke splnění odhadované kapacity.
Nastavte jeden nebo více procesových serverů se škálováním na více systémů: Nepoužívejte procesový server, který běží ve výchozím nastavení na konfiguračním serveru.
Spusťte nejnovější aktualizace: Tým Site Recovery pravidelně vydává nové verze komponent Site Recovery a měli byste se ujistit, že používáte nejnovější verze. Abyste s tím mohli pomoct, sledujte , co je nového pro aktualizace, a povolte a nainstalujte aktualizace při jejich vydání.
Monitorování proaktivně: Při zprovoznění zotavení po havárii byste měli proaktivně monitorovat stav a stav replikovaných počítačů a prostředků infrastruktury.
Postupy zotavení po havárii: Pravidelně byste měli spouštět postupy zotavení po havárii. To nemá vliv na vaše produkční prostředí, ale pomáhají zajistit, aby převzetí služeb při selhání do Azure fungovalo podle očekávání v případě potřeby.

Shromáždění informací o plánování kapacity

Shromážděte informace o místním prostředí, které vám pomůžou vyhodnotit a odhadnout potřeby cílové kapacity (Azure).

V případě VMware to provedete spuštěním Plánovače nasazení pro virtuální počítače VMware.
U fyzických serverů shromážděte informace ručně.

Spuštění Plánovače nasazení pro virtuální počítače VMware

Plánovač nasazení vám pomůže shromáždit informace o místním prostředí VMware.

Spusťte Plánovač nasazení během období, které představuje typickou četnost změn pro vaše virtuální počítače. Tím se vygenerují přesnější odhady a doporučení.
Doporučujeme spustit Plánovač nasazení na počítači konfiguračního serveru, protože Planner vypočítá propustnost ze serveru, na kterém běží. Přečtěte si další informace o měření propustnosti.
Pokud ještě nemáte nastavení konfiguračního serveru:
- Získejte přehled komponent Site Recovery.
- Nastavte konfigurační server, aby se na něm spustil Plánovač nasazení.

Pak spusťte Planner následujícím způsobem:

Přečtěte si o Plánovači nasazení. Nejnovější verzi si můžete stáhnout z portálu nebo si ji stáhnout přímo.
Projděte si požadavky a nejnovější aktualizace Plánovače nasazení a stáhněte a extrahujte nástroj.
Spusťte Plánovač nasazení na konfiguračním serveru.
Vygenerujte sestavu , která shrnuje odhady a doporučení.
Analyzujte doporučení sestavy a odhady nákladů.

Poznámka

Ve výchozím nastavení je nástroj nakonfigurovaný tak, aby profiloval a vygeneroval sestavu až pro 1 000 virtuálních počítačů. Tento limit můžete změnit zvýšením hodnoty klíče MaxVMsSupported v souboru ASRDeploymentPlanner.exe.config.

Plánování požadavků na cíl (Azure) a kapacity

Pomocí shromážděných odhadů a doporučení můžete naplánovat cílové prostředky a kapacitu. Pokud jste spustili Plánovač nasazení pro virtuální počítače VMware, můžete použít řadu doporučení sestav, která vám pomůžou.

Kompatibilní virtuální počítače: Pomocí tohoto čísla identifikujte počet virtuálních počítačů, které jsou připravené k zotavení po havárii do Azure. Doporučení týkající se šířky pásma sítě a jader Azure jsou založená na tomto čísle.
Požadovaná šířka pásma sítě: Všimněte si šířky pásma, kterou potřebujete pro rozdílovou replikaci kompatibilních virtuálních počítačů.
- Když spustíte Planner, zadáte požadovaný cíl bodu obnovení v minutách. Doporučení ukazují šířku pásma potřebnou ke splnění tohoto cíle bodu obnovení 100 % a 90 % času.
- Doporučení šířky pásma sítě berou v úvahu šířku pásma potřebnou pro celkový počet konfiguračních serverů a procesových serverů doporučených v Planneru.
Požadovaná jádra Azure: Všimněte si počtu jader, která potřebujete v cílové oblasti Azure, na základě počtu kompatibilních virtuálních počítačů. Pokud nemáte dostatek jader, site Recovery při převzetí služeb při selhání nebude moct vytvořit požadované virtuální počítače Azure.
Doporučená velikost dávky virtuálního počítače: Doporučená velikost dávky je založená na možnosti dokončit počáteční replikaci dávky do 72 hodin, zatímco schůzka cíle bodu obnovení 100 %. Hodnotu hodiny je možné upravit.

Tato doporučení můžete použít k plánování prostředků Azure, šířky pásma sítě a dávkování virtuálních počítačů.

Plánování předplatných a kvót Azure

Chceme zajistit, aby dostupné kvóty v cílovém předplatném byly dostatečné pro zpracování převzetí služeb při selhání.

Úkol	Podrobnosti	Akce
Kontrola jader	Pokud se jádra v dostupné kvótě nerovnají nebo nepřekročí celkový cílový počet v době převzetí služeb při selhání, převzetí služeb při selhání selže.	V případě virtuálních počítačů VMware zkontrolujte, jestli máte v cílovém předplatném dostatek jader, abyste splnili doporučení plánovače nasazení. U fyzických serverů zkontrolujte, jestli jádra Azure splňují vaše ruční odhady. Pokud chcete zkontrolovat kvóty, klikněte na předplatné webu Azure Portal> na Využití a kvóty. Přečtěte si další informace o zvýšení kvót.
Kontrola limitů převzetí služeb při selhání	Počet převzetí služeb při selhání nesmí překročit limity převzetí služeb při selhání Site Recovery.	Pokud převzetí služeb při selhání překročí limity, můžete přidat předplatná a převzít služby při selhání do více předplatných nebo zvýšit kvótu předplatného.

Omezení převzetí služeb při selhání

Omezení označují počet převzetí služeb při selhání, které Site Recovery podporuje během jedné hodiny za předpokladu, že na počítač jsou tři disky.

Co znamená dodržování předpisů? Pokud chcete spustit virtuální počítač Azure, vyžaduje Azure, aby některé ovladače byly ve stavu spuštění a služby, jako je DHCP, aby se automaticky spustily.

Počítače, které vyhovují, už budou mít tato nastavení nastavená.
U počítačů s Windows můžete proaktivně kontrolovat dodržování předpisů a v případě potřeby je označit jako vyhovující. Další informace.
Počítače s Linuxem jsou v době převzetí služeb při selhání přeneseny pouze do souladu.

Počítač je v souladu s Azure?	Omezení virtuálních počítačů Azure (převzetí služeb při selhání spravovaných disků)
Ano	2000
No	1 000

Omezení předpokládají, že v cílové oblasti předplatného probíhá minimální počet dalších úloh.
Některé oblasti Azure jsou menší a můžou mít mírně nižší limity.

Plánování infrastruktury a připojení virtuálních počítačů

Po převzetí služeb při selhání do Azure potřebujete, aby vaše úlohy fungovaly stejně jako v místním prostředí, a aby uživatelé měli přístup k úlohám běžícím na virtuálních počítačích Azure.

Přečtěte si další informace o převzetí služeb při selhání místní infrastruktury služby Active Directory nebo DNS do Azure.
Přečtěte si další informace o přípravě připojení k virtuálním počítačům Azure po převzetí služeb při selhání.

Plánování zdrojové kapacity a požadavků

Je důležité, abyste měli dostatek konfiguračních serverů a procesových serverů se škálováním na více instancí, abyste splnili požadavky na kapacitu. Při zahájení nasazení ve velkém měřítku začněte s jedním konfiguračním serverem a jedním procesovým serverem se škálováním na více systémů. Jakmile dosáhnete předepsaného limitu, přidejte další servery.

Poznámka

V případě virtuálních počítačů VMware plánovač nasazení doporučí konfiguraci a procesové servery, které potřebujete. Místo doporučení Plánovače nasazení doporučujeme používat tabulky zahrnuté v následujících postupech.

Nastavení konfiguračního serveru

Kapacita konfiguračního serveru je ovlivněna počtem replikovaných počítačů, nikoli četností změn dat. Pokud chcete zjistit, jestli potřebujete další konfigurační servery, použijte tyto definované limity virtuálních počítačů.

PROCESOR	Paměť	Disk mezipaměti	Omezení replikovaných počítačů
8 vCPU 2 sokety * 4 jádra @ 2,5 GHz	16 GB	600 GB	Až 550 počítačů Předpokládá, že každý počítač má tři disky o velikosti 100 GB.

Tato omezení jsou založená na nastavení konfiguračního serveru pomocí šablony OVF.
Omezení předpokládají, že na konfiguračním serveru nepoužíváte procesový server, který je ve výchozím nastavení spuštěný.

Pokud potřebujete přidat nový konfigurační server, postupujte podle těchto pokynů:

Nastavte konfigurační server pro zotavení po havárii virtuálního počítače VMware pomocí šablony OVF.
Nastavte konfigurační server ručně pro fyzické servery nebo pro nasazení VMware, která nemůžou použít šablonu OVF.

Při nastavování konfiguračního serveru mějte na paměti, že:

Při nastavování konfiguračního serveru je důležité zvážit předplatné a trezor, ve kterém se nachází, protože po nastavení by se neměly měnit. Pokud potřebujete změnit trezor, musíte zrušit přidružení konfiguračního serveru z trezoru a znovu ho zaregistrovat. Tím se zastaví replikace virtuálních počítačů v trezoru.
Pokud chcete nastavit konfigurační server s více síťovými adaptéry, měli byste to udělat během nastavování. Po registraci konfiguračního serveru v trezoru to nejde udělat.

Nastavení procesového serveru

Kapacita procesového serveru je ovlivněna četností změn dat, a ne počtem počítačů povolených pro replikaci.

U rozsáhlých nasazení byste měli mít vždy alespoň jeden procesový server se škálováním na více systémů.
Pokud chcete zjistit, jestli potřebujete další servery, použijte následující tabulku.
Doporučujeme přidat server s nejvyšší specifikací.

PROCESOR	Paměť	Disk mezipaměti	Četnost změn
12 virtuálních procesorů 2 sokety*6 jader @ 2,5 GHz	24 GB	1 TB	Až 2 TB denně

Procesový server nastavte následujícím způsobem:

Projděte si požadavky.
Nainstalujte server na portál nebo z příkazového řádku.
Nakonfigurujte replikované počítače tak, aby používaly nový server. Pokud už máte počítače replikující:
- Na nový procesový server můžete přesunout celou úlohu procesového serveru.
- Případně můžete přesunout konkrétní virtuální počítače na nový procesový server.

Povolení rozsáhlé replikace

Po naplánování kapacity a nasazení požadovaných komponent a infrastruktury povolte replikaci pro velký počet virtuálních počítačů.

Seřaďte počítače do dávek. Povolíte replikaci virtuálních počítačů v rámci dávky a pak přejdete k další dávce.
- U virtuálních počítačů VMware můžete v sestavě Plánovač nasazení použít doporučenou velikost dávky virtuálního počítače.
- U fyzických počítačů doporučujeme identifikovat dávky na základě počítačů s podobnou velikostí a množstvím dat a dostupnou propustností sítě. Cílem je dávkové počítače, které pravděpodobně dokončí počáteční replikaci přibližně ve stejné době.
Pokud je četnost změn disku pro počítač vysoká nebo překračuje limity v nasazení, můžete přesunout nekritické soubory, které nepotřebujete replikovat (například výpisy protokolů nebo dočasné soubory) z počítače. U virtuálních počítačů VMware můžete tyto soubory přesunout na samostatný disk a pak tento disk vyloučit z replikace.
Před povolením replikace zkontrolujte, jestli počítače splňují požadavky na replikaci.
Nakonfigurujte zásady replikace pro virtuální počítače VMware nebo fyzické servery.
Povolte replikaci pro virtuální počítače VMware nebo fyzické servery. Tím se spustí počáteční replikace vybraných počítačů.

Monitorování nasazení

Po spuštění replikace pro první dávku virtuálních počítačů začněte monitorovat nasazení následujícím způsobem:

Přiřaďte správce zotavení po havárii, který bude monitorovat stav replikovaných počítačů.
Monitorujte události pro replikované položky a infrastrukturu.
Monitorujte stav procesových serverů se škálováním na více systémů.
Zaregistrujte se a získejte e-mailová oznámení o událostech, abyste si usnadnili monitorování.
Proveďte pravidelné postupy zotavení po havárii, abyste zajistili, že vše funguje podle očekávání.

Plánování rozsáhlých převzetí služeb při selhání

V případě havárie může být potřeba převzít služby při selhání velkého počtu počítačů nebo úloh do Azure. Připravte se na tento typ události následujícím způsobem.

Před převzetím služeb při selhání se můžete připravit následujícím způsobem:

Připravte infrastrukturu a virtuální počítače tak, aby vaše úlohy byly po převzetí služeb při selhání dostupné a aby uživatelé měli přístup k virtuálním počítačům Azure.
Všimněte si limitů převzetí služeb při selhání dříve v tomto dokumentu. Ujistěte se, že vaše převzetí služeb při selhání spadá do těchto limitů.
Spusťte pravidelné postupy zotavení po havárii. Podrobná analýza vám pomůže:
- Před převzetím služeb při selhání najděte mezery v nasazení.
- Odhad koncové rto pro vaše aplikace
- Odhad cíle cíle bodu obnovení pro vaše úlohy
- Identifikujte konflikty rozsahu IP adres.
- Při spouštění podrobností doporučujeme, abyste po každém přechodu k podrobnostem nepoužít produkční sítě a vyčistit testovací převzetí služeb při selhání.

Pokud chcete spustit rozsáhlé převzetí služeb při selhání, doporučujeme následující:

Vytvořte plány obnovení pro převzetí služeb při selhání úloh.
- Každý plán obnovení může aktivovat převzetí služeb při selhání až 100 počítačů.
- Přečtěte si další informace o plánech obnovení.
Přidejte skripty runbooku Azure Automation do plánů obnovení, abyste mohli automatizovat všechny ruční úlohy v Azure. Mezi typické úlohy patří konfigurace nástrojů pro vyrovnávání zatížení, aktualizace DNS atd. Další informace
Před převzetím služeb při selhání připravte počítače s Windows tak, aby vyhovovaly prostředí Azure. Limity převzetí služeb při selhání jsou vyšší pro počítače, které vyhovují. Přečtěte si další informace o runboocích.
Aktivace převzetí služeb při selhání pomocí rutiny PowerShellu Start-AzRecoveryServicesAsrPlannedFailoverJob společně s plánem obnovení

Další kroky

Monitorování Site Recovery

Sdílet prostřednictvím