Nastavení zotavení po havárii ve velkém pro virtuální počítače VMware nebo fyzické servery

Tento článek popisuje, jak nastavit zotavení po havárii do Azure pro velký počet (>1000) místních virtuálních počítačů VMware nebo fyzických serverů v produkčním prostředí pomocí služby Azure Site Recovery.

Definování strategie BCDR

V rámci strategie provozní kontinuity a zotavení po havárii (BCDR) definujete cíle bodů obnovení (RPO) a cíle doby obnovení (RTO) pro vaše obchodní aplikace a úlohy. Plánovaná doba obnovení (RTO) měří dobu a úroveň služby, během které je potřeba obnovit a zpřístupnit obchodní aplikaci nebo proces, aby se zabránilo problémům s kontinuitou.

  • Site Recovery poskytuje průběžnou replikaci pro fyzické servery a virtuální počítače VMware a smlouvu SLA pro plánovanou dobu obnovení.
  • Při plánování rozsáhlého zotavení po havárii virtuálních počítačů VMware a zjištění potřebných prostředků Azure můžete zadat hodnotu RTO, která se použije pro výpočty kapacity.

Osvědčené postupy

Některé obecné osvědčené postupy pro zotavení po havárii ve velkém měřítku. Tyto osvědčené postupy jsou podrobněji popsány v dalších částech dokumentu.

  • Identifikace cílových požadavků: Před nastavením zotavení po havárii odhadněte kapacitu a potřeby prostředků v Azure.
  • Plánování Site Recovery komponent: Zjistěte, jaké komponenty Site Recovery (konfigurační server, procesové servery) potřebujete, abyste splnili odhadovanou kapacitu.
  • Nastavte jeden nebo více procesových serverů se škálováním na více instancí: Nepoužívejte procesový server, který běží ve výchozím nastavení na konfiguračním serveru.
  • Spouštění nejnovějších aktualizací: Tým Site Recovery pravidelně vydává nové verze komponent Site Recovery a měli byste se ujistit, že používáte nejnovější verze. Abyste s tím mohli pomoct, sledujte novinky aktualizací a povolujte a instalujte aktualizace hned, jak je vydávají.
  • Monitorování proaktivně: Při zprovoznění zotavení po havárii byste měli proaktivně monitorovat stav replikovaných počítačů a prostředků infrastruktury.
  • Postupy zotavení po havárii: Postupy zotavení po havárii byste měli spouštět pravidelně. Tyto možnosti nemají vliv na produkční prostředí, ale pomáhají zajistit, aby převzetí služeb při selhání do Azure fungovalo v případě potřeby podle očekávání.

Shromáždění informací o plánování kapacity

Shromážděte informace o místním prostředí, které vám pomůžou vyhodnotit a odhadnout potřeby cílové kapacity (Azure).

  • V případě VMware to provedete spuštěním Plánovače nasazení pro virtuální počítače VMware.
  • U fyzických serverů shromážděte informace ručně.

Spuštění Plánovače nasazení pro virtuální počítače VMware

Plánovač nasazení vám pomůže shromáždit informace o místním prostředí VMware.

  • Plánovač nasazení spusťte během období, které představuje typickou četnost změn pro vaše virtuální počítače. Tím se vygenerují přesnější odhady a doporučení.
  • Plánovač nasazení doporučujeme spustit na počítači konfiguračního serveru, protože Planner vypočítá propustnost ze serveru, na kterém běží. Přečtěte si další informace o měření propustnosti.
  • Pokud ještě nemáte nastavený konfigurační server:

Pak spusťte Planner následujícím způsobem:

  1. Přečtěte si o Plánovači nasazení. Nejnovější verzi si můžete stáhnout z portálu nebo přímo.
  2. Projděte si požadavky a nejnovější aktualizace plánovače nasazení a stáhněte a extrahujte nástroj.
  3. Spusťte Plánovač nasazení na konfiguračním serveru.
  4. Generování sestavy pro shrnutí odhadů a doporučení
  5. Analyzujte doporučení sestav a odhady nákladů.

Poznámka

Ve výchozím nastavení je nástroj nakonfigurovaný tak, aby profiloval a vygeneroval sestavu až pro 1 000 virtuálních počítačů. Tento limit můžete změnit zvýšením hodnoty klíče MaxVMsSupported v souboru ASRDeploymentPlanner.exe.config.

Požadavky na plán cíle (Azure) a kapacita

Pomocí shromážděných odhadů a doporučení můžete plánovat cílové prostředky a kapacitu. Pokud jste spustili Plánovač nasazení pro virtuální počítače VMware, můžete použít řadu doporučení sestav , která vám pomůžou.

  • Kompatibilní virtuální počítače: Toto číslo použijte k určení počtu virtuálních počítačů, které jsou připravené na zotavení po havárii do Azure. Doporučení týkající se šířky pásma sítě a jader Azure vycházejí z tohoto čísla.
  • Požadovaná šířka pásma sítě: Poznamenejte si šířku pásma, kterou potřebujete pro rozdílovou replikaci kompatibilních virtuálních počítačů.
    • Při spuštění Planneru zadáte požadovaný cíl bodu obnovení během několika minut. Doporučení ukazují šířku pásma potřebnou ke splnění tohoto cíle bodu obnovení 100 % a 90 % času.
    • Doporučení pro šířku pásma sítě berou v úvahu šířku pásma potřebnou pro celkový počet konfiguračních a procesních serverů doporučených v Planneru.
  • Požadovaná jádra Azure: Poznamenejte si počet jader, která potřebujete v cílové oblasti Azure, na základě počtu kompatibilních virtuálních počítačů. Pokud nemáte dostatek jader, Site Recovery při převzetí služeb při selhání nebude moct vytvořit požadované virtuální počítače Azure.
  • Doporučená velikost dávky virtuálního počítače: Doporučená velikost dávky vychází z možnosti dokončit počáteční replikaci dávky ve výchozím nastavení během 72 hodin při splnění cíle bodu obnovení na 100 %. Hodnotu hodiny je možné upravit.

Tato doporučení můžete využít k plánování prostředků Azure, šířky pásma sítě a dávkování virtuálních počítačů.

Plánování předplatných a kvót Azure

Chceme zajistit, aby dostupné kvóty v cílovém předplatném byly dostatečné pro převzetí služeb při selhání.

Úkol Podrobnosti Akce
Kontrola jader Pokud se jádra v dostupné kvótě nerovnají celkovému počtu cílů v době převzetí služeb při selhání nebo je překračují, převzetí služeb při selhání selže. V případě virtuálních počítačů VMware zkontrolujte, že máte v cílovém předplatném dostatek jader pro splnění doporučení plánovače nasazení.

U fyzických serverů zkontrolujte, že jádra Azure splňují ruční odhady.

Pokud chcete zkontrolovat kvóty, klikněte v Azure Portal >Předplatné na Využití a kvóty.

Přečtěte si další informace o zvýšení kvót.
Kontrola limitů převzetí služeb při selhání Počet převzetí služeb při selhání nesmí překročit Site Recovery limity převzetí služeb při selhání. Pokud převzetí služeb při selhání překročí limity, můžete přidat předplatná a převzít služby při selhání do více předplatných nebo zvýšit kvótu předplatného.

Omezení převzetí služeb při selhání

Limity určují počet převzetí služeb při selhání podporovaných Site Recovery během jedné hodiny za předpokladu, že na počítač jsou tři disky.

Co znamená dodržování předpisů? Azure ke spuštění virtuálního počítače Azure vyžaduje, aby některé ovladače byly ve stavu spuštění a služby jako DHCP musí být nastavené tak, aby se spouštěly automaticky.

  • Počítače, které vyhovují předpisům, už tato nastavení mají.
  • U počítačů s Windows můžete proaktivně kontrolovat dodržování předpisů a v případě potřeby je nastavit jako vyhovující. Další informace.
  • Počítače s Linuxem jsou do souladu pouze v době převzetí služeb při selhání.
Počítač vyhovuje Azure? Limity virtuálních počítačů Azure (převzetí služeb při selhání spravovaného disku)
Yes 2000
No 1000
  • Omezení předpokládají, že v cílové oblasti pro předplatné probíhá minimální počet dalších úloh.
  • Některé oblasti Azure jsou menší a můžou mít o něco nižší limity.

Plánování infrastruktury a připojení virtuálních počítačů

Po převzetí služeb při selhání do Azure potřebujete, aby vaše úlohy fungovaly stejně jako v místním prostředí a umožňovaly uživatelům přístup k úlohám běžícím na virtuálních počítačích Azure.

Plánování zdrojové kapacity a požadavků

Je důležité, abyste měli dostatek konfiguračních serverů a procesových serverů se škálováním na více systémů, abyste splnili požadavky na kapacitu. Při zahájení nasazení ve velkém měřítku začněte s jedním konfiguračním serverem a jedním procesovým serverem se škálováním na více systémů. Jakmile dosáhnete předepsaného limitu, přidejte další servery.

Poznámka

Plánovač nasazení pro virtuální počítače VMware poskytuje několik doporučení ohledně konfiguračních a procesních serverů, které potřebujete. Místo doporučení Plánovače nasazení doporučujeme používat tabulky zahrnuté v následujících postupech.

Nastavení konfiguračního serveru

Na kapacitu konfiguračního serveru má vliv počet replikovaných počítačů, nikoli četnost změn dat. Pokud chcete zjistit, jestli potřebujete další konfigurační servery, použijte tato definovaná omezení virtuálních počítačů.

Procesor Memory (Paměť) Disk mezipaměti Limit replikovaných počítačů
8 virtuálních procesorů
2 sokety × 4 jádra při 2,5 GHz
16 GB 600 GB Až 550 počítačů
Předpokládá, že každý počítač má tři disky o velikosti 100 GB.
  • Tato omezení jsou založená na nastavení konfiguračního serveru pomocí šablony OVF.
  • Limity předpokládají, že nepoužíváte procesový server, který je na konfiguračním serveru spuštěný ve výchozím nastavení.

Pokud potřebujete přidat nový konfigurační server, postupujte podle těchto pokynů:

Při nastavování konfiguračního serveru mějte na paměti, že:

  • Při nastavování konfiguračního serveru je důležité vzít v úvahu předplatné a trezor, ve kterém se nachází, protože by se po nastavení neměly měnit. Pokud potřebujete trezor změnit, musíte zrušit přidružení konfiguračního serveru k trezoru a znovu ho zaregistrovat. Tím se zastaví replikace virtuálních počítačů v trezoru.
  • Pokud chcete nastavit konfigurační server s více síťovými adaptéry, měli byste to udělat během nastavování. Po registraci konfiguračního serveru v trezoru to nejde udělat.

Nastavení procesového serveru

Na kapacitu procesového serveru má vliv četnost změn dat, nikoli počet počítačů s povolenou replikací.

  • U rozsáhlých nasazení byste vždy měli mít alespoň jeden procesový server se škálováním na více systémů.
  • Pokud chcete zjistit, jestli potřebujete další servery, použijte následující tabulku.
  • Doporučujeme přidat server s nejvyšší specifikací.
Procesor Memory (Paměť) Disk mezipaměti Četnost změn
12 vCPU
2 sokety*6 jader @ 2,5 GHz
24 GB 1 TB Až 2 TB denně

Procesový server nastavte následujícím způsobem:

  1. Projděte si požadavky.
  2. Nainstalujte server na portálu nebo z příkazového řádku.
  3. Nakonfigurujte replikované počítače tak, aby používaly nový server. Pokud už máte počítače, které se replikují:
    • Na nový procesový server můžete přesunout celou úlohu procesového serveru.
    • Případně můžete přesunout konkrétní virtuální počítače na nový procesový server.

Povolení replikace ve velkém měřítku

Po naplánování kapacity a nasazení požadovaných komponent a infrastruktury povolte replikaci pro velký počet virtuálních počítačů.

  1. Seřaďte počítače do dávek. Povolíte replikaci virtuálních počítačů v rámci dávky a pak přejdete k další dávce.

    • U virtuálních počítačů VMware můžete v sestavě Plánovače nasazení použít doporučenou velikost dávky virtuálních počítačů.
    • U fyzických počítačů doporučujeme určit dávky na základě počítačů s podobnou velikostí a objemem dat a podle dostupné propustnosti sítě. Cílem je dávkovat počítače, které pravděpodobně dokončí počáteční replikaci přibližně ve stejném čase.
  2. Pokud je četnost změn disků pro počítač vysoká nebo překračuje limity v části NasazeníPlánner, můžete přesunout nekritické soubory, které nepotřebujete replikovat (například výpisy protokolů nebo dočasné soubory), z počítače. V případě virtuálních počítačů VMware můžete tyto soubory přesunout na samostatný disk a pak tento disk vyloučit z replikace.

  3. Před povolením replikace zkontrolujte, jestli počítače splňují požadavky na replikaci.

  4. Nakonfigurujte zásady replikace pro virtuální počítače VMware nebo fyzické servery.

  5. Povolte replikaci pro virtuální počítače VMware nebo fyzické servery. Tím se pro vybrané počítače spustí počáteční replikace.

Monitorování nasazení

Po zahájení replikace první dávky virtuálních počítačů začněte monitorovat nasazení následujícím způsobem:

  1. Přiřaďte správce zotavení po havárii, který bude monitorovat stav replikovaných počítačů.
  2. Monitorujte události replikovaných položek a infrastruktury.
  3. Monitorujte stav procesových serverů se škálováním na více instancí.
  4. Zaregistrujte se, abyste dostávali e-mailová oznámení o událostech, abyste usnadnili monitorování.
  5. Provádějte pravidelné postupy zotavení po havárii, abyste měli jistotu, že všechno funguje podle očekávání.

Plánování převzetí služeb při selhání ve velkém měřítku

V případě havárie možná budete muset převzít služby při selhání velkého počtu počítačů nebo úloh do Azure. Připravte se na tento typ události následujícím způsobem.

Na převzetí služeb při selhání se můžete předem připravit následujícím způsobem:

  • Připravte infrastrukturu a virtuální počítače tak, aby vaše úlohy byly dostupné po převzetí služeb při selhání a aby uživatelé měli přístup k virtuálním počítačům Azure.
  • Všimněte si limitů převzetí služeb při selhání výše v tomto dokumentu. Ujistěte se, že vaše převzetí služeb při selhání bude spadat do těchto limitů.
  • Pravidelně provádět postupy zotavení po havárii. Postupy pomáhají:
    • Zjistěte mezery v nasazení před převzetím služeb při selhání.
    • Odhad koncové doby obnovení (RTO) pro vaše aplikace
    • Odhad kompletního cíle bodu obnovení (RPO) pro vaše úlohy
    • Identifikujte konflikty rozsahů IP adres.
    • Při spouštění nácviků doporučujeme nepoužívat produkční sítě pro nácviky a vyčistit testovací převzetí služeb při selhání po každém nácviku.

Pokud chcete spustit převzetí služeb při selhání ve velkém měřítku, doporučujeme následující:

  1. Vytvořte plány obnovení pro převzetí služeb při selhání úloh.
  2. Přidání Azure Automation skriptů runbooků do plánů obnovení pro automatizaci ručních úloh v Azure Mezi typické úlohy patří konfigurace nástrojů pro vyrovnávání zatížení, aktualizace DNS atd. Další informace
  3. Před převzetím služeb při selhání připravte počítače s Windows tak, aby vyhovovaly prostředí Azure. Limity převzetí služeb při selhání jsou vyšší pro počítače, které vyhovují předpisům. Přečtěte si další informace o runboocích.
  4. Aktivujte převzetí služeb při selhání pomocí rutiny PowerShellu Start-AzRecoveryServicesAsrPlannedFailoverJob spolu s plánem obnovení.

Další kroky