Sdílet prostřednictvím


Plánování kapacity s využitím Azure Site Recovery

Jako organizace je nezbytné přijmout strategii provozní kontinuity a zotavení po havárii (BCDR), která během plánovaných a neplánovaných výpadků zajistí bezpečnost vašich dat, dostupné aplikace a úlohy online.

Prostřednictvím replikace úloh virtuálních počítačů z primární lokality do sekundárního umístění poskytuje Azure Site Recovery ve službě Azure Stack Hub služby, které mohou podporovat bezpečnost dat organizace, dostupnosti aplikací a úloh během výpadků. Pokud například dojde k výpadku v primární lokalitě, převezmete služby při selhání do sekundárního umístění pro přístup k vašim aplikacím. Jakmile bude primární lokalita znovu spuštěná, můžete ji vrátit po obnovení. Další informace najdete v tématu Informace o Site Recovery.

Pokud chcete povolit replikaci virtuálních počítačů mezi dvěma kolky služby Azure Stack Hub, nakonfigurujete dvě prostředí:

  • Zdrojové prostředí:
    • Razítko služby Azure Stack Hub, kde běží virtuální počítače tenanta.
  • Cílové prostředí:
    • Kde běží poskytovatel prostředků Azure Site Recovery.

Snímek replikace virtuálních počítačů mezi dvěma kolky služby Azure Stack Hub

Důležitou součástí úspěchu plánu provozní kontinuity a zotavení po havárii je plánování kapacity. Při plánování kapacity je potřeba zvážit několik faktorů:

  • Cíle doby obnovení (RTO) a cíle bodu obnovení (RPO) pro konkrétní úlohy, které chcete chránit.

  • Úlohy a charakteristiky aplikace:

    • Jak často se data v rámci příslušného virtuálního počítače mění.
    • Kolik dat se vygeneruje nebo odebere?
    • Jak vypadá návrh aplikace a další?
  • Velikosti virtuálních počítačů, počet disků a způsob, jakým jsou jednotlivé virtuální počítače svázány s jinými virtuálními počítači.

    • V případě řešení, která vyžadují několik virtuálních počítačů, zjistěte, v jakém pořadí je potřeba tyto virtuální počítače spustit.
  • Šířka pásma sítě mezi zdrojovým a cílovým prostředím Tato komponenta může mít vliv na RPO.

Každý z těchto bodů je důležitý a má při vytváření plánu BCDR široký dopad.

V následujících částech jsou uvedeny hlavní body, které je potřeba zvážit z hlediska Site Recovery Azure. Každý plán BCDR je jiný a je založený na specifikách úloh, které chcete chránit. Tento seznam proto není vyčerpávající.

Důležité informace o zdroji

Ve zdrojovém prostředí azure Stack Hub spouští zařízení virtuálního počítače Azure Site Recovery. Virtuální počítač je Standard_DS4_v2 (8 virtuálních procesorů, 28 GB paměti, 32 datových disků), který běží v uživatelském předplatném služby Azure Stack Hub.

Ve zdrojovém prostředí zvažte následující oblasti:

  • Kvóty:

    • Měli byste mít dostatečnou kvótu pro vytvoření zařízení virtuálního počítače Azure Site Recovery. Potřebujete jednu nebo více v závislosti na celkovém plánu.
  • Úložiště pro zařízení virtuálních počítačů Azure Site Recovery:

    • Samotné zařízení virtuálního počítače Azure Site Recovery má požadavky na data definované velikostí virtuálního počítače.

    • Při plánování kapacity se ujistěte, že virtuální počítač zařízení má dostatek úložiště pro uplatnění mechanismů navrácení služeb po obnovení a opětovné ochrany.

      Poznámka

      Pokud existují omezení úložiště, může navrácení služeb po obnovení a opětovná ochrana selhat s chybou Zpráva Došlo k vnitřní chybě . Uživatelé by měli zkontrolovat protokoly událostí na zařízení a potvrdit skutečnou chybu azure Resource Manager. Další informace najdete v tématu Známé problémy s Azure Site Recovery.

  • Šířka pásma:

    • Počáteční replikace generuje velké využití šířky pásma.
    • Změny na jednotlivých virtuálních počítačích se replikují v závislosti na zásadách replikace a jednotlivých typech aplikace.

Důležité informace o cíli

V cílovém prostředí existují dvě části, které je potřeba zvážit při plánování kapacity:

  • Požadavky na službu Azure Site Recovery: kolik se spotřebuje ke spuštění Azure Site Recovery, aniž by bylo nutné chránit jakékoli úlohy.

  • Požadavky na chráněné úlohy

Cílové prostředí vyžaduje vytvoření jednoho trezoru Azure Site Recovery pro každé Site Recovery zařízení, aby bylo možné chránit virtuální počítače před zdrojem (jedno zařízení na trezor). I když se nejedná o omezení z hlediska kapacity, měli byste to vzít v úvahu při plánování návrhu celkového prostředí.

Prostředky Azure Site Recovery RP

Instalace Azure Site Recovery ve službě Azure Stack Hub vyžaduje instalaci poskytovatele prostředků Site Recovery.

Poznámka

S Microsoft.SiteRecovery-1.2301.2216.2287 azure Site Recovery ve službě Azure Stack Hub nevyžaduje službu Event Hubs jako závislost.

Snímek obrazovky se třemi službami pro instalaci Azure Site Recovery ve službě Azure Stack Hub

Tato služba je vytvořená v předplatném pro správu služby Azure Stack Hub a spravuje ji samotný Azure Stack Hub, takže se nevyžaduje žádná konfigurace. Stejně jako u jakékoli služby však tyto prostředky spotřebovávají paměť, úložiště a mají přidělené určité virtuální procesory:

Služba Virtuální jádro Memory (Paměť) Velikost disku
Azure Site Recovery 12 42 GB 1,4 TB

Poznámka

Tyto prostředky jsou služby Azure Stack Hub na straně správy služby Azure Stack Hub. Po instalaci spravuje tyto prostředky platforma.

Chráněné úlohy

Při vytváření plánu BCDR zvažte všechny aspekty chráněných úloh. Následující seznam není úplný a měl by být považován za výchozí bod:

  • Velikost virtuálního počítače, počet disků, velikost disku, IOPS, četnost změn dat a vytvořená nová data

  • Aspekty šířky pásma sítě:

    • Šířka pásma sítě vyžadovaná pro rozdílovou replikaci
    • Velikost propustnosti cílového prostředí, kterou azure Site Recovery může získat ze zdrojového prostředí.
    • Počet virtuálních počítačů, které mají být v dávce najednou. Toto číslo vychází z odhadované šířky pásma pro dokončení počáteční replikace v daném čase.
    • Cíl bodu obnovení, kterého lze dosáhnout pro danou šířku pásma.
    • Vliv na požadovaný cíl bodu obnovení, pokud je zřízena menší šířka pásma.
  • Důležité informace o úložišti:

    • Kolik dat je potřeba pro počáteční replikaci.
    • Kolik bodů obnovení se uchovává a jak se v těchto intervalech zvyšuje počet dat pro každý chráněný virtuální počítač.
    • Kolik kvót je potřeba přiřadit cílovým uživatelským předplatným služby Azure Stack Hub, aby uživatelé měli dostatečné přidělení.
    • Účet úložiště mezipaměti pro replikaci.
  • Důležité informace o výpočetních prostředcích:

    • Když dojde k převzetí služeb při selhání, virtuální počítače se spustí v cílových uživatelských předplatných služby Azure Stack Hub. Aby bylo možné tyto prostředky virtuálních počítačů spustit, musí být přiděleno dostatek kvót.
    • Pokud je během ochrany virtuálního počítače aktivní ve zdrojovém prostředí, v cílovém prostředí se nevyužívají žádné prostředky související s virtuálními počítači, jako jsou virtuální procesory, paměť atd. Tyto prostředky se stanou relevantními pouze během procesu převzetí služeb při selhání, jako je testovací převzetí služeb při selhání.

Pro rozsah Azure Site Recovery ve službě Azure Stack Hub je tady výchozí bod pro výpočty, zejména pro použitý účet úložiště mezipaměti:

  1. Pokud dojde k převzetí služeb při selhání, během normálních operací vynásobte počet disků replikovaných průměrným RPO. Můžete mít například (2 MB × 250s). Účet úložiště mezipaměti obvykle činí několik kB až 500 MB na disk.

  2. Pokud dojde k převzetí služeb při selhání, v nejhorším případě vynásobte počet disků replikovaných průměrným RPO za celý den.

    Důležité

    Pokud některé části Site Recovery Azure nefungují, ale jiné fungují, může účet úložiště obsahovat maximálně jeden den rozdílu, než se Azure Site Recovery rozhodne o vypršení časového limitu.

  3. Navrácení služeb po obnovení do nového virtuálního počítače. Vypočítejte součet velikosti disků v každé dávce.

    • Celý disk se musí zkopírovat do účtu úložiště mezipaměti, aby se použil cílový virtuální počítač, protože cílem je prázdný disk.
    • Přidružená data se po zkopírování odstraní, ale při součtu všech velikostí disků pravděpodobně dojde ke špičce využití.

Vytvořte plán BDCR na základě specifik řešení, které se pokoušíte chránit.

Následující tabulka obsahuje příklad testů spuštěných v našich prostředích. Tento přehled můžete použít k získání směrného plánu pro vlastní aplikaci, ale každá úloha se liší:

Konfigurace

Velikost bloku Propustnost/disk
2 MB 2 MB/s
64 kB 2 MB/s
8 kB 1 MB/s
8 kB 2 MB/s

Výsledek

Počet podporovaných disků Celková propustnost Ops celkem Překážkou
68 136 MB/s 68 úložiště
60 120 MB/s 2 048 úložiště
28 28 MB/s 3584 Procesor a paměť Azure Site Recovery
16 32 MB/s 4 096

Poznámka

8 kB je nejmenší velikost bloku dat, která Azure Site Recovery podporuje. Všechny změny menší než 8 kB se považují za 8 kB.

Pro další testování jsme vygenerovali konzistentní typ úlohy. například konzistentní změny úložiště v blocích o velikosti 8 kB, které mají celkovou velikost až 1 MB/s na disk. Tento scénář není u reálného zatížení pravděpodobný, protože ke změnám může dojít v různou denní dobu nebo ve špičkách různých velikostí.

Abychom mohli replikovat tyto náhodné vzory, otestovali jsme také scénáře pomocí následujících funkcí:

  • 120 virtuálních počítačů (80 Windows, 40 Linux) chráněných prostřednictvím stejného zařízení virtuálních počítačů Azure Site Recovery.
    • Každý virtuální počítač generuje v náhodných intervalech, alespoň dvakrát za hodinu, náhodné bloky s celkovým počtem 5 GB dat v pěti souborech.

    • Replikace proběhla úspěšně napříč všemi 120 virtuálními počítači s nízkým až středním zatížením služeb Azure Site Recovery.

      Poznámka

      Tato čísla by měla být použita pouze jako směrný plán. Nemusí se škálovat lineárně. Přidání další dávky se stejným počtem virtuálních počítačů může mít menší dopad než počáteční dávka. Výsledky jsou do značné míry závislé na typu použitých úloh.

Jak byste měli plánovat a testovat

Aplikace a úlohy řešení mají určité požadavky na plánovanou dobu obnovení (RTO) a cíl bodu obnovení (RPO). Efektivní návrh provozní kontinuity a zotavení po havárii (BCDR) využívá možnosti na úrovni platformy, které tyto požadavky splňují, protože používáme mechanismy specifické pro řešení. Při návrhu funkcí BCDR zachyťte požadavky platformy na zotavení po havárii (DR) a při návrhu vezměte v úvahu všechny tyto faktory:

  • Požadavky na dostupnost aplikací a dat:

    • Požadavky na plánovanou dobu obnovení (RTO) a RPO pro jednotlivé úlohy
    • Podpora vzorů dostupnosti aktivní-aktivní a aktivní-pasivní.
  • Podpora nasazení ve více oblastech pro převzetí služeb při selhání s blízkosti komponent pro zajištění výkonu Během výpadku může docházet k operacím aplikace s omezenou funkčností nebo sníženým výkonem.

    Poznámka

    Aplikace může nativně vědět, že se má spouštět, nebo mít určité komponenty, které jsou schopné spustit v několika prostředích služby Azure Stack Hub. V takovém případě můžete azure Site Recovery použít k replikaci pouze virtuálních počítačů s komponentami, které tuto funkci nemají, například řešení typu front-end nebo back-end, ve kterém můžete nasadit front-end napříč prostředími služby Azure Stack Hub.

  • Nepoužívejte překrývající se rozsahy IP adres v produkčních sítích a sítích pro zotavení po havárii.

    • Produkční sítě a sítě zotavení po havárii, které mají překrývající se IP adresy, vyžadují proces převzetí služeb při selhání, který může komplikovat a zpozdit převzetí služeb při selhání aplikace. Pokud je to možné, naplánujte si síťovou architekturu BCDR, která poskytuje souběžné připojení ke všem lokalitám.
  • Určení velikosti cílových prostředí:

    • Pokud zdroj a cíl používáte způsobem 1:1, přidělte v cílovém prostředí o něco více úložiště. Důvodem je způsob, jakým probíhá historie záložek disku. Toto přidělení není 2x vyšší, protože zahrnuje pouze změny dat. V závislosti na typu dat a očekávaných změnách a zásadách replikace, které mají v cíli 1,5x až 2x větší úložiště, zajistí, že procesy převzetí služeb při selhání nebudou mít žádné obavy.
    • Můžete zvážit, že cílové prostředí Služby Azure Stack Hub bude cílem více zdrojů služby Azure Stack Hub. V tomto případě snižujete celkové náklady, ale musíte naplánovat, co se stane, když určité úlohy budou mimo provoz. například který zdroj musí mít nastavenou prioritu.
    • Pokud se vaše cílové prostředí používá ke spouštění jiných úloh, plán BCDR musí zahrnovat chování těchto úloh. V cílovém prostředí můžete například spustit virtuální počítače pro vývoj/testování, a pokud dojde k problému se zdrojovým prostředím, můžete vypnout všechny virtuální počítače v cíli, abyste zajistili, že budou k dispozici dostatečné prostředky pro spuštění chráněných virtuálních počítačů.

Bcdr byste měli testovat a pravidelně je ověřovat. Můžete to provést pomocí procesů testovacího převzetí služeb při selhání nebo přesunutím celých úloh, aby se toky ověřily od konce do konce.

Další kroky

Azure Site Recovery ve službě Azure Stack Hub