Návrh pro zálohování a obnovení

Dokončeno

Organizace, jako je tailwind Traders, vyžadují vysokou míru spolehlivosti ze svých důležitých aplikací. Pokud chcete dosáhnout požadované spolehlivosti pro místní aplikace, je typické, že si koupíte více výpočetních prostředků, jako jsou servery a úložiště. Nákup dalších výpočetních prostředků vytváří redundanci do místní infrastruktury.

Je také důležité, aby všechny klíčové aplikace a související data byly obnovitelné po selhání v ideálním případě až k bodu selhání. Tato obnovitelnost je často poskytována zálohováním, obnovením komponent a postupy. Pro organizace s aplikacemi hostovanými v Azure nebo pro organizace s hybridními nasazeními aplikací existují další aspekty a možnosti.

Spolehlivé aplikace jsou:

  • Odolnost vůči selhání komponent.

  • Vysoká dostupnost a může běžet v dobrém stavu bez významného výpadku.

Abyste dosáhli požadované odolnosti a vysoké dostupnosti, musíte nejprve definovat své požadavky.

Poznámka:

Tento modul použije termín odolnosti jako schopnost systému elegantně zpracovávat a zotavit se z chyb, a to jak neúmyslně, tak zlými úmysly.

Definice požadavků

Definování požadavků zahrnuje:

  • Identifikace obchodních potřeb

  • Vytvoření plánu odolnosti, který bude tyto potřeby řešit.

Pokyny k tomuto procesu najdete v následující tabulce.

Aspekty Popis
Jaké jsou vaše úlohy a jejich využití? Pod pojmem úloha rozumíme oddělenou funkci nebo výpočetní úkol, které je možné logicky oddělit od ostatních úloh z hlediska logiky procesů a požadavků na úložiště. Každá úloha má pravděpodobně různé požadavky na dostupnost, škálovatelnost, konzistenci dat a zotavení po havárii.
Jaké jsou vzory využití pro vaše úlohy? Vzory použití můžou určovat vaše požadavky. Identifikujte rozdíly v požadavcích během kritických i nekritických období. Pokud chcete zajistit dobu provozu, naplánujte redundanci napříč několika oblastmi v případě selhání jedné oblasti. Pokud chcete naopak minimalizovat náklady během nekritických období, můžete aplikaci spustit v jedné oblasti.
Jaké jsou metriky dostupnosti? Střední doba obnovení (MTTR) a střední doba mezi selháními (MTBF) jsou obvykle používané metriky. Střední doba mezi poruchami (MTBF) představuje dobu, jak dlouho se u komponenty dá přiměřeně očekávat, že vydrží mezi výpadky. Střední doba obnovení (MTTR) je průměrná doba potřebná pro obnovení komponenty po selhání. Pomocí těchto metrik můžete určit, kde potřebujete přidat redundanci, a určit smlouvy o úrovni služeb (SLA) pro zákazníky.
Jaké jsou metriky obnovení? Cíl doby obnovení (RTO) je maximální přijatelná doba, po které může být jedna z vašich aplikací nedostupná po incidentu. Cíl bodu obnovení (RPO) je maximální doba trvání ztráty dat, která je přijatelná během havárie. Zvažte také cíl na úrovni obnovení (RLO). Tato metrika určuje členitost obnovení. Jinými slovy, jestli musíte být schopni obnovit serverovou farmu, webovou aplikaci, web nebo jenom určitou položku. Pokud chcete tyto hodnoty určit, proveďte posouzení rizik. Ujistěte se, že rozumíte nákladům a rizikům výpadků nebo ztrát dat ve vaší organizaci.
Jaké jsou cíle dostupnosti úloh? Pokud chcete zajistit, aby architektura vaší aplikace splňovala vaše obchodní požadavky, definujte cílové smlouvy SLA pro každou úlohu. Kromě závislostí aplikací vezměte v úvahu náklady a složitost splnění požadavků na dostupnost.
Jaké jsou vaše smlouvy SLA? Smlouva SLA v Azure popisuje závazky společnosti Microsoft týkající se dostupnosti a konektivity. Pokud je pro konkrétní službu uzavřena smlouva SLA s 99,9 %, znamená to, že máte právo očekávat dostupnost služby v 99,9 % času.

Tip

Pokud MTTR jakékoli kritické komponenty ve scénáři s vysokou dostupností překročí plánovanou dobu obnovení systému, může selhání v systému způsobit nepřijatelné narušení podnikání. Jinými slovy, systém nemůžete obnovit v rámci definované rto.

Definujte vlastní cílové smlouvy SLA pro každou úlohu v řešení zodpovězením předchozích otázek. To pomáhá zajistit, aby architektura splňovala vaše obchodní požadavky. Pokud například úloha vyžaduje 99,99% dobu provozu, ale závisí na službě s 99,9% smlouvou SLA, nemůže být tato služba jediným bodem selhání v systému.

Po definování požadavků na obnovení můžete vybrat vhodné technologie obnovení.