Sdílet prostřednictvím


Zálohování a obnovení pro AKS

Zálohování a obnovení jsou důležitou součástí provozní strategie a strategie zotavení po havárii organizace. Plán zálohování a obnovení obvykle závisí na různorodé sadě technologií a postupů založených na pravidelném pořizování pravidelných kopií dat a aplikací do samostatného, sekundárního zařízení nebo služby. Pokud dojde k selhání systému, ztrátě dat nebo havárii, použijí se tyto kopie k obnovení dat a aplikací a obchodních operací, na kterých závisí.

Tato část provozní příručky azure Kubernetes Service (AKS) 2.2. den popisuje postupy zálohování a obnovení pro AKS.

Proč je zálohování clusteru AKS důležité

Vzhledem k tomu, že nasazení nativní pro cloud a Kubernetes stále roste, stává se stále důležitější, aby organizace zahrnuly clustery a úlohy Kubernetes do komplexní strategie zálohování a obnovení.

Implementace zálohování a obnovení v AKS umožňuje:

  • Vytvořte sekundární kopii konfigurace a dat z clusteru AKS, která se použije, pokud dojde k nevratnému selhání systému, ztrátě dat nebo havárii.
  • Zkopírujte prostředky Kubernetes a data aplikací z jednoho clusteru AKS do jiného.
  • Replikujte cluster AKS a vytvořte další prostředí.
  • Pořiďte snímky úloh před operacemi údržby, jako jsou upgrady verzí AKS.
  • Dodržování požadavků na ochranu dat pro zachování dodržování právních předpisů nebo dodržování předpisů organizace
  • Pokud se zjistí problém s nedávným nasazením nebo změnou, můžete se rychle vrátit k předchozímu nasazení.

Zálohy vám sice pomůžou obnovit úlohu, pokud dojde k problému, ale neposkytují vysokou dostupnost (HA).

Pokud jde o vysokou dostupnost uvnitř oblastí a zotavení po havárii mezi oblastmi v AKS, můžete zvážit několik dalších možností, například:

  • Zóny dostupnosti: AKS podporuje použití zón dostupnosti, které jsou fyzicky oddělená datacentra v rámci oblasti Azure. Nasazením clusterů AKS napříč několika zónami dostupnosti můžete zajistit vyšší odolnost a odolnost proti chybám v rámci oblasti. To umožňuje, aby vaše aplikace zůstaly funkční, i když dojde k výpadku jedné zóny.
  • Možnosti redundance trvalých svazků: AKS poskytuje různé možnosti redundance pro trvalé svazky. Ovladač CSI disku Azure pro Kubernetes podporuje integrované třídy úložiště a vlastní třídy úložiště, které používají místně redundantní úložiště (LRS) nebo zónově redundantní úložiště (ZRS) pro lepší odolnost uvnitř oblastí. Další informace naleznete v tématu Parametry ovladače.
  • Azure Kubernetes Fleet Manager: Azure Kubernetes Fleet Manager umožňuje pro clustery AKS více clusterů a scénářů napříč oblastmi ve více oblastech.
  • Možnosti geografické redundance pro Azure Container Registry (ACR): Azure Container Registry (ACR) nabízí možnosti geografické replikace. Díky geografické redundanci se image kontejnerů replikují napříč různými oblastmi Azure. Takže i když dojde k výpadku konkrétní oblasti, jsou vaše image k dispozici, což poskytuje vyšší dostupnost registru kontejneru.

K rychlému opětovnému nasazení úloh v případě havárie můžete použít také metodologie, jako je infrastruktura jako kód (IaC), Azure Pipelines, GitOps a Flux.

Další informace o těchto metodologiích najdete v těchto článcích:

Co se zálohuje

Při zvažování zálohování a obnovení pro clustery AKS a Kubernetes je obecně důležité určit, které komponenty by se měly zahrnout do zálohy, aby se zajistilo úspěšné obnovení. Tyto kritické komponenty se primárně skládají z těchto:

  • Stav clusteru: Odkazuje na aktuální a požadovanou konfiguraci nebo stav všech objektů Kubernetes v clusteru. Zahrnuje různé objekty, jako jsou nasazení, pody, služby a další. Stav clusteru je uložený v databázi páru klíč-hodnota s vysokou dostupností atd., která je často přístupná jenom ze serveru rozhraní API, stejně jako u spravovaných clusterů, jako je AKS. Stav clusteru je definován deklarativním způsobem a je výsledkem všech konfiguračních souborů Kubernetes použitých v clusteru, jako jsou manifesty YAML.

  • Data aplikace: Odkazuje na data vytvořená, spravovaná nebo přístupná kontejnerizovanými úlohami spuštěnými v rámci clusteru. Aby se zajistila trvalost dat napříč podem nebo restartováním kontejneru, Kubernetes doporučuje ukládat data aplikací do trvalých svazků. Tyto svazky je možné vytvářet staticky nebo dynamicky a mohou být podporovány různými typy trvalého úložiště, které nabízejí flexibilitu a škálovatelnost pro požadavky na ukládání a správu dat.

I když by úplné zálohování clusteru vyžadovalo zahrnutí dat o stavu clusteru i aplikací do jedné jednotky, určení optimálního rozsahu jednotlivých záloh závisí na různých faktorech. Například přítomnost alternativních zdrojů, jako jsou kanály kontinuální integrace a průběžného doručování (CI/CD), může usnadnit obnovení stavu clusteru. Velikost dat aplikace navíc hraje roli v nákladech na úložiště a čas potřebný pro operace zálohování a obnovení.

Ideální strategie zálohování a obnovení vysoce závisí na konkrétní aplikaci a prostředí. Proto by se měl rozsah zálohy posoudit případ od případu. Měl by také zvážit faktory, jako je důležitost stavu clusteru a objem aplikačních dat.

Cílení na jiné komponenty, jako jsou jednotlivé uzly clusteru (virtuální počítače) nebo místní systémy souborů a svazky, které jsou obvykle součástí tradičních plánů zálohování a obnovení pro serverové systémy, nejsou v Kubernetes relevantní. Relevantní stav a data se neuchovávají na jednotlivých uzlech nebo místních systémech souborů stejným způsobem jako tradiční systémy.

Úvod do možností zálohování a obnovení pro AKS

Mezi tradičními monolitickými aplikacemi a úlohami běžícími v clusteru Kubernetes existují rozdíly, které představují několik problémů se zálohováním a obnovením. Úlohy Kubernetes jsou záměrně navržené tak, aby byly vysoce dynamické a distribuované, přičemž data se uchovávají napříč externími trvalými svazky podporovanými několika podkladovými prostředky a službami.

K efektivní podpoře prostředí Kubernetes musí řešení zálohování a obnovení mít povědomí o Kubernetes a aplikacích. Měly by nabízet určitou míru automatizace, spolehlivosti a integrace, která se často nenachází ve starších nebo konvenčních nástrojích pro zálohování a obnovení.

K dispozici jsou různá řešení zálohování a obnovení nativní pro Kubernetes, která nabízejí různé modely licencování od open až po uzavřený zdroj.

Následuje několik příkladů řešení zálohování a obnovení, která můžete použít s AKS. Jedním z hlavních příkladů je plně spravované řešení Microsoftu, které se nazývá Azure Kubernetes Service (AKS), které poskytuje integrovanou službu Azure určenou pro zálohování a obnovení clusterů AKS a jejich úloh. Tento seznam není vyčerpávající a nabízí jenom několik dostupných možností.

Zálohování AKS

AKS Backup je nabídka Azure pro zálohování a obnovení clusterů AKS. Jedná se o jednoduchý nativní proces Azure, který umožňuje zálohovat a obnovovat kontejnerizované aplikace a data spuštěná v clusterech AKS.

Zálohování AKS umožňuje zálohování na vyžádání nebo naplánované zálohování plného nebo jemně odstupňovaného stavu clusteru a dat aplikací uložených v trvalých svazcích založených na discích Azure. Integruje se s Centrem zálohování Azure a poskytuje jednu oblast na webu Azure Portal, která vám pomůže řídit, monitorovat, provozovat a analyzovat zálohy ve velkém měřítku.

Podrobný popis fungování služby AKS Backup a jejích možností najdete v tématu O službě AKS Backup pomocí služby Azure Backup .

Kasten

Kasten je komerční produkt, který poskytuje provozním týmům snadno použitelný a zabezpečený systém pro zálohování a obnovení aplikací Kubernetes. Je k dispozici v bezplatné verzi s omezenými funkcemi a bez podpory a placenou verzi, která zahrnuje další funkce a zákaznickou podporu.

Když je Kasten nasazený jako operátor Kubernetes v rámci clusteru, poskytuje komplexní řešení zálohování. Nabízí řídicí panel pro správu pro centralizované řízení a viditelnost. S Kastenem můžou uživatelé těžit z přírůstkových záloh a záloh pracujících s aplikacemi, což umožňuje efektivní ochranu dat. Kasten navíc nabízí možnosti zotavení po havárii. Mezi tyto funkce patří automatizované převzetí služeb při selhání a navrácení služeb po obnovení a funkce pro migraci dat a zajištění zabezpečení.

Další podrobnosti o sadě funkcí Kastenu najdete v dokumentaci k KastenU K10. Informace o efektivním používání Kastenu s clustery AKS najdete v tématu Instalace K10 v Azure.

Velero

Velero je široce používaný opensourcový nástroj pro zálohování a obnovení pro Kubernetes. Nabízí bezplatnou a neomezenou verzi dostupnou všem uživatelům s podporou a údržbou poskytovanou komunitou přispěvatelů projektů.

Velero běží jako nasazení v clusteru a poskytuje komplexní sadu funkcí pro zálohování, obnovení a migraci dat aplikací. I když řídicí panely nejsou k dispozici, můžete je přidat prostřednictvím externích integrací.

Další informace o sadě funkcí a informace o tom, jak ji integrovat s clustery AKS, najdete v dokumentaci k Veleru.

Instalace a konfigurace zálohování AKS

Pokud chcete nainstalovat a nakonfigurovat zálohování AKS, postupujte takto:

  1. Podrobný popis požadavků pro použití služby AKS Backup s clusterem AKS najdete v tématu Požadavky pro zálohování AKS pomocí služby Azure Backup .
  2. V matici podpory zálohování AKS najdete podrobný popis dostupnosti oblastí, podporovaných scénářů a omezení služby AKS Backup.
  3. Pokyny k registraci požadovaných poskytovatelů prostředků ve vašich předplatných a správě těchto registrací najdete v tématu Správa záloh AKS pomocí služby Azure Backup .
  4. Podrobné pokyny k nastavení zálohování a obnovení clusteru AKS pomocí služby AKS Backup najdete v tématu Zálohování AKS pomocí služby Azure Backup . Pokyny zahrnují vytvoření a konfiguraci všech potřebných prostředků Azure, jako je trezor služby Backup, zásady zálohování a instance zálohování.
  5. Podrobné pokyny k provedení úplného obnovení clusteru AKS nebo obnovení na úrovni položek z existující instance zálohování najdete v tématu Obnovení AKS pomocí služby Azure Backup .

Frekvence zálohování a uchovávání v AKS: Definování zásad zálohování

Určení frekvence zálohování a doby uchovávání je základním aspektem řešení zálohování a obnovení. Tyto parametry definují, jak často se zálohy provádějí a jak dlouho se uchovávají před odstraněním. Výběr frekvence zálohování a doby uchovávání clusteru AKS a jeho úloh by měl odpovídat předdefinovaným cílům cíle bodu obnovení (RPO) a cíli doby obnovení (RTO).

Ve scénáři Kubernetes představuje cíl bodu obnovení maximální přijatelné množství stavu clusteru nebo ztráty dat, které je možné tolerovat. RtO určuje maximální možnou dobu mezi stavem clusteru nebo ztrátou dat a obnovením operací clusteru.

Zvolená frekvence zálohování a doba uchovávání jsou kompromisem mezi žádoucími cíli cíle bodu obnovení/RTO, náklady na úložiště a režijní náklady na správu zálohování. To znamená, že pro všechny clustery a úlohy AKS neexistuje žádná konfigurace odpovídající velikosti a optimální konfigurace pro každý cluster nebo úlohu by se měla místo toho definovat případ od případu, aby splňovala požadavky firmy, a to po pečlivém plánování a zvážení. Mezi relevantní faktory, které je potřeba vzít v úvahu při definování frekvence zálohování a doby uchovávání clusteru AKS, patří:

  • Závažnost: Úroveň závažnosti související s clusterem a daty aplikací úloh z hlediska kontinuity podnikových procesů.
  • Vzory přístupu a četnost změn: Množství stavu clusteru a dat, která se přidají, upraví, odstraní v daném časovém období.
  • Objem dat: Objem dat ovlivňující náklady na úložiště a čas potřebný k dokončení operací zálohování a obnovení.
  • Dodržování předpisů: Požadavky na uchovávání dat a suverenitu dat na základě interních pravidel dodržování předpisů a oborových předpisů.

Ve službě AKS Backup se frekvence zálohování a doba uchovávání ukládají jako prostředek zásad zálohování, který se vztahuje na stav clusteru i data aplikace z trvalých svazků.

Zásady zálohování v AKS Backup podporují denní a hodinové zálohování s dobami uchovávání až 360 dnů, zatímco u stejného clusteru je možné definovat a použít několik zásad.

Další informace o konfiguraci zásad zálohování ve službě AKS Backup najdete v tématu Vytvoření zásady zálohování.

Další aspekty zálohování

Pokud chcete zajistit, aby vaše řešení zálohování a obnovení splňovalo požadavky a zásady vaší organizace, zvažte následující body:

  • Cíl bodu obnovení (RPO) a cíl doby obnovení (RTO): Určete, jestli máte konkrétní cíle cíle bodu obnovení a RTO, které je potřeba splnit pro vaše operace zálohování a obnovení.
  • Trvalé svazky (PV): Ověřte, jestli používáte trvalé svazky, a ujistěte se, že řešení zálohování AKS podporuje vaše typy PV. Podrobnosti o kompatibilitě najdete v matici podpory zálohování AKS.
  • Rozsah zálohování: Definujte, co je potřeba zálohovat, například konkrétní obory názvů, typy prostředků nebo konkrétní data v rámci clusteru. Další informace najdete v tématu Konfigurace úlohy zálohování.
  • Frekvence zálohování a uchovávání: Určete frekvenci, s jakou potřebujete provádět zálohování, a dobu trvání, po kterou je potřebujete zachovat. Toto nastavení je možné nakonfigurovat pomocí zásad zálohování. Další informace najdete v tématu Definování zásad zálohování.
  • Výběr clusteru: Na základě vašich požadavků se rozhodněte, jestli potřebujete zálohovat všechny clustery nebo jenom konkrétní produkční clustery.
  • Postup obnovení testu: Proveďte pravidelné obnovení testů a ověřte spolehlivost a použitelnost strategie zálohování. Tento krok je zásadní pro zajištění účinnosti řešení zálohování a obnovení. Další informace naleznete v tématu Obnovení clusteru AKS.
  • Podporované scénáře: Ověřte, že řešení zálohování AKS podporuje váš konkrétní scénář. Informace o kompatibilitě najdete v matici podpory zálohování AKS.
  • Přidělení rozpočtu: Zvažte, jestli máte konkrétní přidělení rozpočtu pro operace zálohování a obnovení. Projděte si informace o cenách, které poskytuje řešení AKS Backup, aby odpovídaly vašim rozpočtovým požadavkům.

Díky těmto dalším aspektům můžete zajistit, aby vaše řešení zálohování a obnovení pro AKS splňovalo potřeby a preference vaší organizace efektivně a efektivně.

Umístění a úložiště zálohování AKS

Služba AKS Backup používá trezor služby Backup a účet úložiště k ukládání různých typů dat zachycených z clusteru během zálohování.

V případě trvalých svazků založených na disku používá služba AKS Backup přírůstkové snímky základního disku Azure, které jsou uložené ve vašem předplatném Azure.

Trezor služby Backup je zabezpečená entita úložiště v Rámci Azure, která slouží k ukládání zálohovaných dat pro úlohy podporované službou Azure Backup, jako jsou clustery AKS. Samotný trezor služby Backup obsahuje zásady zálohování i zálohy a body obnovení vytvořené úlohami zálohování.

Azure automaticky spravuje úložiště pro trezor služby Backup. Pro data uložená v tomto úložišti si můžete vybrat z několika možností redundance, které je možné nakonfigurovat v okamžiku vytvoření trezoru služby Backup.

Účet úložiště je oblast úložiště pro vaše datové objekty v Azure a je vysoce konfigurovatelná. Poskytuje několik možností redundance mezi oblastmi, které zajišťují odolnost dat. Služba AKS Backup používá kontejner objektů blob v rámci určeného účtu úložiště k zálohování některých součástí clusteru AKS.

Přírůstkové snímky jsou zálohy k určitému bodu v čase pro spravované disky, které se při pořízení skládají jenom ze změn od posledního snímku. První přírůstkový snímek je úplná kopie disku. Následné přírůstkové snímky zachycují pouze rozdílové změny disků od posledního snímku.

Použití služby AKS Backup k migraci úloh mezi clustery AKS

Zálohování AKS můžete použít jako mechanismus zálohování a obnovení pro konkrétní clustery. AKS Backup také podporuje scénáře migrace tím, že umožňuje provést zálohu z jednoho clusteru a obnovit ho do jiného, například:

  • Obnovení vývojového clusteru do přípravného clusteru
  • Replikace obsahu napříč několika clustery

Pokud chcete zajistit, aby byl váš scénář podporovaný, projděte si následující dokumentaci:

Přispěvatelé

Tento článek spravuje Microsoft. Původně byla napsána následujícími přispěvateli.

Hlavní autor:

Další přispěvatelé:

Další kroky

Další informace o zálohování AKS

Možnosti zálohování a obnovení AKS třetích stran