Dela via


Skydda och återställa i molnhantering

Innan du förbereder ett potentiellt arbetsbelastningsstopp bör molnhanteringsteamen först se till att de uppfyller kraven för:

Som de planerar måste teamen börja med ett antagande om att något kommer att misslyckas när katastrofen slår till. Förberedelse för ett avbrott gör att teamen kan identifiera fel tidigare och återställa snabbare. Fokus för detta område ligger på de steg som kommer omedelbart efter att ett system misslyckas. Hur skyddar du arbetsbelastningar så att de kan återställas snabbt när ett avbrott inträffar?

Ingen teknisk lösning kan konsekvent erbjuda ett serviceavtal som garanterar 100 procent drifttid. Lösningar med de mest redundanta arkitekturerna hävdar att de levererar "sex 9:or" eller 99,9999 procent drifttid. Men även en "sex 9s"-lösning går ner i 31,6 sekunder under ett visst år. Det är ovanligt att en lösning garanterar en stor, pågående driftsinvestering som krävs för att nå "sex 9-talet" drifttid.

Översätta skydds- och återställningskonversationer

De arbetsbelastningar som driver verksamheten består av:

  • Appar
  • Data
  • Virtuella datorer (VM)
  • Övriga tillgångar

Varje tillgång kan kräva en egen metod för skydd och återställning. Det viktiga målet med detta område är att upprätta ett konsekvent åtagande inom hanteringsbaslinjen, vilket kan utgöra en utgångspunkt för affärsdiskussioner.

Molnhanteringsteamen bör åtminstone skapa en baslinjemetod för varje tillgång, med ett tydligt åtagande om snabb återställning och minimal dataförlust.

Mål för återställningstid (RTO)

Ett mål för återställningstid är hur lång tid det ska ta att återställa alla system till dess tillstånd före en katastrof. Detta skulle omfatta den tid som krävs för att:

  • Återställa minimala funktioner till virtuella datorer och program
  • Återställa data som krävs av program.

I affärstermer representerar RTO den tid som affärsprocesserna inte är i drift. För verksamhetskritiska arbetsbelastningar bör den här variabeln vara relativt låg, vilket gör att affärsprocesser kan återupptas snabbt. För arbetsbelastningar med lägre prioritet kanske en standardnivå för RTO inte har någon märkbar inverkan på företagets prestanda.

Ett företag bör skapa en hanteringsbaslinje som upprättar en standard-RTO för icke-verksamhetskritiska arbetsbelastningar. Företaget kan sedan använda baslinjen som ett sätt att motivera ytterligare investeringar i återställningstider.

Mål för återställningspunkt (RPO)

I de flesta molnhanteringssystem samlar någon form av dataskydd regelbundet in och lagrar data. Återställningspunkten refererar till den senaste gången data hämtades. När ett system misslyckas kan det bara återställas till den senaste återställningspunkten.

Målet för återställningspunkten mäts från den senaste återställningspunkten till ett avbrott. Om RPO mäts i timmar resulterar ett systemfel i dataförlust för timmarna mellan den senaste återställningspunkten och driftstoppet. Om RPO mäts i dagar resulterar ett systemfel i dataförlusten för dagarna mellan den senaste återställningspunkten och driftstoppet. Ett endags-RPO skulle teoretiskt sett leda till förlust av alla transaktioner under dagen som ledde till misslyckandet.

För verksamhetskritiska system kan mätning av ett RPO på några minuter eller sekunder bidra till att undvika förlust i intäkter eller vinster. En kortare RPO resulterar dock i allmänhet i ökade hanteringskostnader. För att minimera dessa kostnader bör ett företag skapa en hanteringsbaslinje som fokuserar på det längsta godtagbara RPO:et. Verksamheten kan sedan minska RPO för de specifika plattformar eller arbetsbelastningar som kräver mer investeringar.

Skydda och återställa arbetsbelastningar

De flesta arbetsbelastningar i en IT-omgivningsstöd en specifik affärsprocess eller teknisk process. System som inte har någon systempåverkan på verksamheten motiverar vanligtvis inte den ökade investering som krävs för att snabbt återställa system eller minimera dataförlust. Genom att upprätta en baslinje kan ett företag ta reda på vilken nivå av återställningsstöd de behöver vid en prispunkt som de konsekvent kan hantera. Att förstå detta hjälper affärsintressenter att utvärdera värdet av ökade investeringar i återställning.

För de flesta molnhanteringsteam ger en förbättrad baslinje, med specifika RPO/RTO-åtaganden för olika tillgångar, den mest gynnsamma vägen till ömsesidiga affärsåtaganden. I följande avsnitt beskrivs några vanliga förbättrade baslinjer som gör det möjligt för ett företag att enkelt lägga till skydds- och återställningsfunktioner genom en repeterbar process.

Skydda och återställa data

Data är utan tvekan den mest värdefulla tillgången i den digitala ekonomin. Förlust av data som driver en produktionsarbetsbelastning leder till förlust av intäkter eller vinster. Den vanligaste förbättrade baslinjen är möjligheten att skydda och återställa data effektivt. Vi uppmuntrar molnhanteringsteam att erbjuda en nivå av förbättrad hanteringsbaslinje som stöder vanliga dataplattformar.

Innan molnhanteringsteam implementerar plattformsåtgärder är det vanligt att de stöder förbättrade åtgärder för en paaS-dataplattform (plattform som en tjänst). Det är till exempel enkelt för ett molnhanteringsteam att framtvinga en högre frekvens för säkerhetskopiering eller multiregional replikering för Azure SQL Database- eller Azure Cosmos DB-lösningar. På så sätt kan utvecklingsteamet enkelt förbättra RPO genom att modernisera sina dataplattformar.

Mer information om den här tankeprocessen finns i Avsnittet om plattformsåtgärder.

Skydda och återställa virtuella datorer

De flesta arbetsbelastningar är något beroende av virtuella datorer, som är värdar för olika aspekter av lösningen. Ett företag måste snabbt återställa vissa virtuella datorer för att arbetsbelastningen ska kunna stödja dess processer efter ett systemfel.

Varje minuts stilleståndstid på dessa virtuella datorer kan orsaka förlorade intäkter eller minskade vinster. När driftavbrott för virtuella datorer har en direkt inverkan på verksamhetens finanspolitiska prestanda är RTO mycket viktigt. Molnhanteringsteam kan snabbt återställa virtuella datorer genom att replikera dem till en sekundär plats och använda automatisk återställning, en modell som kallas för en varmvarm återställningsmodell. Teamen kan också replikera virtuella datorer till en funktionell, sekundär plats i en metod som kallas hot-hot eller hög tillgänglighetsmodell. Hot-hot-metoden är dyrare, men den erbjuder det högsta återställningstillståndet.

Var och en av dessa modeller minskar RTO, vilket hjälper företag att återställa sina affärsfunktioner snabbare. Men varje modell resulterar också i avsevärt ökade kostnader för molnhantering.

Observera också att, förutom replikering för hög tillgänglighet, bör säkerhetskopiering aktiveras för scenarier som:

  • Oavsiktlig borttagning
  • Skadade data
  • Utpressningstrojanattacker

Mer information om den här tankeprocessen finns i Avsnittet om arbetsbelastningsåtgärder.

Nästa steg

När den här hanteringsbaslinjekomponenten har uppfyllts kan teamet se framåt för att undvika avbrott i sina plattformsåtgärder och arbetsbelastningsåtgärder.