Affärskontinuitet och haveriberedskap för Azure VMware Solution
Det här scenariot i företagsskala hjälper till att förbättra affärskontinuitet och haveriberedskap (BCDR). Azure VMware Solution tillhandahåller privata moln som innehåller VMware vSphere-kluster som skapats från dedikerad azure-infrastruktur utan operativsystem. Lösningen tillhandahåller minst tre ESXi-värdar, upp till högst 16 värdar per kluster. Alla etablerade privata moln har VMware vCenter Server, VMware vSAN, VMware vSphere och VMware NSX-T Data Center. Mer information om serviceavtal (SLA) för Azure VMware Solution finns i SLA för Azure VMware Solution.
Oavsett om du har en lokal lösning eller En Azure VMware-lösning bör du överväga olika BCDR-faktorer för att förbereda dig för en katastrof. En robust BCDR-plan syftar till att skydda ett företag från dataförlust, ekonomisk förlust och stilleståndstid om det uppstår en störande händelse. Följande beslutsträd visar olika BCDR-alternativ som är tillgängliga för Azure VMware Solution.
Kommentar
En pilotljusmiljö har konfigurerats med en minimal konfiguration, med endast kärnkomponenter som stöder en kritisk uppsättning program. Den kan dock skala ut och skapa fler värdar för att ta den största delen av belastningen om en redundansväxling inträffar. För haveriberedskap för beräknings- och minnesintensiva Azure VMware-lösningsarbetsbelastningar krävs samma mängd lagringsutrymme på den sekundära platsen.
Designöverväganden för affärskontinuitet
VMware vSAN-lagringsprinciper i Azure VMware Solution implementeras med lagringstillgänglighet i åtanke. När klustret har mellan tre och fem värdar är antalet värdfel som kan tolereras utan dataförlust lika med ett. När klustret har mellan 6 och 16 värdar är antalet värdfel som ska tolereras innan dataförlusten kan inträffa lika med två. VMware vSAN-lagringsprinciper kan tillämpas per virtuell dator. Även om dessa principer är standard kan du ändra principen så att den passar anpassade krav. Mer information finns i Azure VMware Solution Storage-begrepp.
vSphere-hög tillgänglighet är aktiverad som standard i Azure VMware Solution. Principen för intagning med hög tillgänglighet reserverar beräknings- och minneskapacitet för en enskild nod. Den här reservationen garanterar tillräcklig kapacitet för att starta om arbetsbelastningar i en annan nod i ett Azure VMware Solution-kluster.
Hög tillgänglighet med stretchkluster: Med Azure VMware Solution finns ESXi-värdar som distribuerats i ett vSphere-standardkluster traditionellt i en enda Azure-tillgänglighetszon och skyddas av vSphere-hög tillgänglighet. Arbetsbelastningar skyddas dock inte mot ett fel i tillgänglighetszonen. För att skydda mot fel kan ett enda vSAN-kluster sträcka sig över två separata tillgänglighetszoner, som kallas för ett vSAN-sträckt kluster. Mer information finns i Distribuera vSAN-stretchkluster.
Välj en validerad säkerhetskopieringslösning för virtuella VMware vSphere-datorer (VM: er), till exempel Microsoft Azure Backup Server eller en lösning för partnersäkerhetskopiering.
Information om funktioner som stöds i lösningar för partnersäkerhetskopiering finns i respektive partnerdokumentation.
Kommentar
Konfigurationerna för Azure VMware Solution private cloud vCenter Server och HCX Manager (om det är aktiverat) är enligt ett dagligt säkerhetskopieringsschema och NSX-konfigurationen är enligt schemat för säkerhetskopiering per timme. Säkerhetskopiorna behålls i minst tre dagar.
Azure VMware Solution-komponenter som vCenter Server, NSX-T Manager eller HCX Manager är hanterade tjänster som Azure hanterar säkerhetskopiering för. Om du vill återställa från en säkerhetskopia skapar du en Azure-supportbegäran.
Designrekommendationer för affärskontinuitet
Använd Azure Backup Server för att säkerhetskopiera det privata Azure VMware Solution-molnet. Mer information finns i Säkerhetskopiera virtuella VMware vSphere-datorer med Azure Backup. Distributionstopologier som stöds är MARS Agent och Data Protection Manager. Varje distributionstopologi har en egen supportmatris, begränsningar och begränsningar.
Distribuera Azure Backup Server i samma Azure-region som det privata Azure VMware Solution-molnet. Den här distributionsmetoden minskar trafikkostnaderna, underlättar administrationen och behåller den primära/sekundära topologin. Se metodtips för distribution av Azure-regioner för Azure-regioner.
Azure Backup kan distribueras som en virtuell IaaS-dator (Azure Infrastructure as a Service) eller i det privata Azure VMware Solution-molnet. Vi rekommenderar starkt att du distribuerar den utanför det privata Azure VMware Solution-molnet. Distribuera Säkerhetskopiering i ett virtuellt Azure-nätverk och se till att det här virtuella nätverket är anslutet till samma ExpressRoute som är anslutet till det privata Azure VMware Solution-molnet. Om du kör säkerhetskopieringsservern utanför det privata Azure VMware Solution-molnet kan du minska vSAN-förbrukningen, eftersom vSAN är en resurs med begränsad kapacitet i det privata Azure VMware Solution-molnet.
Azure Backup Server distribueras som en virtuell Azure IaaS-dator.
Azure Backup Server distribueras som en virtuell Azure VMware Solution-dator.
Använd checklistan för programprestandakrav för att komma fram till rätt kapacitet och disktyp, till exempel HDD, SSD eller Ultra. Överväg azure IaaS VM SKU som stöder disktypen och kapaciteten för säkerhetskopieringsåtgärder.
Använd Kapacitetshanteraren för Azure Backup Server för att fastställa antalet servrar, lagring och IOPS-krav för var och en av dem. När du anger värdet "Total storlek på arbetsbelastningen (GB)*" i kapacitetshanteraren använder du medianvärdet mellan "använt lagringsutrymme" och "allokerat lagringsutrymme" för alla virtuella datorer i vCenter som du vill säkerhetskopiera.
Använd lagringspooler med Azure Backup Server för förbättrad disk-IOPS/dataflöde. Använd nivåindelad lagring på säkerhetskopieringsservern för förbättrade åtgärder. Ange DisableWriteAutoTiering-konfigurationsvärdet till 1 på MABS-volymen så att hela prestandanivån är tillgänglig för lagring av ReFS-metadata.
Identifiera antalet parallella säkerhetskopieringsjobb och återställningsåtgärder som ska köras på Azure Backup-servern. För närvarande stöds åtta parallella säkerhetskopieringsjobb. Mät hur lång tid det tar att säkerhetskopiera och återställa verksamhetskritiska arbetsbelastningar över flera körningar. Kontrollera att säkerhetskopierings- och återställningstiderna uppfyller RPO- och RTO-kraven för Azure Backup-servern. Kontrollera att AVS vSAN-datalager har tillräckligt med kapacitet för att lagra återställd säkerhetskopiering.
Lägg till nödvändiga antivirusund undantag för Azure Backup Server filer och mappar som dokumenteras här om någon antivirus/program mot skadlig kod körs på Azure Backup Server. När du använder DPM-skyddsagenten på en virtuell Azure VMware-lösningsdator för programsäkerhetskopiering (till exempel SQL, Sharepoint osv.) inaktiverar du realtidsövervakning av dpmra.exe.
Konfigurera lämpliga NSG-regler (nätverkssäkerhetsgrupp) på undernät som är värd för Azure Backup Server för att tillåta nätverkskommunikation från DPM-skyddsagenten som körs på en skyddad virtuell dator i Azure VMware Solution. DPM-skyddsagenten kommunicerar med Azure Backup Server på alla dynamiska portar mellan 1024 och 65535.
För närvarande stöder Inte Azure Backup Server återställning mellan regioner för azure VMware Solution privat moln. Se avsnittet lösningar för partnersäkerhetskopiering och haveriberedskap när azure VMware Solution-återställning mellan regioner krävs.
Designöverväganden för haveriberedskap
Anpassa affärskraven till mål för återställningstid (RTO), kapacitet och mål för återställningspunkter (RPO) för program. Planera och utforma i enlighet med detta för att uppnå dessa mål med hjälp av den lämpligaste replikeringstekniken. Du kan till exempel replikera SQL-databaser internt med hjälp av SQL AlwaysOn-tillgänglighetsgruppen eller använda ett haveriberedskapsverktyg som VMware Site Recovery Manager.
Fastställa målplatsen för haveriberedskap för det skyddade privata Azure VMware Solution-molnet. Den här webbplatsen påverkar vilka verktyg för haveriberedskap som är lämpliga för miljön. Om du till exempel vill återställa Azure VMware Solution-arbetsbelastningar till azure-interna virtuella IaaS-datorer kan du överväga Azure Site Recovery eller Zerto.
Ta reda på vilken delmängd av Azure VMware Solution-arbetsbelastningar som kräver skydd om det finns en haveriberedskapshändelse. Överväg att kategorisera arbetsbelastningarna baserat på prioritet: P0 för affärskritiska arbetsbelastningar och P1, P2, P3 för andra arbetsbelastningar som är viktiga men inte lika viktiga för verksamheten att fungera. Kundens affärskontinuitetsplan definierar prioritetsnivåerna, vilket hjälper till att kontrollera kostnaderna för implementering av haveriberedskap.
I de flesta fall behöver icke-produktionsmiljöer som dev, test eller UAT inte redundansväxla till en sekundär plats. Du bör köra pilotljuset på den sekundära platsen med minskad kapacitet för produktion och kritiska arbetsbelastningar för att spara på kostnaderna. Om du vill ha mer kapacitet kan du skala ut för att lägga till ESXi-värdar i klustret under haveriberedskapshändelsen.
Särskilt för pilotljusdistributioner kontrollerar du att du har säkrat all värdkvot som behövs på den sekundära platsen så att du inte behöver vänta på den kapacitet som krävs under full utskalning. Se Begär värdkvot för Azure VMware Solution.
Konfigurera funktionella domänroller, till exempel Active Directory-domänkontrollanter, i den sekundära miljön.
Lösningar från partner som JetStream och Zerto är allmänt tillgängliga och verifierade i Azure VMware Solution. De stöder de flesta haveriberedskapsscenarier och kan ge snabbare återställning med nästan noll RPO.
VMware Site Recovery Manager, Jetstream och Zerto stöder migrering från platser från tredje part till Azure VMware Solution.
VMware HCX är också en kostnadseffektiv haveriberedskapslösning. Det rekommenderas dock inte för stora produktionsarbetsbelastningar på grund av manuell orkestrering.
För haveriberedskap mellan privata Azure VMware Solution-moln i olika Azure-regioner måste du aktivera ExpressRoute Global Reach mellan båda ExpressRoute-backend-kretsarna. Dessa kretsar skapar primär-till-sekundär privat molnanslutning när det behövs för lösningar som VMware SRM och VMware HCX.
För haveriberedskap mellan privata Azure VMware Solution-moln i samma Azure-region måste du aktivera Azure VMware Solution Interconnect. Den skapar en routningslänk mellan hanterings- och arbetsbelastningsnätverken i privata Azure VMware Solution-moln för kommunikation mellan molnen. Se till att det dirigerade IP-adressutrymmet i varje privat moln är unikt och inte överlappar varandra.
När du arbetar med haveriberedskap kan du använda samma käll-IP-adressutrymme i den primära Azure-regionen och den sekundära Azure-regionen. Det kräver dock extra design- och ingenjörsarbete.
Behåll samma IP-adresser: De virtuella datorerna på den sekundära Azure VMware-lösningsplatsen kan återställas med samma käll-IP-adress som den primära platsen. För den här metoden skapar du isolerade VLAN- eller NSX-T-segment på den sekundära platsen och ser till att inget av dessa isolerade VLAN eller segment är anslutna till miljön. Ändra dina haveriberedskapsvägar så att de återspeglar att undernätet har flyttats till den sekundära platsen och den nya IP-adressplatsen. Även om den här metoden fungerar skapar den även tekniska omkostnader när du siktar på helt automatiserad haveriberedskap.
Använd olika IP-adresser: Du kan också använda olika IP-adresser för återställda virtuella datorer. Om den virtuella datorn flyttas till en sekundär plats beskriver återställningsplanen i VMware Site Recovery Manager den anpassade IP-kartan. Välj den här kartan för ändring av IP-adress. Virtuella datorer tas upp i de nya NSX-T-segmenten och nya IP-adresser tilldelas. Verktygen kan skilja sig åt för olika haveriberedskapslösningar.
Viktiga faktorer för partiella och fullständiga haveriberedskapsscenarier:
VMware Site Recovery Manager stöder partiell återställning, som endast återställer en delmängd av virtuella datorer och fullständig haveriberedskap. Mellan två Azure VMware-lösningsplatser i region 1 och region 2 kan alla eller några av de virtuella datorerna redundansväxla.
Kravet på käll-IP-adresskvarhållning för återställda virtuella datorer avgör om partiell kontra fullständig haveriberedskap är möjlig.
För att behålla källans IP-adress vid partiell haveriberedskap i Site Recovery Manager måste undernätsgatewayen flyttas till den sekundära platsen.
Kommentar
Haveriberedskap i aktivt vänteläge kräver inte layer 2-sträckning.
Designrekommendationer för haveriberedskap
Använd VMware Site Recovery Manager när du arbetar med Azure VMware Solution på både primära och sekundära platser. Primära och sekundära platser kallas även för skyddade respektive återställningsplatser.
Översikt över kontinuerlig vSphere-replikering på hög nivå.
Detaljerat exempel på kontinuerlig vSphere-replikering mellan primära och sekundära platser.
För affärskritiska program är Zerto och JetStream tillgängliga som haveriberedskapslösningar för privata Azure VMware Solution-moln. JetStream och Zerto bygger på grunden för kontinuerligt dataskydd (CDP), med hjälp av VMware vSphere API för VAIO-ramverk (I/O-filtrering), vilket möjliggör minimal eller nästan ingen dataförlust. Det möjliggör också kostnadseffektiv haveriberedskap med hjälp av minimala resurser.
Använd Azure Site Recovery eller Zerto om virtuella Azure IaaS-datorer är haveriberedskapsmålet för det privata azure VMware Solution-molnet.
Minimera manuella indata med hjälp av automatiserade återställningsplaner inom var och en av respektive haveriberedskapslösningar. Dessa planer är användbara när du arbetar med VMware Site Recovery Manager eller partnerlösningar. En återställningsplan samlar in datorer i återställningsgrupper för redundans. Det hjälper sedan till att definiera en systematisk återställningsprocess genom att skapa oberoende enheter som kan redundansväxla.
Konfigurera röktester eller haveriberedskapstester minst en gång om året för att säkerställa att återställningsplaner fungerar som förväntat. Orkestreringsfunktionerna i det valda haveriberedskapsverktyget avgör vilken ansträngningsnivå som krävs för att köra dessa övningar.
Använd geopolitiska regionala par som den sekundära haveriberedskapsmiljön. Några av fördelarna med regionala par är prioriterad regionåterställning, sekventiella uppdateringar, fysisk isolering och datahemvist.
Håll adressutrymmena olika för att undvika överlappande IP-adresser mellan de två platserna. Du kan till exempel använda
192.168.0.0/16
för region 1 och10.0.0.0/16
för region 2.Använd ExpressRoute Global Reach-anslutning mellan de primära och sekundära privata molnen i olika regioner. Se fler nätverksöverväganden och rekommendationer i det relevanta designområdet.
Nästa steg
Lär dig mer om överväganden och rekommendationer för den första distributionen av Azure VMware Solution och vägledning för driftautomatisering.