Använda Azure Local-stretchkluster för haveriberedskap

Azure Local

Azure Blob Storage

Azure Backup

Azure Monitor

Följande referensarkitektur visar hur du utformar och implementerar haveriberedskap för Azure Local med hjälp av stretchkluster.

Arkitektur

Ladda ned en Visio-fil av den här arkitekturen.

Komponenter

Arkitekturen innehåller följande komponenter och funktioner:

Azure Stack HCI version 22H2. Azure Local är en hyperkonvergerad infrastrukturklusterlösning (HCI) som du kan använda för att vara värd för virtualiserade Windows- och Linux-arbetsbelastningar och deras lagring i en lokal hybridmiljö. Du kan konfigurera det utsträckta klustret med 4 till 16 fysiska noder.
Storage Replica. Storage Replica är en Windows Server-teknik som möjliggör volymreplikering mellan servrar eller kluster för haveriberedskap.
Direktmigrering. Direktmigrering är en Hyper-V funktion i Windows Server som gör att du smidigt kan flytta virtuella datorer som körs från en Hyper-V värd till en annan utan upplevd stilleståndstid.
molnvittne. Cloud Witness är ett kvorumvittne för redundanskluster som använder Microsoft Azure Blob Storage för att rösta om klusterkvorum.

Scenarioinformation

Du använder vanligtvis den här arkitekturen för haveriberedskap med automatisk redundansväxling av lokala Azure-datorer och filresurser mellan två fysiska platser inom ett intervall på 5 ms svarstid för tur och retur-nätverket.

Rekommendationer

Följande rekommendation gäller för de flesta scenarier. Följ rekommendationen om du inte har ett specifikt krav som åsidosätter den.

Använda stretchkluster för att implementera automatiserad haveriberedskap för virtualiserade arbetsbelastningar och filresurser som finns i Azure Local

För att förbättra den inbyggda motståndskraften i Azure Local implementerar du en utsträckt Lokal Azure-instans som består av två grupper med noder, med en grupp per plats. Varje grupp måste innehålla minst två noder. Det totala antalet noder i ett kluster får inte överskrida det maximala antalet noder som stöds av en lokal Azure-instans. Noderna måste uppfylla standardkraven för HCI-maskinvara.

En utsträckt Lokal Azure-instans förlitar sig på Lagringsreplik för att utföra synkron lagringsreplikering mellan lagringsvolymer som hanteras av de två grupperna av noder på respektive fysiska platser. Om ett fel påverkar tillgängligheten för den primära platsen övergår klustret automatiskt sina arbetsbelastningar till noder på den överlevande platsen för att minimera den potentiella stilleståndstiden. För planerade eller förväntade stilleståndstider på den primära platsen kan du använda Hyper-V Direktmigrering för att sömlöst överföra arbetsbelastningar till den andra platsen och undvika driftstopp helt och hållet. I det här scenariot bör du tänka på lagringsplatsen. Du bör först vända replikeringsriktningen för Lagringsrepliken och sedan utföra direktmigreringen av de virtuella datorerna. Det kommer att finnas en prestandapåverkan tills direktmigreringen har slutförts.

Anteckning

Synkron replikering säkerställer kraschkonsekvens med noll dataförlust på filsystemnivå under en redundansväxling.

Varning

Det synkrona replikeringskravet som gäller för utsträckta kluster medför en gräns på 5 ms svarstid för tur och retur-nätverket mellan två grupper av klusternoder på de replikerade platserna. Beroende på egenskaperna för den fysiska nätverksanslutningen översätts den här begränsningen vanligtvis till cirka 20–30 fysiska mil.

Anteckning

Lagringsreplikens signerings- och krypteringsfunktion skyddar automatiskt replikeringstrafiken.

Överväganden

Dessa överväganden implementerar grundpelarna i Azure Well-Architected Framework, som är en uppsättning vägledande grundsatser som kan användas för att förbättra kvaliteten på en arbetsbelastning. Mer information finns i Microsoft Azure Well-Architected Framework.

Tillförlitlighet

Tillförlitlighet säkerställer att ditt program kan uppfylla de åtaganden du gör gentemot dina kunder. Mer information finns i checklistan för Designgranskning för tillförlitlighet.

Feldomäner på platsnivå. Varje fysisk plats i ett Azure Local-stretchkluster representerar distinkta feldomäner som ger ytterligare återhämtning. En feldomän är en uppsättning maskinvarukomponenter som delar en enskild felpunkt. För att vara feltolerant mot en viss nivå behöver du flera feldomäner på den nivån.

Anteckning

Om varje plats motsvarar en separat AD DS-plats konfigurerar klusteretableringsprocessen automatiskt platstilldelningen. Om det inte finns några separata AD DS-platser som representerar de två platserna, men noderna finns på två olika undernät, identifierar klusteretableringsprocessen platser baserat på undernätstilldelningarna. Om noderna finns i samma undernät måste du definiera platstilldelning explicit.

Webbplatsmedvetenhet. Med platsmedvetenhet kan du styra placeringen av virtualiserade arbetsbelastningar genom att ange deras önskade platser. Att ange den önskade platsen för ett stretchkluster ger många fördelar, inklusive möjligheten att gruppera arbetsbelastningar på platsnivå och anpassa alternativ för kvorumröstning. Som standard använder alla virtuella datorer den önskade platsen under en kallstart, även om det också är möjligt att konfigurera den önskade platsen på klusterrollen eller gruppnivån. På så sätt kan du allokera specifika virtuella datorer till sina respektive platser i aktivt-aktivt läge. Från kvorumperspektivet påverkar det föredragna webbplatsvalet fördelningen av röster på ett sätt som gynnar den webbplatsen. Om anslutningen mellan de två platserna som är värd för stretchklusternoder misslyckas och klustervittnet inte kan nås, förblir den föredragna platsen online, medan noderna på den andra platsen tas bort.
Förbättrad reparationshastighet för lagringsdirigeringsvolym. Lagringsdirigering ger automatisk omsynkronisering av följande händelser som påverkar tillgängligheten för diskar i lagringspoolen, till exempel att stänga av en av klusternoderna eller ett lokaliserat maskinvarufel. Azure Local implementerar en förbättrad omsynkroniseringsprocess som fungerar mycket finare än Windows Server 2019. Den här processen minskar avsevärt varaktigheten för omsynkroniseringsåtgärden och minimerar den potentiella effekten av flera överlappande maskinvarufel.
Återhämtningsgränser. Azure Local tillhandahåller flera återhämtningsnivåer, men på grund av dess hyperkonvergerade arkitektur omfattas återhämtning av begränsningar som inte bara införts av klusterkvorum, utan även av poolkvorum.
Integrering med en rad Azure-tjänster som ger ytterligare återhämtningsfördelar. Du kan integrera virtualiserade arbetsbelastningar som körs på lokala Azure-instanser med azure-tjänster som Azure Backup och Azure Site Recovery-.
Snabbare redundans. Du kan optimera nätverksinfrastrukturen och dess konfiguration för att påskynda slutförandet av en redundansväxling på platsnivå. Du kan till exempel utnyttja utsträckta virtuella LAN (VLAN), nätverksabstraktionsenheter och kortare TTL-värden (Time to Live) i DNS-poster som representerar klustrade resurser. Överväg dessutom att sänka standardåterhämtningsperiod, som avgör den tidsperiod under vilken en klustrad virtuell dator tillåts köras i isolerat tillstånd.

Varning

Att använda stretchkluster med SDN anses vara en avancerad konfiguration och du bör kontakta systemintegratören eller Microsoft Support för ytterligare hjälp.

Säkerhet

Säkerhet ger garantier mot avsiktliga attacker och missbruk av dina värdefulla data och system. Mer information finns i checklistan för Designgranskning för Security.

Skydd under överföring. Storage Replica erbjuder inbyggd säkerhet för replikeringstrafiken, som omfattar paketsignering, fullständig datakryptering med AES-128 GCM, stöd för Intel AES-NI krypteringsacceleration och skydd mot integritetsintegritet i mitten. Storage Replica använder även Kerberos AES256 för autentisering mellan repliknoderna.
Kryptering i vila. Azure Local stöder BitLocker-diskkryptering för sina datavolymer, vilket underlättar efterlevnad av standarder som FIPS 140-2 och HIPAA.
Integrering med en rad Olika Azure-tjänster som ger ytterligare säkerhetsfördelar. Du kan integrera virtualiserade arbetsbelastningar som körs på lokala Azure-instanser med azure-tjänster som Microsoft Defender för molnet
Brandväggsvänlig konfiguration. Lagringsrepliktrafik kräver ett begränsat antal öppna portar mellan de replikerande noderna.

Varning

Storage Replica- och Azure Local-stretchkluster måste fungera i en AD DS-miljö. När du planerar distributionen av dina Azure Local-stretchkluster kontrollerar du anslutningen till AD DS-domänkontrollanter på varje plats som är värd för klusternoder.

Kostnadsoptimering

Kostnadsoptimering handlar om att titta på sätt att minska onödiga utgifter och förbättra drifteffektiviteten. Mer information finns i checklistan Designgranskning för kostnadsoptimering.

Aktiv-aktiv kontra aktiv-passiv konfiguration. Utsträckta lokala Azure-instanser stöder aktiv-passiva och aktiva-aktiva lägen. I aktivt-passivt läge replikeras en utsedd primär plats endirigering till en annan plats som tillhandahåller haveriberedskapsfunktionen. I aktivt-aktivt läge replikerar två platser sina respektive volymer endirigering till varandra, vilket ger redundans vid ett fel på någon av platserna. Aktivt-aktivt läge hjälper till att minimera kostnaderna för affärskontinuitet genom att eliminera behovet av en dedikerad haveriberedskapsplats.
Molnvittne jämfört med filresursvittne. En vittnesresurs är en obligatorisk komponent i Azure Local-instanser. Om du vill implementera det väljer du antingen ett Azure-molnvittne eller ett filresursvittne. Ett Azure-molnvittne förlitar sig på en blob i ett Azure Storage-konto som du anger som skiljedomsplats för att förhindra scenarier med delad hjärna. Ett filresursvittne förlitar sig på en SMB-filresurs (Server Message Block) för att uppnå samma mål.

Anteckning

Azure Cloud Witness är det rekommenderade valet för Azure Local-stretchkluster, förutsatt att alla servernoder i klustret har tillförlitliga internetanslutningar. Motsvarande Azure-avgifter är försumbara. De baseras på priset för en liten blob med ovanliga uppdateringar som motsvarar ändringar i klustertillståndet. I scenarier som involverar stretchkluster bör ett filresursvittne finnas på en tredje plats, vilket avsevärt kan öka implementeringskostnaderna om inte den tredje platsen redan är tillgänglig och har befintliga, tillförlitliga anslutningar till de platser som är värdar för de stretchade klusternoderna.

Datadeduplicering. Azure Local och Storage Replica stöder datadeduplicering. Från och med Windows Server 2019 är deduplicering tillgänglig på volymer som är formaterade med ReFS (Resilient File System), vilket är det rekommenderade filsystemet för Azure Local. Deduplicering hjälper till att öka användbar lagringskapacitet genom att identifiera dubbletter av filer och bara lagra dem en gång.

Varning

Även om du bör installera rolltjänsten datadedupliceringsserver på både käll- och målservrarna ska du inte aktivera Datadeduplicering på målnoderna i ett Azure Local-stretchkluster. Eftersom Datadeduplicering hanterar skrivningar ska den endast köras på källklusternoder. Målnoder får alltid deduplicerade kopior av varje volym.

Operational Excellence

Operational Excellence omfattar de driftsprocesser som distribuerar ett program och håller det igång i produktion. Mer information finns i checklistan för Designgranskning för Operational Excellence.

Automatisk redundans och återställning. Ett fel på den primära platsen utlöser automatisk redundans. Efter redundansväxlingen sker även processen för att upprätta replikering från den nya primära/tidigare sekundära platsen tillbaka till den nya sekundära/tidigare primära platsen. För att förhindra potentiell dataförlust förhindrar klustret återställning efter fel tills de replikerade volymerna synkroniseras fullständigt.
Förenklad etablering och hantering med hjälp av Administrationscenter för Windows. Guiden Skapa kluster i Administrationscenter för Windows innehåller ett guidedrivet gränssnitt som vägleder dig genom processen att skapa ett Azure Local-stretchkluster. Guiden identifierar om klusternoder finns på två distinkta AD DS-platser (Active Directory Domain Services) eller om deras IP-adresser tillhör två olika undernät. Om de finns i två olika undernät skapar guiden automatiskt och konfigurerar motsvarande klusterplatser där var och en representerar en separat feldomän. Det gör också att du kan ange den önskade platsen. På samma sätt förenklar Windows Admin Center etableringsprocessen för replikerade volymer.

Anteckning

Att skapa volymer och virtuella diskar för stretchkluster är mer involverat än för kluster med en enda plats. Stretchkluster kräver minst fyra volymer, bestående av två datavolymer och två loggvolymer, med ett data/loggvolympar på varje plats. När du skapar en replikerad datavolym med hjälp av Windows Administrationscenter etablerar processen automatiskt loggvolymen på den primära platsen och både data och logg replikerade volymer på den sekundära platsen, vilket säkerställer att var och en av dem har den storlek och konfigurationsinställningar som krävs.

Stöd för automatiserad utsträckt klusteretablering och lagringshantering med hjälp av Windows PowerShell. Du kan köra PowerShell lokalt från en av de lokala Azure-datorerna eller fjärransluta från en hanteringsdator.
Integrering med en rad Olika Azure-tjänster som ger ytterligare driftfördelar. Du kan integrera virtualiserade arbetsbelastningar som körs på lokala Azure-instanser med azure-tjänster som Azure Monitor-- och Azure Automation-lösningar, inklusive ändringsspårning och inventering och Uppdateringshantering. Efter en inledande obligatorisk registrering kan Azure Local-instanser använda Azure Arc för övervakning och fakturering. Azure Arc-integrering erbjuder förbättrad integrering med andra hybridtjänster, till exempel Azure Policy och Log Analytics. Registreringen utlöser skapandet av en Azure Resource Manager-resurs som representerar en lokal Azure-instans, vilket i praktiken utökar Azure-hanteringsplanet till Azure Local.

Prestandaeffektivitet

Prestandaeffektivitet är arbetsbelastningens förmåga att uppfylla användarnas krav på det på ett effektivt sätt. Mer information finns i checklistan för Designgranskning för prestandaeffektivitet.

Optimerad replikeringstrafik. När du utformar infrastruktur för Azure Local-stretchkluster bör du överväga ytterligare trafik för lagringsreplik, direktmigrering och prestandahistorik för lagringsreplikkluster som flödar mellan platserna. Synkron replikering kräver minst 1 Gb fjärråtkomst till direkt minne (RDMA) eller Ethernet/TCP-anslutning mellan stretchklusterplatser. Beroende på mängden replikeringstrafik kan du dock behöva en snabbare RDMA-anslutning. Du bör också etablera flera anslutningar mellan platser, vilket ger återhämtningsfördelar och gör att du kan separat Storage Replica-trafik från Hyper-V direktmigreringstrafik.

Varning

RDMA är aktiverat som standard för all trafik mellan klusternoder på samma plats i samma undernät. RDMA är inaktiverat och stöds inte mellan platser eller mellan olika undernät. Du bör antingen inaktivera SMB Direct för trafik mellan platser eller implementera ytterligare bestämmelser som separerar den från trafik mellan noder på samma plats.

Stöd för startsynkronisering. Du kan implementera sådd inledande synkronisering i scenarier där den inledande synkroniseringstiden måste minimeras eller där det finns begränsad tillgänglig bandbredd mellan de två platser som är värdar för det utsträckta klustret.
Optimerad bearbetning av lagrings-I/O. Se till att optimal konfiguration av replikerade data- och loggvolymer, inklusive deras prestandanivå, volym- och sektorstorlek, disktyp och filsystem.

Anteckning

Windows Admin Center tilldelar automatiskt den optimala konfigurationen om du använder den för etablering av stretchade klustervolymer.

Nästa steg

Översikt över lokala Azure-lösningar
redundansklustring i Windows Server och Azure Local
Distribuera ett molnvittne för ett redundanskluster
Nyheter i Azure Local
vanliga frågor och svar om lokala Azure-

Dela via

Använda Azure Local-stretchkluster för haveriberedskap

Arkitektur

Komponenter

Scenarioinformation

Rekommendationer

Använda stretchkluster för att implementera automatiserad haveriberedskap för virtualiserade arbetsbelastningar och filresurser som finns i Azure Local

Överväganden

Tillförlitlighet

Säkerhet

Kostnadsoptimering

Operational Excellence

Prestandaeffektivitet

Nästa steg

Feedback

Ytterligare resurser

Dela via

Använda Azure Local-stretchkluster för haveriberedskap

Arkitektur

Komponenter

Scenarioinformation

Rekommendationer

Använda stretchkluster för att implementera automatiserad haveriberedskap för virtualiserade arbetsbelastningar och filresurser som finns i Azure Local

Överväganden

Tillförlitlighet

Säkerhet

Kostnadsoptimering

Operational Excellence

Prestandaeffektivitet

Nästa steg

Relaterade resurser

Feedback

Ytterligare resurser