Dela via


Utforma vSAN-stretchkluster

I den här artikeln får du lära dig hur du utformar ett vSAN-stretchkluster för ett privat Azure VMware Solution-moln.

Bakgrund

Azures globala infrastruktur delas upp i Regioner. Varje region stöder tjänsterna för ett visst geografiskt område. Inom varje region bygger Azure isolerade och redundanta öar med infrastruktur som kallas tillgänglighetszoner (AZ). En AZ fungerar som en gräns för resurshantering. Beräkningen och andra resurser som är tillgängliga för en AZ är ändliga och kan bli uttömda av kundernas krav. En AZ är byggd för att vara oberoende motståndskraftiga, vilket innebär att fel i en AZ inte påverkar andra AZs.

Med Azure VMware Solution finns ESXi-värdar som distribueras i ett standard-vSphere-kluster traditionellt i en enda Azure-tillgänglighetszon (AZ) och skyddas av vSphere-hög tillgänglighet (HA). Den skyddar dock inte arbetsbelastningarna mot ett Azure AZ-fel. För att skydda mot ett AZ-fel kan ett enda vSAN-kluster aktiveras för att sträcka sig över två separata tillgänglighetszoner, vilket kallas för ett vSAN-sträckt kluster.

Med stretchkluster kan konfigurationen av vSAN-feldomäner över två AZs meddela vCenter Server att värdar finns i varje tillgänglighetszon (AZ). Varje feldomän namnges efter den AZ som den finns i för att öka tydligheten. När du sträcker ut ett vSAN-kluster över två AZs i en region, om en AZ skulle gå ner, behandlas den som en vSphere HA-händelse och den virtuella datorn startas om i den andra AZ.

Fördelar med stretchkluster:

  • Förbättra programtillgängligheten.
  • Ange en RPO-funktion (zero recovery point objective) för företagsprogram utan att behöva göra om dem eller distribuera dyra haveriberedskapslösningar (DR).
  • Ett privat moln med stretchkluster är utformat för att ge 99,99 % tillgänglighet på grund av dess motståndskraft mot AZ-fel.
  • Gör det möjligt för kunderna att fokusera på grundläggande programkrav och funktioner i stället för infrastrukturtillgänglighet.

För att skydda mot scenarier med delad hjärna och hjälpa till att mäta webbplatsens hälsa skapas ett hanterat vSAN-vittne i en tredje AZ. Med en kopia av data i varje AZ försöker vSphere HA återställa från eventuella fel med hjälp av en enkel omstart av den virtuella datorn.

Följande diagram visar ett vSAN-kluster som sträcker sig över två AZs.

Diagram visar ett hanterat vSAN-sträckt kluster som skapats i en tredje tillgänglighetszon med data som kopieras till alla tre.

Sammanfattningsvis förenklar utsträckta kluster skyddsbehoven genom att tillhandahålla samma betrodda kontroller och funktioner utöver skalan och flexibiliteten i Azure-infrastrukturen.

Det är viktigt att förstå att utsträckta privata klustermoln bara erbjuder ett extra lager av återhämtning och att de inte hanterar alla felscenarier. Till exempel utsträckta privata klustermoln:

  • Skydda inte mot fel på regionnivå i Azure eller dataförlustscenarier som orsakas av programproblem eller dåligt planerade lagringsprinciper.
  • Ger skydd mot ett fel i en zon men är inte utformat för att ge skydd mot dubbla eller progressiva fel. Till exempel:
    • Trots olika lager av redundans som är inbyggda i infrastrukturresurserna, börjar vSphere HA att stänga av de virtuella arbetsbelastningsdatorerna på den sekundära platsen om ett inter-AZ-fel resulterar i partitionering av den sekundära platsen.

      Följande diagram visar scenariot för partitionering av sekundär plats.

      Diagram som visar vSphere-hög tillgänglighet som stänger av de virtuella arbetsbelastningsdatorerna på den sekundära platsen.

    • Om partitioneringen av den sekundära platsen i stället övergick till fel på den primära platsen, eller resulterade i en fullständig partitionering, skulle vSphere HA försöka starta om de virtuella arbetsbelastningsdatorerna på den sekundära platsen. Om vSphere HA försökte starta om de virtuella arbetsbelastningsdatorerna på den sekundära platsen skulle de virtuella arbetsbelastningsdatorerna hamna i ett ostadigt tillstånd.

      Följande diagram visar det önskade platsfelet och fullständiga scenarier för nätverkspartitionering.

      Diagram visar vSphere-hög tillgänglighet som försöker starta om de virtuella arbetsbelastningsdatorerna på den sekundära platsen när det önskade platsfelet inträffar.

      Diagram visar vSphere-hög tillgänglighet som försöker starta om de virtuella arbetsbelastningsdatorerna på den sekundära platsen när fullständig nätverksisolering inträffar.

Det bör noteras att dessa typer av fel, även om de är sällsynta, inte omfattas av det skydd som erbjuds av ett utsträckt kluster privat moln. På grund av dessa typer av sällsynta fel bör en utsträckt klusterlösning betraktas som en lösning med hög tillgänglighet med flera AZ som är beroende av vSphere HA. Det är viktigt att du förstår att en sträckt klusterlösning inte är avsedd att ersätta en omfattande haveriberedskapsstrategi för flera regioner som kan användas för att säkerställa programtillgänglighet. Orsaken är att en haveriberedskapslösning vanligtvis har separata hanterings- och kontrollplan i separata Azure-regioner. Azure VMware Solution-stretchkluster har ett enda hanterings- och kontrollplan som sträcker sig över två tillgänglighetszoner i samma Azure-region. Till exempel en vCenter Server, ett NSX Manager-kluster, ett NSX Edge VM-par.

Tillgänglighet för stretchklusterregion

Azure VMware Solution-stretchkluster är tillgängliga i följande regioner:

  • Storbritannien, södra (på AV36 och AV36P)
  • Europa, västra (på AV36 och AV36P)
  • Tyskland, västra centrala (på AV36 och AV36P)
  • Australien, östra (på AV36P)
  • USA, östra (på AV36P)

Lagringsprinciper som stöds

Följande SPBM-principer stöds med en PFTT med "Dubbel webbplatsspegling" och SFTT för "RAID 1 (spegling)" aktiverat som standardprinciper för klustret:

  • Inställningar för platskatastroftolerans (PFTT):
    • Dubbel platsspegling
    • Ingen – behåll data på önskad
    • Ingen – behåll data om icke-förutsägda
  • Lokala fel att tolerera (SFTT):
    • 1 fel – RAID 1 (spegling)
    • 1 fel – RAID 5 (Raderingskodning), kräver minst fyra värdar i varje AZ
    • 2 fel – RAID 1 (spegling)
    • 2 fel – RAID 6 (Raderingskodning), kräver minst sex värdar i varje AZ
    • 3 fel – RAID 1 (spegling)

Vanliga frågor

Planeras några andra regioner?

För närvarande finns det fem regioner som stöds för stretchkluster.

Vilken typ av serviceavtal tillhandahåller Azure VMware Solution de utsträckta klustren?

Ett privat moln som skapats med ett vSAN-stretchkluster är utformat för att erbjuda en 99,99 % infrastrukturtillgänglighet när följande villkor finns:

  • Minst sex noder distribueras i klustret (3 i varje tillgänglighetszon).
  • När en VM-lagringsprincip för PFTT med "Dubbel platsspegling" och en SFTT på 1 används av de virtuella arbetsbelastningsdatorerna.
  • För att uppnå tillgänglighetsmålen krävs kompatibilitet med de ytterligare krav som samlas in i serviceavtalet för Azure VMware Solution .

Får jag välja den tillgänglighetszon där ett privat moln distribueras?

Nej. Ett sträckt kluster skapas mellan två tillgänglighetszoner, medan den tredje zonen används för att distribuera vittnesnoden. Eftersom alla zoner används effektivt för att distribuera en utsträckt klustermiljö ges inget val till kunden. I stället väljer kunden att distribuera värdar i flera AZs när det privata molnet skapas.

Vilka begränsningar bör jag känna till?

  • När ett privat moln har skapats med ett stretchkluster kan det inte ändras till ett privat standardklustermoln. På samma sätt kan ett privat standardklustermoln inte ändras till ett utsträckt kluster privat moln när det har skapats.
  • Utskalning och inskalning av utsträckta kluster kan bara ske i par. Minst sex noder och högst 16 noder stöds i en utsträckt klustermiljö. Läs mer i Azure-prenumeration och tjänstbegränsningar, kvoter och begränsningar.
  • Virtuella datorer med kundarbetsbelastning startas om med medelhög vSphere HA-prioritet. De virtuella hanteringsdatorerna har högsta prioritet för omstart.
  • Lösningen förlitar sig på vSphere HA och vSAN för omstarter och replikering. Målet för återställningstid (RTO) bestäms av hur lång tid det tar för vSphere HA att starta om en virtuell dator på den överlevande AZ:n efter felet med en enda AZ.
  • Stöds för närvarande inte i en utsträckt klustermiljö:
    • Nyligen utgivna funktioner som offentlig IP-adress ned till NSX Edge och extern lagring, till exempel ANF-datalager.
    • Haveriberedskapstillägg som VMware SRM, Zerto och JetStream.
  • Öppna ett supportärende från Azure-portalen för följande scenarier (se till att välja Stretcha kluster som problemtyp):
    • Ansluta ett privat moln till ett utsträckt kluster privat moln.
    • Anslut två privata moln för stretchkluster i en enda region.

Vilken typ av svarstider bör jag förvänta mig mellan tillgänglighetszonerna (AZs)?

vSAN-sträckta kluster fungerar inom en 5-millisekunders tur och retur-tid (RTT) och 10 Gb/s eller större bandbredd mellan de AZs som är värd för de virtuella arbetsbelastningsdatorerna. Distributionen av Azure VMware Solution-stretchkluster följer den vägledande principen. Tänk på den informationen när du distribuerar program (med SFTT för dubbel webbplatsspegling, som använder synkrona skrivningar) som har stränga svarstidskrav.

Kan jag blanda stretch- och standardkluster i mitt privata moln?

Nej. En blandning av stretch- och standardkluster stöds inte i samma privata moln. En utsträckt eller standardklustermiljö väljs när du skapar det privata molnet. När ett privat moln har skapats med ett stretchkluster är antagandet att alla kluster som skapats i det privata molnet är utsträckta till sin natur.

Hur mycket kostar lösningen?

Kunder debiteras baserat på antalet noder som distribueras i det privata molnet.

Debiteras jag för vittnesnoden och för inter-AZ-trafik?

Nej. Kunder ser ingen avgift för vittnesnoden och inter-AZ-trafiken. Vittnesnoden är helt tjänsthanterad och Azure VMware Solution tillhandahåller den livscykelhantering som krävs för vittnesnoden. Eftersom hela lösningen hanteras av tjänsten behöver kunden bara identifiera lämplig SPBM-princip som ska anges för de virtuella arbetsbelastningsdatorerna. Resten hanteras via Microsoft.