Tillförlitlighet i Azure HDInsight på Azure Kubernetes Service

Artikel
11/02/2024

Kommentar

Vi drar tillbaka Azure HDInsight på AKS den 31 januari 2025. Före den 31 januari 2025 måste du migrera dina arbetsbelastningar till Microsoft Fabric eller en motsvarande Azure-produkt för att undvika plötsliga uppsägningar av dina arbetsbelastningar. Återstående kluster i din prenumeration stoppas och tas bort från värden.

Endast grundläggande stöd kommer att vara tillgängligt fram till datumet för pensionering.

Viktigt!

Den här funktionen finns i förhandsgranskning. De kompletterande användningsvillkoren för Förhandsversioner av Microsoft Azure innehåller fler juridiska villkor som gäller för Azure-funktioner som är i betaversion, förhandsversion eller på annat sätt ännu inte har släppts i allmän tillgänglighet. Information om den här specifika förhandsversionen finns i Azure HDInsight på AKS-förhandsversionsinformation. Om du vill ha frågor eller funktionsförslag skickar du en begäran på AskHDInsight med informationen och följer oss för fler uppdateringar i Azure HDInsight Community.

I den här artikeln beskrivs tillförlitlighetsstöd i Azure HDInsight på Azure Kubernetes Service (AKS) samt haveriberedskap och affärskontinuitet.

Stöd för tillgänglighetszon

Azure-tillgänglighetszoner är minst tre fysiskt separata grupper av datacenter i varje Azure-region. Datacenter i varje zon är utrustade med oberoende infrastruktur för ström, kylning och nätverk. Om det uppstår ett fel i den lokala zonen är tillgänglighetszoner utformade så att regionala tjänster, kapacitet och hög tillgänglighet stöds av de återstående två zonerna om den ena zonen påverkas.

Fel kan vara allt från programvaru- och maskinvarufel till händelser som jordbävningar, översvämningar och bränder. Tolerans mot fel uppnås med redundans och logisk isolering av Azure-tjänster. Mer detaljerad information om tillgänglighetszoner i Azure finns i Regioner och tillgänglighetszoner.

Azure-tillgänglighetszoner-aktiverade tjänster är utformade för att ge rätt nivå av tillförlitlighet och flexibilitet. De kan konfigureras på två sätt. De kan vara antingen zonredundanta, med automatisk replikering mellan zoner eller zoninstanser, med instanser fästa på en specifik zon. Du kan också kombinera dessa metoder. Mer information om zon- och zonredundant arkitektur finns i Rekommendationer för användning av tillgänglighetszoner och regioner.

Azure HDInsight på AKS har stöd för tillgänglighetszoner genom att utnyttja Azure Kubernetes-tjänstens möjlighet att skapa zonredundanta nodpooler. Du kan välja vilka tillgänglighetszoner som ska distribuera klusterpoolen och klustret när de skapas. När klusterpoolen eller klustret har skapats kan du inte ändra tillgänglighetszonerna.

Förutsättningar

Tillgänglighetszoner stöds endast för klusterpoolversion >= 1.2 och klusterversion >= 1.2.1.
Azure HDInsight på AKS har bara en standard-SKU och stöder AZ så länge Azure-regionen har AZ-stöd.

Regionerna nedan stöder inte AZ:

Nord- och Sydamerika Europa Mellanöstern Afrika Asien och stillahavsområdet

Västra USA Tyskland, norra
Vissa VM-SKU:er kanske inte stöder alla tillgänglighetszoner i en region. Om du väljer dessa SKU:er stöder HDInsight i AKS-klusterpooler eller kluster inte heller motsvarande tillgänglighetszoner.

Nord- och Sydamerika	Europa	Mellanöstern	Afrika	Asien och stillahavsområdet
Västra USA	Tyskland, norra

Förbättringar av serviceavtal

Det finns inga ökade serviceavtal för Azure HDInsight på AKS-kluster med tillgänglighetszoner aktiverade.

Skapa en resurs med tillgänglighetszonen aktiverad

Klusterpooler Du kan välja en eller flera tillgänglighetszoner när du har skapat klusterpoolen när du har valt regionen.
Kluster Du kan välja en eller flera tillgänglighetszoner när klustret skapas.

Feltolerans

För att förbereda för fel i tillgänglighetszonen rekommenderar vi att du överetablerar tjänstens kapacitet för att säkerställa att klustret kan tolerera kapacitetsförlust från en tillgänglighetszon nedåt och fortsätta att fungera utan försämrade prestanda vid avbrott i hela zonen. Om du till exempel aktiverar 3 tillgänglighetszoner bör klustret tolerera 1/3 av noderna nedåt (avrunda upp till närmaste heltal).

Zon-ned-upplevelse

Azure HDInsight på AKS-tjänsten är zonredundant. Under ett zonomfattande avbrott bör kunden förvänta sig försämrad prestanda på grund av kapacitetsminskning. Kunder kan fortfarande skapa nya klusterpooler och kluster i de tillgänglighetszoner som inte påverkas. Befintliga kluster kan fungera med minskad kapacitet. Rekommendationer och metodtips för enskilda öppen källkod arbetsbelastningar finns i dokumentationen.

Haveriberedskap och affärskontinuitet

Haveriberedskap handlar om att återställa från händelser med hög påverkan, till exempel naturkatastrofer eller misslyckade distributioner som resulterar i driftstopp och dataförlust. Oavsett orsak är den bästa lösningen för en katastrof en väldefinierad och testad DR-plan och en programdesign som aktivt stöder DR. Innan du börjar fundera på att skapa en haveriberedskapsplan kan du läsa Rekommendationer för att utforma en strategi för haveriberedskap.

När det gäller dr använder Microsoft modellen för delat ansvar. I en modell med delat ansvar ser Microsoft till att baslinjeinfrastrukturen och plattformstjänsterna är tillgängliga. Samtidigt replikerar många Azure-tjänster inte automatiskt data eller återgår från en misslyckad region för att korsreparera till en annan aktiverad region. För dessa tjänster ansvarar du för att konfigurera en haveriberedskapsplan som fungerar för din arbetsbelastning. De flesta tjänster som körs på PaaS-erbjudanden (Plattform som en tjänst) i Azure ger funktioner och vägledning för att stödja DR och du kan använda tjänstspecifika funktioner för att stödja snabb återställning för att utveckla din DR-plan.

Azure HDInsight på AKS-kontrollplanstjänsten och databaser distribueras i olika regioner i Azure. Bland dessa regioner är Azure HDInsight på AKS-instanser och databasinstanser isolerade. När ett avbrott på regionnivå inträffar är en region nere. Alla resurser i den här regionen, inklusive RP (resursprovidern) för Azure HDInsight på AKS-kontrollplanet, databasen för Azure HDInsight på AKS-kontrollplanet och alla kundkluster i den här regionen. I det här fallet kan vi bara vänta tills det regionala avbrottet upphör. När zonavbrottet är helt återställt är Azure HDInsight på AKS-tjänsten tillbaka och alla kundkluster återgår till normalitet. Det är möjligt att du kan stöta på vissa problem på grund av datainkonsekvens efter avbrotten och kan behöva en manuell korrigering baserat på dina programarbetsbelastningar.

Haveriberedskap för flera regioner

Azure HDInsight på AKS stöder för närvarande inte redundans mellan regioner. För att förbättra affärskontinuiteten med haveriberedskap mellan regioner krävs arkitekturdesign med högre komplexitet och högre kostnader. Kunder kan välja att utforma sin egen lösning för att säkerhetskopiera nyckeldata och jobbstatus i olika regioner.

Identifiering, avisering och hantering av avbrott

Använd Azure-övervakningsverktyg i HDInsight på AKS för att identifiera onormalt beteende i klustret och ange motsvarande aviseringsmeddelanden. Du kan aktivera Log Analytics på olika sätt och använda hanterad Prometheus-tjänst med Azure Grafana-instrumentpaneler för övervakning. Mer information finns i Azure Monitor-integrering.
Prenumerera på Azure-hälsoaviseringar som ska meddelas om tjänstproblem, planerat underhåll, hälso- och säkerhetsrekommendationer för en prenumeration, tjänst eller region. Hälsomeddelanden som innehåller orsaken till problemet och resolut ETA hjälper dig att bättre köra redundans och återställning efter fel. Mer information finns i Hantera tjänsthälsa och Azure Service Health-dokumentation.

Haveriberedskap för en region

För närvarande har Azure HDInsight på AKS bara ett standardtjänsterbjudande och kluster skapas i ett geografiskt område med en region. Kunderna ansvarar för inställningarna för diasteråterställning baserat på programkraven.

Återhämtning av kapacitet och proaktiv haveriberedskap

Azure HDInsight på AKS och dess kunder arbetar under modellen delat ansvar, vilket innebär att kunden måste uppfylla haveriberedskapskraven för den tjänst som de distribuerar och kontrollerar. För att säkerställa att återställningen är proaktiv bör kunderna alltid fördistribuera sekundärfiler eftersom det inte finns någon garanti för kapacitet vid tidpunkten för påverkan för dem som inte har förallokerat.

Till skillnad från HDInsight kräver de virtuella datorer som används i HDInsight i AKS-kluster samma kvot som virtuella Azure-datorer. Mer information finns i Kapacitetsplanering.

Mer information om de objekt som beskrivs i den här artikeln finns i:

Dela via

Tillförlitlighet i Azure HDInsight på Azure Kubernetes Service

Stöd för tillgänglighetszon

Förutsättningar

Förbättringar av serviceavtal

Skapa en resurs med tillgänglighetszonen aktiverad

Feltolerans

Zon-ned-upplevelse

Haveriberedskap och affärskontinuitet

Haveriberedskap för flera regioner

Identifiering, avisering och hantering av avbrott

Haveriberedskap för en region

Återhämtning av kapacitet och proaktiv haveriberedskap

Feedback

Ytterligare resurser

Dela via

Tillförlitlighet i Azure HDInsight på Azure Kubernetes Service

Stöd för tillgänglighetszon

Förutsättningar

Förbättringar av serviceavtal

Skapa en resurs med tillgänglighetszonen aktiverad

Feltolerans

Zon-ned-upplevelse

Haveriberedskap och affärskontinuitet

Haveriberedskap för flera regioner

Identifiering, avisering och hantering av avbrott

Haveriberedskap för en region

Återhämtning av kapacitet och proaktiv haveriberedskap

Relaterat innehåll

Feedback

Ytterligare resurser