Dela via


SAP Testing Automation Framework: Testning med hög tillgänglighet

Hög tillgänglighet (HA) är viktigt för att upprätthålla affärskontinuitet i SAP-landskap. SAP Testing Automation Framework tillhandahåller en strukturerad, automatiserad metod för validering av HA-konfiguration och motståndskraft för SAP HANA (uppskalning) och SAP Central Services. Den kör konfigurationsverifieringskontroller och orkestrerar kontrollerade felsimuleringar för att säkerställa att återställnings- och redundansmekanismer överensstämmer med SAP enligt bästa praxis i Azure.

Ramverket använder Ansible för att samordna testkörning, samla in telemetri, samla in loggar och generera detaljerade resultatrapporter. Tester omfattar scenarier som resursmigrering, processkrascher, nodfel, fäktningshändelser och nätverkspartitioner, vilket gör det möjligt för team att utvärdera beredskapen innan de går live eller under livscykelåtgärder.

Anmärkning

Testfallen som beskrivs nedan med ett angivet värde i kolumnen "Anmärkningar" gäller endast när motsvarande villkor uppfylls. Om fältet är tomt anses posten vara tillämplig på alla konfigurationsmönster som stöds.

Hög tillgänglighet för SAP HANA-uppskalning

Validerar redundansmekanismen för SAP HANA Database i en uppskalningskonfiguration, vilket säkerställer att databasen kan återställas från nodfel utan dataförlust eller betydande driftstopp. Följande testfall är tillgängliga för att verifiera hög tillgänglighet för SAP HANA:

Testfall Description Anmärkningar
Konfigurationsverifiering med hög tillgänglighet (online) Kontrollerar konfiguration med hög tillgänglighet, inklusive Corosync-inställningar, Pacemaker-resurser, SBD-enheter och HANA-systemreplikeringskonfiguration.
Azure Load Balancer Konfigurationstestet för Azure LB verifierar konfigurationen av Azure Load Balancer, inklusive konfiguration av hälsoavsökningar, inställningar för serverpooler, belastningsutjämningsregler och IP-konfiguration på klientsidan.
Resursmigrering Resource Migration-testet validerar planerade redundansscenarier genom att köra kontrollerad resursflytt mellan HANA-noder. Den utför en graciös migrering av de primära HANA-resurserna till den sekundära noden, verifierar korrekta rolländringar, säkerställer att klustret upprätthåller stabiliteten under övergången och validerar fullständig datasynkronisering efter migreringen.
HANA-stopp på primärsystem HANA-stoppet på det primära testet simulerar klustrets beteende när HANA-databasen stoppas manuellt. SAP HANA-resursagenten övervakar databasen, identifierar när den stoppas och befordrar den sekundära noden till primär.
Blockera nätverk Testet Blockera nätverk validerar klustrets beteende under scenarier med nätverkspartitioner genom att implementera iptables-regler för att blockera kommunikationen mellan primära och sekundära HANA-noder. Den verifierar mekanismer för förebyggande av split-brain, validerar korrekt failover-utförande när noder blir isolerade och säkerställer klusterstabilitet och datakonsekvens efter att nätverksanslutningen har återställts.
Primär indexserverkrasch Kraschtestet för primär indexserver validerar beteendet för hög tillgänglighet genom att med kraft avsluta HANA-indexserverprocessen på den primära noden. Det här testscenariot simulerar ett kritiskt tjänstfel som utlöser automatisk redundans till den sekundära noden. Testet verifierar korrekt redundanskörning, säkerställer datakonsekvens och validerar tjänståterställning efter återställning. Indexservern är aktiverad
Avlivning av primär nod Testet Avlivning av primär nod verifierar klustrets beteende genom att med kraft avsluta alla HANA-processer på den primära noden med hjälp av SIGKILL-signalen. Den här proceduren simulerar ett plötsligt tjänstfel som utlöser automatisk redundans till den sekundära noden. Testet verifierar korrekt befordran av sekundär till primär, säkerställer datakonsekvens och validerar fullständig klusteråterställning.
Vm-krasch för primär nod Vm-kraschtestet för primär nod simulerar en omedelbar systemkrasch på den primära HANA-noden genom att köra kommandot "echo b" för att utlösa en plötslig omstart utan korrekt avstängning. Detta testar klustrets förmåga att hantera oväntade primära nodfel, validerar korrekt redundanskörning och verifierar datakonsekvens efter återställning.
Sekundär indexserverkrasch Kraschtestet för sekundär indexserver simulerar fel i HANA-indexserverprocessen på den sekundära noden. Den verifierar att den primära noden fortsätter normal drift samtidigt som klustrets förmåga att hantera sekundära fel, testar automatiska återställningsmekanismer och ser till att systemreplikeringen återupptas korrekt efter tjänståterställning. Indexservern är aktiverad
Avlivning av sekundär nod Testet Sekundär nodavlivning undersöker klustrets motståndskraft genom att kraftfullt avsluta HANA-processer på den sekundära noden med hjälp av kill -9-signalen. Testet verifierar att den primära noden upprätthåller normal drift medan den sekundära noden genomgår återställning, vilket säkerställer klusterstabilitet och korrekt datasynkronisering när återställningsprocessen har slutförts.
Vm-krasch med sekundär nod Vm-kraschtestet för sekundär nod simulerar en okontrollerad systemkrasch på den sekundära HANA-noden genom att köra kommandot "echo b", vilket utlöser en omedelbar omstart utan ordentliga avstängningsprocedurer. Testet verifierar att den primära noden underhåller åtgärden, verifierar klusterstabiliteten och ser till att systemreplikeringen återupptas korrekt när den sekundära noden har återställts.
Filsystemsfrysning Filesystem Freeze-testet verifierar klustrets beteende när den primära nodens filsystem inte svarar. Den simulerar ett lagringsproblem genom att frysa filsystemet på den primära nod som kör HANA-databasen, vilket utlöser automatisk redundans till den sekundära noden. Testet verifierar korrekt klusterreaktion, resursmigrering och datakonsekvens efter återställning. Fildelning konfigurerad med Azure NetApp Files
* SBD-skydd Validerar klustrets fäktningsmekanism genom att döda SBD-inkvisitorprocessen på den primära noden. Testar korrekt stängselidentifiering, nodisolering och automatisk redundans för att säkerställa klusterintegritet vid maskinvaru- eller kommunikationsfel. Stängsel konfigurerat med SBD-stonith-mekanism

Hög tillgänglighet för SAP Central Services

Verifierar redundansmekanismen för SAP Central Services, vilket säkerställer att systemet kan återställas från nodfel utan att påverka tillgängligheten för kritiska tjänster. Följande testfall är tillgängliga för att verifiera hög tillgänglighet för SAP Central Services:

Testfall Description Anmärkningar
Konfigurationsverifiering med hög tillgänglighet (online) Valideringstestet för parametervalidering med hög tillgänglighet validerar HA-konfigurationen, inklusive Corosync-inställningar, Pacemaker-resurser, SBD-enhetskonfiguration och konfiguration av SCS-systemreplikering.
Azure Load Balancer Konfigurationstestet för Azure LB verifierar konfigurationen av Azure Load Balancer, inklusive hälsoprovkonfiguration, backendpoolinställningar, belastningsutjämningsregler och IP-konfiguration på framsidan.
Sap Control-konfigurationsverifiering SapControl-konfigurationsverifieringstestet kör flera sapcontrol-kommandon för att verifiera SCS-konfigurationen. Den kör kommandon som HAGetFailoverConfig, HACheckFailoverConfig och HACheckConfig och samlar in deras utdata och statusar för att säkerställa korrekt konfiguration och funktionalitet. SAP-arbetsbelastning i SLES-operativsystemet
Resursmigrering Resursmigreringstestet validerar planerade redundansscenarier genom att kontrollera resursflytten mellan SCS-noder, vilket säkerställer korrekta rolländringar.
ASCS-nodkrasch ASCS-nodkraschtestet simulerar klustrets beteende när ASCS-noden kraschar. Den simulerar ett ASCS-nodfel genom att avsluta processen och verifierar sedan automatisk redundans till ERS-noden, övervakar systemets replikeringsstatus och bekräftar tjänståterställning.
Blockera nätverkskommunikation Testet Blockera nätverk verifierar klustrets beteende under scenarier med nätverkspartitioner genom att implementera iptables-regler för att blockera kommunikationen mellan ASCS- och ERS-noder. Den verifierar mekanismer för förebyggande av split-brain, validerar korrekt failover-körning när noder blir isolerade och säkerställer klusterstabilitet efter att nätverksanslutningen har återställts.
Avsluta meddelandeserverprocess Test av avlivning av meddelandeserverns process simulerar fel i meddelandeserverprocessen på ASCS-noden genom att avsluta den med hjälp av kill -9-signalen. Den verifierar rätt klusterreaktion, automatisk redundans till ERS-noden och säkerställer tjänstkontinuitet efter processfelet.
Avsluta enqueue-serverprocess Testet Enqueue Server Process Kill simulerar fel i enqueue-serverprocessen på ASCS-noden genom att avsluta den med hjälp av signalen kill -9. Den validerar korrekt klusterbeteende, automatisk redundanskörning.
Avsluta inkuäringsprocess i replikeringsserver Testet Enqueue Replication Server Process Kill simulerar fel i replikeringsserverprocessen på ERS-noden genom att avsluta den med hjälp av kill -9-signalen. Det här testet hanterar arkitekturer för både ENSA1 och ENSA2. Den validerar den automatiska omstarten av processen.
Avsluta sapstartsrv-process för ASCS Process Kill-testet för sapstartsrv simulerar fel i SAP Start Service för ASCS-instansen genom att tvångsavsluta det, nämligen med hjälp av signalen kill -9. Den validerar korrekt klusterreaktion, automatisk övergång till ERS-noden, och återställning av tjänsten efter ett processfel. SAP-arbetsbelastning i SLES-operativsystemet
Manuell omstart av ASCS-instans Testet Manuell omstart verifierar klustrets beteende när ASCS-instansen stoppas manuellt med sapcontrol. Den verifierar en korrekt klusterreaktion vid en kontrollerad instansavstängning, säkerställer automatisk redundans till ERS-noden och bekräftar tjänstens kontinuitet under hela åtgärden.
HAFailoverToNode-test HAFailoverToNode-testet validerar SAP:s inbyggda funktioner för hög tillgänglighet med hjälp av sapcontrol-kommandot för att utlösa en kontrollerad redundansväxling. Den kör HAFailoverToNode som SAP-administratörsanvändare, vilket initierar en ren migrering av ASCS-instansen till en annan nod. SAP-arbetsbelastning i SLES-operativsystemet

Konfigurationsvalidering med hög tillgänglighet (offline)

Offlineverifiering är ett läge i SAP Testing Automation Framework som verifierar konfigurationer av SAP HANA- och SAP Central Services-kluster med hög tillgänglighet utan att upprätta en direkt-SSH-anslutning till produktionsklustret. I stället analyseras insamlade CIB-XML-filer (Cluster Information Base) som exporteras från varje klusternod. Den här metoden möjliggör repeterbar och icke-påträngande utvärdering av HA-konfiguration, perfekt för efterlevnadsgranskningar, granskningar före ändringar och luftgapad analys. Mer information om hur du kör offlineverifiering finns i offlinevalidering av konfiguration med hög tillgänglighet.

Anmärkning

Offlineverifieringen kör inga funktionella tester.

Nästa steg