Prozkoumání vysoké dostupnosti a zotavení po havárii SAP HANA v Azure (velké instance)

Dokončeno

Vysoká dostupnost a zotavení po havárii (DR) jsou zásadní aspekty provozování klíčového serveru SAP HANA na serveru Azure (Large Instances). Je důležité spolupracovat se SAP, integrátorem systému nebo Microsoftem, aby správně architektovali a implementovali správné strategie vysoké dostupnosti a zotavení po havárii. Je také důležité vzít v úvahu cíl bodu obnovení (RPO) a cíl doby obnovení (RTO), které jsou specifické pro vaše prostředí.

Microsoft podporuje některé možnosti vysoké dostupnosti SAP HANA s velkými instancemi HANA. Mezi tyto schopnosti patří:

  • Replikace úložiště: Schopnost systému úložiště replikovat všechna data do jiného razítka velké instance HANA v jiné oblasti Azure. SAP HANA funguje nezávisle na této metodě. Tato funkce je výchozí mechanismus zotavení po havárii nabízený pro velké instance HANA.
  • Replikace systému HANA (HSR):: Replikace všech dat v SAP HANA do samostatného systému SAP HANA. Cíl doby obnovení se minimalizuje prostřednictvím replikace dat v pravidelných intervalech. SAP HANA podporuje asynchronní, synchronní režimy v paměti a synchronní režimy. Synchronní režim se používá jenom pro systémy SAP HANA, které jsou ve stejném datacentru nebo méně než 100 km od sebe. Díky aktuálnímu návrhu razítek velké instance HANA je možné použít replikaci systému HANA pouze pro zajištění vysoké dostupnosti v rámci jedné oblasti. Replikace systému HANA vyžaduje reverzní proxy server třetí strany nebo součást směrování pro konfigurace zotavení po havárii do jiné oblasti Azure.
  • Automatické převzetí služeb při selhání hostitele: Místní řešení pro obnovení selhání pro SAP HANA, které je alternativou k replikaci systému HANA. Pokud se počáteční uzel stane nedostupným, nakonfigurujete jeden nebo více pohotovostních uzlů SAP HANA v režimu škálování na více instancí a SAP HANA automaticky převezme služby při selhání do pohotovostního uzlu.

Když nastavíte HSR velkých instancí HANA s automatickým převzetím služeb při selhání, můžete požádat tým microsoftu pro správu služeb, aby nastavil zařízení STONITH pro vaše stávající servery.

Tato architektura podporuje zotavení po havárii mezi velkými instancemi HANA v různých oblastech Azure. Pro velké instance HANA existují dva způsoby podpory zotavení po havárii:

  • Replikace úložiště. Primární obsah úložiště se neustále replikuje do vzdálených systémů úložiště zotavení po havárii, které jsou k dispozici na určeném serveru DR HANA Large Instances. V replikaci úložiště není databáze HANA načtena do paměti. Tato možnost zotavení po havárii je jednodušší z hlediska správy. Pokud chcete zjistit, jestli se jedná o vhodnou strategii, zvažte dobu načítání databáze vůči sla dostupnosti. Replikace úložiště také umožňuje provést obnovení k určitému bodu v čase. Pokud je nastavené víceúčelové zotavení po havárii (optimalizované pro náklady), musíte zakoupit další úložiště stejné velikosti v umístění zotavení po havárii. Microsoft poskytuje snímky úložiště samoobslužné služby a skripty převzetí služeb při selhání pro převzetí služeb při selhání HANA jako součást nabídky velké instance HANA.
  • HsR s více vrstvami s třetí replikou v oblasti zotavení po havárii (kde je databáze HANA načtena do paměti). Tato možnost podporuje rychlejší dobu obnovení, ale nepodporuje obnovení k určitému bodu v čase. HSR vyžaduje sekundární systém. Replikace systému HANA pro lokalitu zotavení po havárii se zpracovává prostřednictvím proxy serverů, jako jsou nginx nebo tabulky IP adres.

SAP HANA v Azure (velké instance) se nabízí ve dvojicích oblastí Azure ve čtyřech geopolitických oblastech (USA, Austrálie, Evropa a Japonsko). Dvě oblasti v geopolitické oblasti, která hostuje razítka velké instance HANA, jsou připojené k samostatným vyhrazeným síťovým okruhům. Ty se používají k replikaci snímků úložiště k poskytování metod zotavení po havárii. Replikace není ve výchozím nastavení vytvořená, ale je nastavená pro zákazníky, kteří objednává funkce zotavení po havárii. Replikace úložiště závisí na využití snímků úložiště pro velké instance HANA. Oblast Azure není možné zvolit jako oblast zotavení po havárii, která je v jiné geopolitické oblasti.

Následující tabulka uvádí aktuálně podporované metody a kombinace vysoké dostupnosti a zotavení po havárii:

Scénář podporovaný ve velkých instancích HANA

Možnost vysoké dostupnosti

Možnost zotavení po havárii

Komentáře

Jeden uzel

Není k dispozici.

Nastavení vyhrazeného zotavení po havárii Multipurpose DR setup.

-

Automatické převzetí služeb při selhání hostitele: Horizontální navýšení kapacity (s pohotovostním režimem nebo bez) včetně 1+1

Je možné s pohotovostním režimem, který převezme aktivní roli. HANA řídí přepínač role.

Nastavení vyhrazeného zotavení po havárii Multipurpose DR setup. Synchronizace zotavení po havárii pomocí replikace úložiště

Sady svazků HANA jsou připojené ke všem uzlům. Lokalita zotavení po havárii musí mít stejný počet uzlů.

Replikace systému HANA

Možné s primárním nebo sekundárním nastavením. Sekundární přesune primární roli v případě převzetí služeb při selhání. Replikace systému HANA a převzetí služeb při selhání operačního systému.

Nastavení vyhrazeného zotavení po havárii Multipurpose DR setup. Synchronizace zotavení po havárii pomocí replikace úložiště Zotavení po havárii pomocí systémové replikace HANA ještě není možné bez komponent třetích stran.

K jednotlivým uzlům je připojena samostatná sada svazků disků. Replikují se do umístění zotavení po havárii pouze diskové svazky sekundární repliky v produkční lokalitě. V lokalitě zotavení po havárii se vyžaduje jedna sada svazků.

Vyhrazená instalace zotavení po havárii spočívá v tom, že jednotka velké instance HANA v lokalitě zotavení po havárii se nepoužívá pro spuštění žádné jiné úlohy nebo neprodukčního systému. Jednotka je pasivní a nasazuje se pouze v případě, že se spustí převzetí služeb při selhání po havárii. Toto nastavení ale pro mnoho zákazníků není upřednostňovanou volbou.

Nasazení SAP HANA MCOD (více instancí HANA v jedné jednotce) jako scénáře překrytí pracují s metodami HA a DR uvedenými v tabulce. Výjimkou je použití systémové replikace HANA s automatickým clusterem s podporou převzetí služeb při selhání na základě Pacemakeru. Takový případ podporuje pouze jednu instanci HANA na jednotku. V případě nasazení SAP HANA MDC fungují pouze metody vysoké dostupnosti a zotavení po havárii, které nejsou založené na úložišti, pokud je nasazeno více než jeden tenant. Při nasazení jednoho tenanta jsou všechny uvedené metody platné.

Multipurpose DR setup is where the HANA Large Instance unit on the DR site runs a non-production workload. V případě havárie vypněte neprodukční systém, připojte sady svazků replikované do úložiště (další) a spusťte produkční instanci HANA. Tuto konfiguraci používá většina zákazníků, kteří používají funkci zotavení po havárii velké instance HANA.

Další informace o vysoké dostupnosti SAP HANA najdete v následujících článcích o SAP: