Sdílet prostřednictvím


IBM DB2 pureScale v Azure

Prostředí IBM DB2 pureScale poskytuje databázový cluster pro Azure s vysokou dostupností a škálovatelností v operačních systémech Linux. Tento článek popisuje architekturu pro spouštění db2 pureScale v Azure.

Přehled

Podniky již dlouho používají tradiční platformy systému pro správu relačních databází (RDBMS) k zajištění svých potřeb online zpracování transakcí (OLTP). Mnoho z nich v těchto dnech migruje svá databázová prostředí založená na sálových počítačích do Azure jako způsob, jak rozšířit kapacitu, snížit náklady a udržovat stabilní strukturu provozních nákladů. Migrace je často prvním krokem při modernizaci starší platformy.

Podnikový zákazník nedávno hostil své prostředí IBM DB2 běžící na z/OS na IBM DB2 pureScale v Azure. Řešení databázového clusteru Db2 pureScale poskytuje vysokou dostupnost a škálovatelnost v operačních systémech Linux. Zákazník před instalací db2 pureScale úspěšně spustil databázi Db2 jako samostatnou instanci vertikálního navýšení kapacity na jednom virtuálním počítači ve velkém systému s vertikálním navýšením kapacity.

I když ibm DB2 pureScale v Linuxu není totožná s původním prostředím, poskytuje podobné funkce vysoké dostupnosti a škálovatelnosti jako IBM DB2 pro z/OS běžící v konfiguraci Parallel Sysplex na sálovém počítači. V tomto scénáři je cluster připojený přes iSCSI ke sdílenému clusteru úložiště. Použili jsme systém souborů GlusterFS, bezplatný, škálovatelný open source distribuovaný systém souborů, který je speciálně optimalizovaný pro cloudové úložiště. IBM už ale toto řešení nepodporuje. Pokud chcete zachovat podporu od IBM, musíte použít podporovaný systém souborů kompatibilní s iSCSI. Microsoft nabízí Prostory úložiště s přímým přístupem (S2D) jako možnost

Tento článek popisuje architekturu použitou pro tuto migraci do Azure. Zákazník k testování konfigurace použil Red Hat Linux 7.4. Tato verze je k dispozici v Azure Marketplace. Než zvolíte linuxovou distribuci, nezapomeňte ověřit aktuálně podporované verze. Podrobnosti najdete v dokumentaci k IBM DB2 pureScale a GlusterFS.

Tento článek je výchozím bodem pro plán implementace DB2. Vaše obchodní požadavky se budou lišit, ale platí stejný základní model. Tento model architektury můžete použít také pro aplikace pro online analytické zpracování (OLAP) v Azure.

Tento článek nepopisuje rozdíly a možné úlohy migrace při přesunu databáze IBM DB2 pro z/OS do ibm DB2 pureScale spuštěné v Linuxu. A neposkytuje odhady velikosti a analýzy úloh pro přechod z DB2 z/OS na DB2 pureScale.

Abychom vám pomohli při rozhodování o nejlepší architektuře DB2 pureScale pro vaše prostředí, doporučujeme plně odhadnout velikost a vytvořit hypotézu. Ve zdrojovém systému nezapomeňte zvážit paralelní sysplex DB2 z/OS s architekturou sdílení dat, konfigurací spojovacího zařízení a statistikami využití distribuovaného datového zařízení (DDF).

Poznámka

Tento článek popisuje jeden přístup k migraci DB2, ale existují i jiné. Například databáze DB2 pureScale může běžet také ve virtualizovaných místních prostředích. IBM podporuje DB2 na Microsoft Hyper-V v různých konfiguracích. Další informace najdete v tématu Architektura virtualizace DB2 pureScale ve znalostním centru IBM Knowledge Center.

Architektura

Pro podporu vysoké dostupnosti a škálovatelnosti v Azure můžete použít architekturu sdílených dat se škálováním na více instancí pro DB2 pureScale. Při migraci zákazníka se použila následující ukázková architektura.

DB2 pureScale na virtuálních počítačích Azure zobrazující úložiště a sítě

Diagram znázorňuje logické vrstvy potřebné pro cluster DB2 pureScale. Patří mezi ně virtuální počítače pro klienta, pro správu, ukládání do mezipaměti, pro databázový stroj a pro sdílené úložiště.

Kromě uzlů databázového stroje diagram obsahuje dva uzly používané pro ukládání do mezipaměti clusteru (CFS). Pro samotný databázový stroj se používají minimálně dva uzly. Server DB2, který patří do clusteru pureScale, se nazývá člen.

Cluster je připojený přes iSCSI ke clusteru se sdíleným úložištěm se třemi uzly, aby bylo možné zajistit úložiště se škálováním na více instancí a vysokou dostupnost. Databáze DB2 pureScale je nainstalovaná na virtuálních počítačích Azure s Linuxem.

Tento přístup je šablona, kterou můžete upravit podle velikosti a měřítka vaší organizace. Je založená na následujících materiálech:

  • Dva nebo více členů databáze se kombinuje s alespoň dvěma uzly CF. Uzly spravují globální fond vyrovnávacích pamětí (GBP) pro služby sdílené paměti a globálního správce zámků (GLM), aby bylo možné řídit sdílený přístup a zamknout kolize od aktivních členů. Jeden uzel CF funguje jako primární a druhý jako sekundární uzel CF s podporou převzetí služeb při selhání. Aby nedošlo k jedinému bodu selhání v prostředí, vyžaduje cluster DB2 pureScale aspoň čtyři uzly.

  • Vysoce výkonné sdílené úložiště (znázorněné ve velikosti P30 v diagramu) Každý uzel používá toto úložiště.

  • Vysoce výkonné sítě pro datové členy a sdílené úložiště.

Důležité informace o výpočetních prostředcích

Tato architektura spouští vrstvy aplikace, úložiště a dat na virtuálních počítačích Azure. Skripty nastavení nasazení vytvoří následující:

  • Cluster DB2 pureScale. Typ výpočetních prostředků, které potřebujete v Azure, závisí na vašem nastavení. Obecně můžete použít dva přístupy:

    • Použijte síť s více uzly ve stylu vysokovýkonných výpočetních prostředí (HPC), kde malé až středně velké instance přistupují ke sdílenému úložišti. Pro tento typ konfigurace prostředí HPC poskytují potřebný výpočetní výkon virtuální počítače řady E optimalizované pro paměť Azure nebo L-series optimalizované pro úložiště.

    • Pro datové moduly používejte méně velkých instancí virtuálních počítačů. Pro velké instance jsou největší virtuální počítače M-series optimalizované pro paměť ideální pro náročné úlohy v paměti. Můžete potřebovat vyhrazenou instanci v závislosti na velikosti logického oddílu (LPAR), který se používá ke spuštění db2.

  • DB2 CF používá virtuální počítače optimalizované pro paměť, například řady E nebo L-series.

  • Sdílený cluster úložiště, který používá Standard_DS4_v2 virtuální počítače s Linuxem.

  • Jumpbox pro správu je Standard_DS2_v2 virtuální počítač s Linuxem. Alternativou je Azure Bastion, služba, která poskytuje zabezpečené prostředí RDP/SSH pro všechny virtuální počítače ve vaší virtuální síti.

  • Klient je Standard_DS3_v2 virtuální počítač s Windows (používá se k testování).

  • Volitelné. Server s kopií clusteru. To je potřeba pouze u některých starších verzí Db2 pureScale. V tomto příkladu se používá Standard_DS3_v2 virtuální počítač s Linuxem (používaný pro DB2 pureScale).

Poznámka

Cluster DB2 pureScale vyžaduje aspoň dvě instance DB2. Vyžaduje také instanci mezipaměti a instanci správce zámků.

Aspekty úložišť

Stejně jako Oracle RAC je db2 pureScale vysoce výkonná bloková vstupně-výstupní databáze se škálováním na více instancí. Doporučujeme použít největší možnost Azure Premium SSD , která vyhovuje vašim potřebám. Menší možnosti úložiště můžou být vhodné pro vývojová a testovací prostředí, zatímco produkční prostředí často vyžadují větší kapacitu úložiště. Ukázková architektura používá P30 kvůli poměru IOPS k velikosti a ceně. Bez ohledu na velikost použijte Premium Storage pro zajištění nejlepšího výkonu.

DB2 pureScale používá architekturu shared-all, kde jsou všechna data přístupná ze všech uzlů clusteru. Úložiště Premium se musí sdílet mezi několika instancemi, ať už na vyžádání, nebo ve vyhrazených instancích.

Velký cluster DB2 pureScale může vyžadovat 200 terabajtů (TB) nebo více sdíleného úložiště úrovně Premium s IOPS 100 000. DB2 pureScale podporuje blokové rozhraní iSCSI, které můžete použít v Azure. Rozhraní iSCSI vyžaduje sdílený cluster úložiště, který můžete implementovat pomocí S2D nebo jiného nástroje. Tento typ řešení vytvoří v Azure zařízení vSAN (Virtual Storage Area Network). Db2 pureScale používá síť vSAN k instalaci clusterovaného systému souborů, který se používá ke sdílení dat mezi virtuálními počítači.

Aspekty sítí

IBM doporučuje síť InfiniBand pro všechny členy v clusteru DB2 pureScale. Databáze DB2 pureScale také používá přímý vzdálený přístup do paměti (RDMA), pokud je k dispozici, pro soubory CF.

Během instalace vytvoříte skupinu prostředků Azure, která bude obsahovat všechny virtuální počítače. Obecně platí, že prostředky seskupíte podle jejich životnosti a podle toho, kdo je bude spravovat. Virtuální počítače v této architektuře vyžadují akcelerované síťové služby. Jedná se o funkci Azure, která poskytuje konzistentní a ultra nízkou latenci sítě prostřednictvím virtualizace vstupně-výstupních operací s jedním kořenem (SR-IOV) do virtuálního počítače.

Každý virtuální počítač Azure se nasadí do virtuální sítě, která má podsítě main, front-end Gluster FS (gfsfe), back-end Gluster FS (bfsbe), DB2 pureScale (db2be) a front-end DB2 pureScale (db2fe). Instalační skript také vytvoří primární síťové karty na virtuálních počítačích v hlavní podsíti.

Pomocí skupin zabezpečení sítě můžete omezit síťový provoz v rámci virtuální sítě a izolovat podsítě.

V Azure musí db2 pureScale používat jako síťové připojení úložiště protokol TCP/IP.

Další kroky