IBM DB2 pureScale in Azure
De IBM DB2 pureScale-omgeving biedt een databasecluster voor Azure met hoge beschikbaarheid en schaalbaarheid op Linux-besturingssystemen. Dit artikel bevat een architectuur voor het uitvoeren van DB2 pureScale in Azure.
Overzicht
Ondernemingen hebben lang traditionele RDBMS-platformen (Relational Database Management System) gebruikt om te voldoen aan hun OLTP-behoeften (Online Transaction Processing). Tegenwoordig migreren velen hun op mainframe gebaseerde databaseomgevingen naar Azure als een manier om capaciteit uit te breiden, kosten te verlagen en een stabiele operationele kostenstructuur te onderhouden. Migratie is vaak de eerste stap bij het moderniseren van een verouderd platform.
Onlangs heeft een enterprise-klant de IBM DB2-omgeving die op z/OS wordt uitgevoerd, opnieuw gehost naar IBM DB2 pureScale in Azure. De databaseclusteroplossing Db2 pureScale biedt hoge beschikbaarheid en schaalbaarheid op Linux-besturingssystemen. De klant heeft Db2 uitgevoerd als een zelfstandig, omhoog schalend exemplaar op één virtuele machine (VM) in een grootschalig systeem in Azure voordat de installatie van Db2 pureScale is voltooid.
Hoewel deze niet identiek is aan de oorspronkelijke omgeving, biedt IBM DB2 pureScale op Linux vergelijkbare functies voor hoge beschikbaarheid en schaalbaarheid als IBM DB2 voor z/OS die wordt uitgevoerd in een parallelle Sysplex-configuratie op het mainframe. In dit scenario is het cluster via iSCSI verbonden met een gedeeld opslagcluster. We hebben het GlusterFS-bestandssysteem gebruikt, een gratis, schaalbaar, open source gedistribueerd bestandssysteem dat speciaal is geoptimaliseerd voor cloudopslag. IBM biedt echter geen ondersteuning meer voor deze oplossing. Als u uw ondersteuning van IBM wilt behouden, moet u een ondersteund iSCSI-compatibel bestandssysteem gebruiken. Microsoft biedt Opslagruimten Direct (S2D) als optie
In dit artikel wordt de architectuur beschreven die wordt gebruikt voor deze Azure-migratie. De klant heeft Red Hat Linux 7.4 gebruikt om de configuratie te testen. Deze versie is beschikbaar via Azure Marketplace. Voordat u een Linux-distributie kiest, moet u de momenteel ondersteunde versies controleren. Zie de documentatie voor IBM DB2 pureScale en GlusterFS voor meer informatie.
Dit artikel is een uitgangspunt voor uw DB2-implementatieplan. Uw bedrijfsvereisten verschillen, maar hetzelfde basispatroon is van toepassing. U kunt dit architectuurpatroon ook gebruiken voor OLAP-toepassingen (Online Analytical Processing) in Azure.
Dit artikel behandelt geen verschillen en mogelijke migratietaken voor het verplaatsen van een IBM DB2 voor z/OS-database naar IBM DB2 pureScale die wordt uitgevoerd op Linux. Het biedt geen schattingen van grootten en workloadanalyses voor het verplaatsen van DB2 z/OS naar DB2 pureScale.
Om u te helpen beslissen over de beste DB2 pureScale-architectuur voor uw omgeving, raden we u aan om de grootte volledig te schatten en een hypothese te maken. Houd in het bronsysteem rekening met DB2 z/OS Parallel Sysplex met gegevensdelingsarchitectuur, configuratie van koppelingsfaciliteit en DDF-gebruiksstatistieken (Distributed Data Facility).
Notitie
In dit artikel wordt één benadering van DB2-migratie beschreven, maar er zijn andere. DB2 pureScale kan bijvoorbeeld ook worden uitgevoerd in gevirtualiseerde on-premises omgevingen. IBM ondersteunt DB2 op Microsoft Hyper-V in verschillende configuraties. Zie DB2 pureScale-virtualisatiearchitectuur in het IBM Knowledge Center voor meer informatie.
Architectuur
Ter ondersteuning van hoge beschikbaarheid en schaalbaarheid in Azure kunt u een uitschaalbare, gedeelde gegevensarchitectuur gebruiken voor DB2 pureScale. De klantmigratie heeft de volgende voorbeeldarchitectuur gebruikt.
Het diagram toont de logische lagen die nodig zijn voor een DB2 pureScale-cluster. Deze omvatten virtuele machines voor een client, voor beheer, voor caching, voor de database-engine en voor gedeelde opslag.
Naast de database-engineknooppunten bevat het diagram twee knooppunten die worden gebruikt voor clustercachingfaciliteiten (CFS). Er worden minimaal twee knooppunten gebruikt voor de database-engine zelf. Een DB2-server die deel uitmaakt van een pureScale-cluster wordt een lid genoemd.
Het cluster is via iSCSI verbonden met een gedeeld opslagcluster met drie knooppunten om uitschaalopslag en hoge beschikbaarheid te bieden. DB2 pureScale wordt geïnstalleerd op virtuele Azure-machines waarop Linux wordt uitgevoerd.
Deze benadering is een sjabloon die u kunt wijzigen voor de grootte en schaal van uw organisatie. Dit is gebaseerd op het volgende:
Twee of meer databaseleden worden gecombineerd met ten minste twee CF-knooppunten. De knooppunten beheren een globale buffergroep (GBP) voor gedeeld geheugen en GLM-services (Global Lock Manager) om gedeelde toegang te beheren en conflicten van actieve leden te vergrendelen. Eén CF-knooppunt fungeert als de primaire en de andere als het secundaire, failover CF-knooppunt. Om een single point of failure in de omgeving te voorkomen, vereist een DB2 pureScale-cluster ten minste vier knooppunten.
Krachtige gedeelde opslag (weergegeven in P30-grootte in het diagram). Elk knooppunt maakt gebruik van deze opslag.
Krachtige netwerken voor de gegevensleden en gedeelde opslag.
Overwegingen voor berekeningen
Met deze architectuur worden de toepassings-, opslag- en gegevenslagen uitgevoerd op virtuele Azure-machines. Met de installatiescripts voor de implementatie maakt u het volgende:
Een DB2 pureScale-cluster. Het type rekenresources dat u nodig hebt voor Azure, is afhankelijk van uw installatie. Over het algemeen kunt u twee benaderingen gebruiken:
Gebruik een netwerk met meerdere knooppunten met high performance computing (HPC) waarbij kleine tot middelgrote exemplaren toegang hebben tot gedeelde opslag. Voor dit HPC-type configuratie bieden virtuele machines uit de Azure-serie die zijn geoptimaliseerd voor geheugen of voor opslag geoptimaliseerde virtuele machines uit de L-serie de benodigde rekenkracht.
Gebruik minder grote exemplaren van virtuele machines voor de gegevensengines. Voor grote exemplaren zijn de grootste voor geheugen geoptimaliseerde virtuele machines uit de M-serie ideaal voor zware workloads in het geheugen. Mogelijk hebt u een toegewezen exemplaar nodig, afhankelijk van de grootte van de logische partitie (LPAR) die wordt gebruikt om DB2 uit te voeren.
Db2 CF maakt gebruik van virtuele machines die zijn geoptimaliseerd voor geheugen, zoals E-serie of L-serie.
Een gedeeld opslagcluster dat gebruikmaakt van Standard_DS4_v2 virtuele machines waarop Linux wordt uitgevoerd.
De management jumpbox is een Standard_DS2_v2 virtuele machine waarop Linux wordt uitgevoerd. Een alternatief is Azure Bastion, een service die een veilige RDP-/SSH-ervaring biedt voor alle VM's in uw virtuele netwerk.
De client is een Standard_DS3_v2 virtuele machine waarop Windows wordt uitgevoerd (gebruikt voor testen).
Optioneel. Een witness-server. Dit is alleen nodig met bepaalde eerdere versies van Db2 pureScale. In dit voorbeeld wordt een Standard_DS3_v2 virtuele machine met Linux gebruikt (gebruikt voor DB2 pureScale).
Notitie
Voor een DB2 pureScale-cluster zijn ten minste twee DB2-exemplaren vereist. Er is ook een cache-exemplaar en een vergrendelingsbeheerexemplaren vereist.
Opslagoverwegingen
Net als Oracle RAC is DB2 pureScale een high-performance blok-I/O, scale-out database. We raden u aan de grootste Azure Premium SSD-optie te gebruiken die aan uw behoeften voldoet. Kleinere opslagopties zijn mogelijk geschikt voor ontwikkel- en testomgevingen, terwijl productieomgevingen vaak meer opslagcapaciteit nodig hebben. In de voorbeeldarchitectuur wordt P30 gebruikt vanwege de verhouding van IOPS tot grootte en prijs. Gebruik Premium Storage voor de beste prestaties, ongeacht de grootte.
DB2 pureScale maakt gebruik van een architectuur met gedeelde gegevens, waarbij alle gegevens toegankelijk zijn vanaf alle clusterknooppunten. Premium-opslag moet worden gedeeld over meerdere exemplaren, ongeacht of dit op aanvraag of op toegewezen exemplaren is.
Een groot DB2 pureScale-cluster kan 200 terabytes (TB) of meer premium gedeelde opslag vereisen, met IOPS van 100.000. DB2 pureScale ondersteunt een iSCSI-blokinterface die u in Azure kunt gebruiken. Voor de iSCSI-interface is een gedeeld opslagcluster vereist dat u kunt implementeren met S2D of een ander hulpprogramma. Met dit type oplossing maakt u een vSAN-apparaat (Virtual Storage Area Network) in Azure. DB2 pureScale gebruikt het vSAN om het geclusterde bestandssysteem te installeren dat wordt gebruikt om gegevens te delen tussen virtuele machines.
Aandachtspunten voor netwerken
IBM raadt InfiniBand-netwerken aan voor alle leden in een DB2 pureScale-cluster. DB2 pureScale maakt ook gebruik van RDMA (Remote Direct Memory Access), indien beschikbaar, voor de CFS.
Tijdens de installatie maakt u een Azure-resourcegroep die alle virtuele machines bevat. Over het algemeen groepeert u resources op basis van hun levensduur en wie ze gaat beheren. Voor de virtuele machines in deze architectuur is versneld netwerken vereist. Het is een Azure-functie die consistente, ultra lage netwerklatentie biedt via I/O-virtualisatie met één hoofdmap (SR-IOV) naar een virtuele machine.
Elke virtuele Azure-machine wordt geïmplementeerd in een virtueel netwerk met subnetten: main, Gluster FS front end (gfsfe), Gluster FS back-end (bfsbe), DB2 pureScale (db2be) en DB2 pureScale front-end (db2fe). Het installatiescript maakt ook de primaire NIC's op de virtuele machines in het hoofdsubnet.
Gebruik netwerkbeveiligingsgroepen om netwerkverkeer binnen het virtuele netwerk te beperken en de subnetten te isoleren.
In Azure moet DB2 pureScale TCP/IP gebruiken als netwerkverbinding voor opslag.