IBM DB2 pureScale na platformie Azure

Środowisko IBM DB2 pureScale zapewnia klaster bazy danych dla platformy Azure z wysoką dostępnością i skalowalnością w systemach operacyjnych Linux. W tym artykule przedstawiono architekturę uruchamiania bazy danych DB2 pureScale na platformie Azure.

Omówienie

Przedsiębiorstwa od dawna używały tradycyjnych platform do zarządzania relacyjnymi bazami danych (RDBMS), aby zaspokoić potrzeby przetwarzania transakcji online (OLTP). W dzisiejszych czasach wiele z nich migruje swoje środowiska baz danych oparte na ramce mainframe na platformę Azure jako sposób na zwiększenie pojemności, zmniejszenie kosztów i utrzymanie stałej struktury kosztów operacyjnych. Migracja jest często pierwszym krokiem w modernizacji starszej platformy.

Ostatnio klient przedsiębiorstwa ponownie hostował swoje środowisko IBM DB2 działające w systemie z/OS do bazy danych IBM DB2 pureScale na platformie Azure. Rozwiązanie klastra bazy danych Db2 pureScale zapewnia wysoką dostępność i skalowalność w systemach operacyjnych Linux. Klient pomyślnie uruchomił usługę Db2 jako autonomiczne wystąpienie skalowane w górę na jednej maszynie wirtualnej w systemie o dużej skali na platformie Azure przed zainstalowaniem bazy danych Db2 pureScale.

Chociaż nie jest identyczne z oryginalnym środowiskiem, ibm DB2 pureScale w systemie Linux zapewnia podobne funkcje wysokiej dostępności i skalowalności, ponieważ ibm DB2 dla systemu operacyjnego z/OS działa w konfiguracji Parallel Sysplex na komputerze mainframe. W tym scenariuszu klaster jest połączony za pośrednictwem interfejsu iSCSI z udostępnionym klastrem magazynu. Użyliśmy systemu plików GlusterFS, bezpłatnego, skalowalnego, open source rozproszonego systemu plików specjalnie zoptymalizowanego pod kątem magazynu w chmurze. Jednak firma IBM nie obsługuje już tego rozwiązania. Aby zapewnić obsługę firmy IBM, należy użyć obsługiwanego systemu plików zgodnego z protokołem iSCSI. Firma Microsoft oferuje Bezpośrednie miejsca do magazynowania (S2D) jako opcję

W tym artykule opisano architekturę używaną do tej migracji platformy Azure. Klient użył oprogramowania Red Hat Linux 7.4 do przetestowania konfiguracji. Ta wersja jest dostępna w Azure Marketplace. Przed wybraniem dystrybucji systemu Linux sprawdź obecnie obsługiwane wersje. Aby uzyskać szczegółowe informacje, zobacz dokumentację dotyczącą oprogramowania IBM DB2 pureScale i GlusterFS.

Ten artykuł jest punktem wyjścia dla planu implementacji DB2. Wymagania biznesowe będą się różnić, ale ma zastosowanie ten sam podstawowy wzorzec. Możesz również użyć tego wzorca architektury dla aplikacji przetwarzania analitycznego online (OLAP) na platformie Azure.

W tym artykule nie opisano różnic i możliwych zadań migracji do przenoszenia bazy danych IBM DB2 for z/OS do bazy danych IBM DB2 pureScale działającej w systemie Linux. Nie zapewnia ona szacowania rozmiaru i analiz obciążeń do przenoszenia z bazy danych DB2 z/OS do bazy danych DB2 pureScale.

Aby ułatwić podjęcie decyzji o najlepszej architekturze bazy danych DB2 pureScale dla danego środowiska, zalecamy pełne oszacowanie rozmiaru i utworzenie hipotezy. W systemie źródłowym należy wziąć pod uwagę architekturę równoległego sysplex db2 z/OS z architekturą udostępniania danych, konfiguracją sprzężenia i statystykami użycia rozproszonej jednostki danych (DDF).

Uwaga

W tym artykule opisano jedno podejście do migracji db2, ale istnieją inne. Na przykład baza danych DB2 pureScale może być również uruchamiana w zwirtualizowanych środowiskach lokalnych. Ibm obsługuje bazę danych DB2 w Microsoft Hyper-V w różnych konfiguracjach. Aby uzyskać więcej informacji, zobacz DB2 pureScale virtualization architecture in the IBM Knowledge Center (Architektura wirtualizacji pureScale DB2 w centrum wiedzy IBM Knowledge Center).

Architektura

Aby zapewnić wysoką dostępność i skalowalność na platformie Azure, możesz użyć architektury danych skalowanych w poziomie dla bazy danych DB2 pureScale. Migracja klienta użyła następującej przykładowej architektury.

Baza danych DB2 pureScale na maszynach wirtualnych platformy Azure przedstawiająca magazyn i sieć

Na diagramie przedstawiono warstwy logiczne potrzebne dla klastra db2 pureScale. Obejmują one maszyny wirtualne dla klienta, zarządzanie pamięcią podręczną, aparat bazy danych i magazyn udostępniony.

Oprócz węzłów aparatu bazy danych diagram zawiera dwa węzły używane do buforowania klastrów (CFS). Do samego aparatu bazy danych są używane co najmniej dwa węzły. Serwer DB2, który należy do klastra pureScale, jest nazywany członkiem.

Klaster jest połączony za pośrednictwem interfejsu iSCSI z klastrem magazynu udostępnionego z trzema węzłami w celu zapewnienia magazynu skalowalnego w poziomie i wysokiej dostępności. Baza danych DB2 pureScale jest zainstalowana na maszynach wirtualnych platformy Azure z systemem Linux.

To podejście jest szablonem, który można zmodyfikować pod kątem rozmiaru i skali organizacji. Jest ona oparta na następujących kwestiach:

  • Co najmniej dwa elementy członkowskie bazy danych są łączone z co najmniej dwoma węzłami CF. Węzły zarządzają globalną pulą buforów (GBP) dla pamięci udostępnionej i usługami globalnego menedżera blokady (GLM) w celu kontrolowania współdzielonego dostępu i blokowania rywalizacji z aktywnymi członkami. Jeden węzeł CF działa jako podstawowy, a drugi jako pomocniczy węzeł CF trybu failover. Aby uniknąć pojedynczego punktu awarii w środowisku, klaster DB2 pureScale wymaga co najmniej czterech węzłów.

  • Magazyn udostępniony o wysokiej wydajności (pokazany na rysunku rozmiar P30). Każdy węzeł używa tego magazynu.

  • Sieć o wysokiej wydajności dla elementów członkowskich danych i magazynu udostępnionego.

Zagadnienia dotyczące obliczeń

Ta architektura uruchamia warstwy aplikacji, magazynu i danych na maszynach wirtualnych platformy Azure. Skrypty konfiguracji wdrożenia tworzą następujące elementy:

  • Klaster DB2 pureScale. Typ zasobów obliczeniowych potrzebnych na platformie Azure zależy od konfiguracji. Ogólnie rzecz biorąc, można użyć dwóch metod:

    • Użyj sieci w stylu obliczeń o wysokiej wydajności (HPC) w wielu węzłach, w której małe i średnie wystąpienia uzyskują dostęp do magazynu udostępnionego. W przypadku tego typu konfiguracji HPC maszyny wirtualne serii E lub maszyn wirtualnych serii L zoptymalizowane pod kątem pamięci platformy Azure zapewniają wymaganą moc obliczeniową.

    • Używaj mniejszej liczby dużych wystąpień maszyn wirtualnych dla aparatów danych. W przypadku dużych wystąpień największe maszyny wirtualne serii M zoptymalizowane pod kątem pamięci są idealne dla dużych obciążeń w pamięci. Może być potrzebne dedykowane wystąpienie, w zależności od rozmiaru partycji logicznej (LPAR), która jest używana do uruchamiania bazy danych DB2.

  • Usługa DB2 CF używa maszyn wirtualnych zoptymalizowanych pod kątem pamięci, takich jak seria E lub seria L.

  • Udostępniony klaster magazynu, który używa Standard_DS4_v2 maszyn wirtualnych z systemem Linux.

  • Serwer przesiadkowy zarządzania to maszyna wirtualna Standard_DS2_v2 z systemem Linux. Alternatywą jest usługa Azure Bastion, która zapewnia bezpieczne środowisko protokołu RDP/SSH dla wszystkich maszyn wirtualnych w sieci wirtualnej.

  • Klient jest Standard_DS3_v2 maszyną wirtualną z systemem Windows (używanym do testowania).

  • Opcjonalnie. Serwer monitora. Jest to wymagane tylko w przypadku niektórych wcześniejszych wersji bazy danych Db2 pureScale. W tym przykładzie użyto Standard_DS3_v2 maszyny wirtualnej z systemem Linux (używanej dla bazy danych DB2 pureScale).

Uwaga

Klaster DB2 pureScale wymaga co najmniej dwóch wystąpień DB2. Wymaga również wystąpienia pamięci podręcznej i wystąpienia menedżera blokady.

Zagadnienia dotyczące magazynu

Podobnie jak oracle RAC, baza danych DB2 pureScale to wysoce wydajny blok operacji we/wy, skalowana w poziomie baza danych. Zalecamy użycie największej opcji ssd w warstwie Premium platformy Azure , która odpowiada Twoim potrzebom. Mniejsze opcje magazynowania mogą być odpowiednie dla środowisk deweloperskich i testowych, podczas gdy środowiska produkcyjne często potrzebują większej pojemności magazynu. Przykładowa architektura używa P30 ze względu na stosunek liczby operacji we/wy na sekundę na rozmiar i cenę. Niezależnie od rozmiaru użyj Premium Storage, aby uzyskać najlepszą wydajność.

Baza danych DB2 pureScale używa architektury współdzielonej wszystkiego, gdzie wszystkie dane są dostępne ze wszystkich węzłów klastra. Magazyn Premium musi być współużytkowany w wielu wystąpieniach, niezależnie od tego, czy na żądanie, czy na wystąpieniach dedykowanych.

Duży klaster DB2 pureScale może wymagać 200 terabajtów (TB) lub więcej magazynu udostępnionego w warstwie Premium, przy czym liczba operacji we/wy na sekundę to 100 000. Baza danych DB2 pureScale obsługuje interfejs blokowy iSCSI, którego można używać na platformie Azure. Interfejs iSCSI wymaga udostępnionego klastra magazynu, który można zaimplementować za pomocą funkcji S2D lub innego narzędzia. Ten typ rozwiązania tworzy urządzenie sieci magazynu wirtualnego (vSAN) na platformie Azure. Baza danych DB2 pureScale używa sieci vSAN do zainstalowania klastrowanego systemu plików używanego do udostępniania danych między maszynami wirtualnymi.

Zagadnienia dotyczące pracy w sieci

Firma IBM zaleca sieć InfiniBand dla wszystkich członków w klastrze DB2 pureScale. Db2 pureScale używa również zdalnego bezpośredniego dostępu do pamięci (RDMA), jeśli jest dostępny, dla plików CFs.

Podczas instalacji utworzysz grupę zasobów platformy Azure, która będzie zawierać wszystkie maszyny wirtualne. Ogólnie rzecz biorąc, grupujesz zasoby na podstawie ich okresu istnienia i kto będzie nimi zarządzać. Maszyny wirtualne w tej architekturze wymagają przyspieszonej sieci. Jest to funkcja platformy Azure, która zapewnia spójne, bardzo niskie opóźnienie sieci za pośrednictwem wirtualizacji we/wy pojedynczego katalogu głównego (SR-IOV) do maszyny wirtualnej.

Każda maszyna wirtualna platformy Azure jest wdrażana w sieci wirtualnej, która ma podsieci: główne, fronton Gluster FS (gfsfe), zaplecze Gluster FS (bfsbe), DB2 pureScale (db2be) i DB2 pureScale fronton (db2fe). Skrypt instalacji tworzy również podstawowe karty sieciowe na maszynach wirtualnych w podsieci głównej.

Użyj sieciowych grup zabezpieczeń , aby ograniczyć ruch sieciowy w sieci wirtualnej i odizolować podsieci.

Na platformie Azure baza danych DB2 pureScale musi używać protokołu TCP/IP jako połączenia sieciowego dla magazynu.

Następne kroki