Udostępnij za pośrednictwem


Ciągłość działania i hadR dla programu SQL Server na maszynach wirtualnych platformy Azure

Dotyczy: program SQL Server na maszynie wirtualnej platformy Azure

W tym artykule porównaliśmy i porównaliśmy rozwiązania tylko dla platformy Azure i hybrydowej ciągłości biznesowej, których można użyć do zapewnienia wysokiej dostępności i odzyskiwania po awarii (HADR) z programem SQL Server na maszynach wirtualnych platformy Azure

Ciągłość działalności biznesowej oznacza kontynuowanie działalności w przypadku awarii, planowanie odzyskiwania i zapewnienie wysokiej dostępności danych. Program SQL Server w usłudze Azure Virtual Machines może pomóc obniżyć koszty rozwiązania bazy danych o wysokiej dostępności i odzyskiwaniu po awarii (HADR).

Uwaga

Istnieje możliwość przeniesienia zarówno wystąpienia klastra trybu failover, jak i rozwiązania grupy dostępności do programu SQL Server na maszynach wirtualnych platformy Azure przy użyciu usługi Azure Migrate.

Omówienie

Program SQL Server na maszynach wirtualnych platformy Azure obsługuje następujące rozwiązania:

  • Tylko platforma Azure: cały system HADR działa na platformie Azure.
  • Hybrydowe: część rozwiązania działa na platformie Azure, a druga część działa lokalnie w organizacji.

Elastyczność środowiska platformy Azure umożliwia częściowe lub całkowite przeniesienie na platformę Azure w celu spełnienia wymagań budżetowych i HADR systemów baz danych programu SQL Server. Należy upewnić się, że systemy baz danych mają możliwości hadr spełniające wymagania biznesowe dotyczące celu czasu odzyskiwania (RTO), celu punktu odzyskiwania (RPO) i umowy dotyczącej poziomu usług (SLA).

Wbudowane mechanizmy wysokiej dostępności udostępniane przez platformę Azure, takie jak naprawianie usług w chmurze i wykrywanie odzyskiwania po awarii maszyn wirtualnych, nie gwarantują spełnienia umowy SLA, celu czasu odzyskiwania lub celu punktu odzyskiwania. Mimo że te mechanizmy pomagają chronić wysoką dostępność maszyny wirtualnej, nie chronią dostępności programu SQL Server uruchomionego na maszynie wirtualnej. Wystąpienie programu SQL Server może zakończyć się niepowodzeniem, gdy maszyna wirtualna jest w trybie online i jest w dobrej kondycji. Nawet mechanizmy wysokiej dostępności zapewniane przez platformę Azure umożliwiają przestoje maszyn wirtualnych z powodu zdarzeń, takich jak odzyskiwanie po awariach oprogramowania lub sprzętu i uaktualnieniach systemu operacyjnego.

Funkcje ciągłości działania

W poniższej tabeli wymieniono zarówno funkcje tylko platformy Azure, jak i hybrydowego programu SQL Server, których można użyć do zapewnienia wysokiej dostępności (HA), odzyskiwania po awarii (DR) lub obu tych funkcji (HA/DR):

Te funkcje programu SQL Server są obsługiwane w celu zapewnienia ciągłości działania zarówno w konfiguracji hybrydowej, jak i tylko na platformie Azure. Niektóre z tych opcji są idealne zarówno w przypadku wysokiej dostępności, jak i odzyskiwania po awarii (HA/DR), wysokiej dostępności (HA), podczas gdy inne będą używane do odzyskiwania po awarii (DR).

Funkcje programu SQL Server Opcja wysokiej dostępności/odzyskiwania po awarii Szczegóły
Zawsze włączone grupy dostępności Wysoka dostępność i odzyskiwanie po awarii Zapewnia ochronę na poziomie bazy danych, zwiększa wysoką dostępność i odzyskiwanie po awarii, dodając repliki w różnych strefach dostępności i/lub regionach.
Zawsze włączone wystąpienia klastra trybu failover (FCI) Wysoka dostępność Używa magazynu udostępnionego do zapewnienia ochrony na poziomie wystąpienia. Zwiększ ochronę zarówno na poziomie bazy danych, jak i wystąpienia, łącząc się z grupami dostępności.
Wysyłanie dziennika Odzyskiwanie po awarii Ochrona na poziomie bazy danych na potrzeby odzyskiwania po awarii obejmuje wysyłanie kopii zapasowych dziennika transakcji z serwera podstawowego i przywracanie ich do serwera pomocniczego. Wymagany jest udział plików platformy Azure.
Tworzenie kopii zapasowej i przywracanie programu SQL Server za pomocą usługi Azure Blob Storage Odzyskiwanie po awarii Produkcyjne kopie zapasowe bazy danych przechowywane w usłudze Azure Blob Storage na potrzeby ochrony odzyskiwania po awarii.
Azure Site Recovery Odzyskiwanie po awarii Rozwiązanie odzyskiwania po awarii, które replikuje maszyny wirtualne z lokacji głównej do lokacji dodatkowej.

Technologie można połączyć, aby zaimplementować rozwiązanie programu SQL Server, które ma zarówno funkcje wysokiej dostępności, jak i odzyskiwania po awarii. W zależności od używanej technologii wdrożenie hybrydowe może wymagać tunelu VPN z siecią wirtualną platformy Azure. Chociaż technologie są takie same, mogą istnieć pewne różnice w sposobie ich konfigurowania na platformie Azure lub w projekcie hybrydowym.

Grupy dostępności (HADR)

Ochronę programu SQL Server na maszynach wirtualnych platformy Azure na poziomie bazy danych można wykonać przy użyciu grup dostępności jako rozwiązania wysokiej dostępności i odzyskiwania po awarii (HADR). Repliki uruchomione na maszynach wirtualnych platformy Azure w tym samym regionie zapewniają wysoką dostępność. Maszyna wirtualna kontrolera domeny jest wymagana, ponieważ klaster trybu failover systemu Windows wymaga domeny usługi Active Directory.

Diagram przedstawiający kontroler domeny nad klastrem WSFC wykonanym z repliki podstawowej, repliki pomocniczej i monitora udziału plików.

Aby rozpocząć, zapoznaj się z samouczkiem dotyczącym grupy dostępności.

Aby zapewnić większą nadmiarowość, dostępność i ochronę odzyskiwania po awarii, maszyny wirtualne platformy Azure można wdrożyć w różnych strefach dostępności zgodnie z opisem w omówieniu grupy dostępności. Rozszerzanie replik dostępności w celu uruchamiania w wielu centrach danych na maszynach wirtualnych platformy Azure zwiększa pokrycie odzyskiwania po awarii. Rozwiązanie obejmujące wiele regionów pomaga chronić przed całkowitą awarią lokacji.

Diagram przedstawiający dwa regiony z repliką podstawową i repliką pomocniczą połączoną za pomocą zatwierdzenia asynchronicznego.

W obrębie regionu wszystkie repliki powinny znajdować się w tej samej usłudze w chmurze i tej samej sieci wirtualnej. Ponieważ każdy region ma oddzielną sieć wirtualną, te rozwiązania wymagają łączności między sieciami. Aby uzyskać więcej informacji, zobacz Configure a network-to-network connection by using the Azure Portal (Konfigurowanie połączenia sieciowego-sieć przy użyciu witryny Azure Portal). Aby uzyskać szczegółowe instrukcje, zobacz Konfigurowanie zawsze włączonej grupy dostępności programu SQL Server w różnych regionach świadczenia usługi Azure.

W konfiguracji hybrydowej niektóre repliki dostępności działają na maszynach wirtualnych platformy Azure, a inne repliki są lokalne na potrzeby odzyskiwania po awarii między lokacjami. Lokacja produkcyjna może być lokalna lub w centrum danych platformy Azure.

Diagram grup dostępności skonfigurowanych ze środowiska lokalnego na platformę Azure.

Ponieważ wszystkie repliki dostępności muszą znajdować się w tym samym klastrze trybu failover, klaster musi obejmować obie sieci (klaster trybu failover z wieloma podsieciami). Ta konfiguracja wymaga połączenia sieci VPN między platformą Azure i siecią lokalną.

W przypadku pomyślnego odzyskiwania po awarii baz danych należy również zainstalować kontroler domeny repliki w lokacji odzyskiwania po awarii. Aby rozpocząć, zapoznaj się z samouczkiem dotyczącym grupy dostępności.

Wystąpienia klastra trybu failover (HA)

Program SQL Server na maszynach wirtualnych platformy Azure obsługuje wystąpienia klastra trybu failover (FCI), a to rozwiązanie zapewnia wysoką dostępność na poziomie wystąpienia. Aby uzyskać dodatkową ochronę, można utworzyć nadmiarowość zarówno na poziomie bazy danych, jak i wystąpienia, tworząc grupy dostępności na podstawie wystąpień klastra trybu failover. Funkcja wystąpienia klastra trybu failover wymaga magazynu udostępnionego i istnieje pięć rozwiązań, które działają z programem SQL Server na maszynach wirtualnych platformy Azure:

  • Używanie dysków udostępnionych platformy Azure dla systemu Windows Server 2019. Udostępnione dyski zarządzane to produkt platformy Azure, który umożliwia jednoczesne dołączanie dysku zarządzanego do wielu maszyn wirtualnych. Maszyny wirtualne w klastrze mogą odczytywać lub zapisywać na dołączonym dysku na podstawie rezerwacji wybranej przez aplikację klastrowaną za pośrednictwem trwałych rezerwacji SCSI (SCSI PR). Żądanie SCSI to standardowe rozwiązanie magazynu, które jest używane przez aplikacje działające w lokalnej sieci magazynowania (SAN). Włączenie żądania ŚCIągnięcia SCSI na dysku zarządzanym umożliwia migrowanie tych aplikacji na platformę Azure w taki sposób, jak to jest.

  • Używanie Miejsca do magazynowania Direct (S2D) w celu zapewnienia programowej wirtualnej sieci SAN dla systemu Windows Server 2016 i nowszych.

  • Używanie udziału plików w warstwie Premium dla systemu Windows Server 2012 lub nowszego. Udziały plików w warstwie Premium są obsługiwane przez dyski SSD, mają stale małe opóźnienia i są w pełni obsługiwane w przypadku używania z klastrem trybu failover.

  • Używanie magazynu obsługiwanego przez rozwiązanie partnerskie do klastrowania. Aby zapoznać się z konkretnym przykładem korzystającym z usługi SIOS DataKeeper, zobacz wpis w blogu Klaster trybu failover i usługa DataKeeper SIOS.

  • Używanie udostępnionego magazynu blokowego dla zdalnego obiektu docelowego iSCSI za pośrednictwem usługi Azure ExpressRoute. Na przykład usługa NetApp Private Storage (NPS) uwidacznia obiekt docelowy iSCSI za pośrednictwem usługi ExpressRoute z aplikacją Equinix na maszynach wirtualnych platformy Azure.

W przypadku rozwiązań do magazynowania udostępnionego i replikacji danych od partnerów firmy Microsoft skontaktuj się z dostawcą, aby uzyskać informacje dotyczące uzyskiwania dostępu do danych w trybie failover.

Aby rozpocząć, przygotuj maszynę wirtualną na potrzeby wystąpienia klastra trybu failover.

Wysyłanie dzienników (DR)

Innym rozwiązaniem odzyskiwania po awarii na platformie Azure jest wysyłanie dzienników, które automatycznie wysyła kopie zapasowe dziennika transakcji z podstawowej bazy danych na serwerze podstawowym do co najmniej jednej pomocniczej bazy danych na oddzielnym serwerze pomocniczym. Konfiguracja wysyłania dziennika używa udziału plików platformy Azure do przechowywania kopii zapasowych dziennika transakcji.

Diagram przedstawiający wysyłanie dzienników na platformie Azure.

Jeśli musisz skonfigurować wysyłanie dzienników w środowisku hybrydowym, jeden serwer znajduje się na maszynie wirtualnej platformy Azure, a drugi jest lokalny na potrzeby odzyskiwania po awarii między lokacjami. Wysyłanie dziennika zależy od udostępniania plików systemu Windows, dlatego wymagane jest połączenie sieci VPN między siecią wirtualną platformy Azure a siecią lokalną.

Diagram przedstawiający wysyłanie dziennika.

W przypadku pomyślnego odzyskiwania po awarii baz danych należy również zainstalować kontroler domeny repliki w lokacji odzyskiwania po awarii.

Tworzenie kopii zapasowej i przywracanie (DR)

Tworzenie kopii zapasowych produkcyjnych baz danych jest niezbędne do odzyskiwania po awarii. Na platformie Azure można tworzyć kopie zapasowe baz danych bezpośrednio w usłudze Blob Storage w innym centrum danych na potrzeby odzyskiwania po awarii.

Diagram przedstawiający bazę danych w jednym regionie kopii zapasowej do usługi Blob Storage w innym regionie.

W rozwiązaniu hybrydowym lokalne produkcyjne bazy danych można wykonywać bezpośrednio w usłudze Azure Blob Storage na potrzeby odzyskiwania po awarii.

Diagram przedstawiający tworzenie kopii zapasowych i przywracanie.

Aby uzyskać więcej informacji, zobacz Tworzenie kopii zapasowych i przywracanie dla programu SQL Server na maszynach wirtualnych platformy Azure.

Replikowanie za pomocą usługi Azure Site Recovery (DR)

Usługa Azure Site Recovery może służyć jako rozwiązanie odzyskiwania po awarii na platformie Azure i w konfiguracji hybrydowej.

Na platformie Azure produkcyjne wystąpienie programu SQL Server w jednym centrum danych platformy Azure jest replikowane bezpośrednio do usługi Azure Storage w innym centrum danych platformy Azure na potrzeby odzyskiwania po awarii.

Diagram przedstawiający bazę danych w jednym centrum danych platformy Azure przy użyciu replikacji usługi Azure Site Recovery na potrzeby odzyskiwania po awarii w innym centrum danych.

W przypadku środowisk hybrydowych lokalne wystąpienie produkcyjne programu SQL Server jest replikowane bezpośrednio do usługi Azure Storage na potrzeby odzyskiwania po awarii.

Diagram replikowania przy użyciu usługi Azure Site Recovery.

Aby uzyskać więcej informacji, zobacz Ochrona programu SQL Server przy użyciu odzyskiwania po awarii programu SQL Server i usługi Azure Site Recovery.

Bezpłatna replika odzyskiwania po awarii na platformie Azure

Jeśli masz pakiet Software Assurance, możesz zaimplementować plany odzyskiwania po awarii hybrydowej za pomocą programu SQL Server bez ponoszenia dodatkowych kosztów licencjonowania dla pasywnego wystąpienia odzyskiwania po awarii. Kwalifikujesz się również do licencjonowanych replik odzyskiwania po awarii z licencjonowaniem z płatnością zgodnie z rzeczywistym użyciem, jeśli wszystkie repliki są hostowane na platformie Azure.

Na przykład możesz mieć dwa bezpłatne pasywne sekundy, gdy wszystkie trzy repliki są hostowane na platformie Azure:

Diagram dwóch bezpłatnych pasywnych elementów, gdy wszystko na platformie Azure.

Możesz też skonfigurować hybrydowe środowisko trybu failover z licencjonowanym podstawowym środowiskiem lokalnym, jednym bezpłatnym pasywnym dla wysokiej dostępności, jednym bezpłatnym pasywnym dla środowiska lokalnego odzyskiwania po awarii i jednym bezpłatnym pasywnym dla odzyskiwania po awarii na platformie Azure:

Diagram trzech wolnych pasywów, gdy środowisko jest hybrydowe z jedną podstawową repliką lokalną.

Aby uzyskać więcej informacji, zobacz postanowienia licencyjne dotyczące produktów.

Aby włączyć tę korzyść, przejdź do zasobu maszyny wirtualnej programu SQL Server. Wybierz pozycję Konfiguruj w obszarze Ustawienia, a następnie wybierz opcję wysokiej dostępności/odzyskiwania po awarii w obszarze Licencja programu SQL Server, a następnie wybierz pozycję Zastosuj , aby zapisać ustawienia. Gdy wszystkie trzy repliki są hostowane na platformie Azure, klienci z płatnością zgodnie z rzeczywistym użyciem mają również prawo do korzystania z typu licencji wysokiej dostępności/odzyskiwania po awarii.

Diagram przedstawiający konfigurowanie repliki odzyskiwania po awarii na platformie Azure.

Ważne zagadnienia dotyczące usługi HADR programu SQL Server na platformie Azure

Maszyny wirtualne, magazyn i sieć platformy Azure mają różne cechy operacyjne niż lokalna, niewirtualna infrastruktura IT. Pomyślna implementacja rozwiązania HADR SQL Server na platformie Azure wymaga zrozumienia tych różnic i zaprojektowania rozwiązania w celu ich uwzględnienia.

Węzły wysokiej dostępności w zestawie dostępności

Zestawy dostępności na platformie Azure umożliwiają umieszczenie węzłów wysokiej dostępności w oddzielnych domenach błędów i domenach aktualizacji. Platforma Azure przypisuje domenę aktualizacji i domenę błędów do każdej maszyny wirtualnej w zestawie dostępności. Ta konfiguracja w centrum danych gwarantuje, że podczas planowanego lub nieplanowanego zdarzenia konserwacji co najmniej jedna maszyna wirtualna jest dostępna i spełnia umowę SLA platformy Azure na poziomie 99,95%.

Aby skonfigurować konfigurację wysokiej dostępności, umieść wszystkie uczestniczące maszyny wirtualne programu SQL Server w tym samym zestawie dostępności, aby uniknąć utraty aplikacji lub danych podczas zdarzenia konserwacji. Tylko węzły w tej samej usłudze w chmurze mogą uczestniczyć w tym samym zestawie dostępności. Aby uzyskać więcej informacji, zobacz Manage the availability of virtual machines (Zarządzanie dostępnością maszyn wirtualnych).

Węzły wysokiej dostępności w strefie dostępności

Strefy dostępności to unikatowe lokalizacje fizyczne w regionie świadczenia usługi Azure. Każda strefa składa się z co najmniej jednego centrum danych wyposażonego w niezależne zasilanie, chłodzenie i sieć. Fizyczne rozdzielenie stref dostępności w regionie pomaga chronić aplikacje i dane przed awariami centrum danych, zapewniając dostępność co najmniej jednej maszyny wirtualnej i spełnia umowę SLA platformy Azure na poziomie 99,99%.

Aby skonfigurować wysoką dostępność, umieść uczestniczące maszyny wirtualne programu SQL Server rozmieszczone w różnych strefach dostępności w regionie. Między strefami dostępności będą naliczane dodatkowe opłaty za transfery między sieciami. Aby uzyskać więcej informacji, zobacz Strefy dostępności.

Opóźnienie sieci w hybrydowym środowisku IT

Wdróż rozwiązanie HADR z założeniem, że mogą występować okresy dużego opóźnienia sieci między siecią lokalną a platformą Azure. Podczas wdrażania replik na platformie Azure użyj zatwierdzenia asynchronicznego zamiast synchronicznego zatwierdzenia dla trybu synchronizacji. Podczas wdrażania serwerów dublowania baz danych zarówno w środowisku lokalnym, jak i na platformie Azure, należy użyć trybu wysokiej wydajności zamiast trybu wysokiego bezpieczeństwa.

Zapoznaj się z najlepszymi rozwiązaniami dotyczącymi konfiguracji usługi HADR dla ustawień klastra i usługi HADR, które mogą pomóc w uwzględnienia środowiska chmury.

Obsługa replikacji geograficznej

Replikacja geograficzna na dyskach platformy Azure nie obsługuje pliku danych i pliku dziennika tej samej bazy danych, która ma być przechowywana na oddzielnych dyskach. Magazyn GRS replikuje zmiany na każdym dysku niezależnie i asynchronicznie. Ten mechanizm gwarantuje kolejność zapisu na jednym dysku na kopii zreplikowanej geograficznie, ale nie w kopiach zreplikowanych geograficznie wielu dysków. Jeśli skonfigurujesz bazę danych do przechowywania pliku danych i jego pliku dziennika na osobnych dyskach, odzyskane dyski po awarii mogą zawierać bardziej aktualną kopię pliku danych niż plik dziennika, który przerywa dziennik zapisu w programie SQL Server i właściwości ACID (niepodzielność, spójność, izolacja i trwałość) transakcji.

Jeśli nie masz opcji wyłączenia replikacji geograficznej na koncie magazynu, zachowaj wszystkie pliki danych i plików dziennika dla bazy danych na tym samym dysku. Jeśli musisz użyć więcej niż jednego dysku ze względu na rozmiar bazy danych, wdróż jedno z wymienionych wcześniej rozwiązań odzyskiwania po awarii, aby zapewnić nadmiarowość danych.

Następne kroki

Zdecyduj, czy grupa dostępności lub wystąpienie klastra trybu failover jest najlepszym rozwiązaniem w zakresie ciągłości działalności biznesowej dla Twojej firmy. Następnie zapoznaj się z najlepszymi rozwiązaniami dotyczącymi konfigurowania środowiska pod kątem wysokiej dostępności i odzyskiwania po awarii.