Ciągłość działania i hadR dla programu SQL Server na maszynach wirtualnych platformy Azure

Dotyczy:SQL Server na maszynie wirtualnej platformy Azure

Ciągłość działalności biznesowej oznacza kontynuowanie działalności w przypadku awarii, planowanie odzyskiwania i zapewnienie wysokiej dostępności danych. Program SQL Server w usłudze Azure Virtual Machines może pomóc obniżyć koszty rozwiązania bazy danych o wysokiej dostępności i odzyskiwaniu po awarii (HADR).

Większość rozwiązań HADR programu SQL Server jest obsługiwana na maszynach wirtualnych, zarówno w przypadku rozwiązań hybrydowych, jak i tylko na platformie Azure. W rozwiązaniu tylko dla platformy Azure cały system HADR działa na platformie Azure. W konfiguracji hybrydowej część rozwiązania działa na platformie Azure, a druga część działa lokalnie w organizacji. Elastyczność środowiska platformy Azure umożliwia częściowe lub całkowite przeniesienie na platformę Azure w celu spełnienia wymagań budżetowych i HADR systemów baz danych programu SQL Server.

W tym artykule porównaliśmy i porównaliśmy rozwiązania dotyczące ciągłości działania dostępne dla programu SQL Server na maszynach wirtualnych platformy Azure.

Omówienie

Należy upewnić się, że system bazy danych ma możliwości hadr wymagane przez umowę dotyczącą poziomu usług (SLA). Fakt, że platforma Azure udostępnia mechanizmy wysokiej dostępności, takie jak naprawianie usług w chmurze i wykrywanie odzyskiwania po awarii maszyn wirtualnych, nie gwarantuje, że można spełnić umowę SLA. Mimo że te mechanizmy pomagają chronić wysoką dostępność maszyny wirtualnej, nie chronią dostępności programu SQL Server uruchomionego na maszynie wirtualnej.

Wystąpienie programu SQL Server może zakończyć się niepowodzeniem, gdy maszyna wirtualna jest w trybie online i jest w dobrej kondycji. Nawet mechanizmy wysokiej dostępności zapewniane przez platformę Azure umożliwiają przestoje maszyn wirtualnych z powodu zdarzeń, takich jak odzyskiwanie po awariach oprogramowania lub sprzętu i uaktualnieniach systemu operacyjnego.

Magazyn geograficznie nadmiarowy (GRS) na platformie Azure jest implementowany za pomocą funkcji nazywanej replikacją geograficzną. Magazyn GRS może nie być odpowiednim rozwiązaniem odzyskiwania po awarii dla baz danych. Ponieważ replikacja geograficzna wysyła dane asynchronicznie, ostatnie aktualizacje mogą zostać utracone w przypadku awarii. Więcej informacji na temat ograniczeń replikacji geograficznej znajduje się w sekcji Obsługa replikacji geograficznej.

Uwaga

Teraz można podnieść i przenieść zarówno wystąpienie klastra trybu failover, jak i rozwiązanie grupy dostępności do programu SQL Server na maszynach wirtualnych platformy Azure przy użyciu usługi Azure Migrate.

Architektury wdrażania

pomoc techniczna platformy Azure te technologie programu SQL Server zapewniające ciągłość działania:

Technologie można połączyć, aby zaimplementować rozwiązanie programu SQL Server, które ma zarówno funkcje wysokiej dostępności, jak i odzyskiwania po awarii. W zależności od używanej technologii wdrożenie hybrydowe może wymagać tunelu VPN z siecią wirtualną platformy Azure. W poniższych sekcjach przedstawiono kilka przykładowych architektur wdrażania.

Tylko platforma Azure: rozwiązania o wysokiej dostępności

Możesz mieć rozwiązanie o wysokiej dostępności dla programu SQL Server na poziomie bazy danych z zawsze włączonymi grupami dostępności. Można również utworzyć rozwiązanie o wysokiej dostępności na poziomie wystąpienia przy użyciu wystąpień klastra trybu failover Always On. Aby uzyskać dodatkową ochronę, można utworzyć nadmiarowość na obu poziomach, tworząc grupy dostępności w wystąpieniach klastra trybu failover.

Technologia Przykładowe architektury
Grupy dostępności Repliki dostępności uruchomione na maszynach wirtualnych platformy Azure w tym samym regionie zapewniają wysoką dostępność. Należy skonfigurować maszynę wirtualną kontrolera domeny, ponieważ klaster trybu failover systemu Windows wymaga domeny usługi Active Directory.

Aby uzyskać większą nadmiarowość i dostępność, maszyny wirtualne platformy Azure można wdrożyć w różnych strefach dostępności zgodnie z opisem w omówieniu grupy dostępności. Diagram przedstawiający
Aby rozpocząć, zapoznaj się z samouczkiem dotyczącym grupy dostępności.
Wystąpienia klastra trybu failover Wystąpienia klastra trybu failover są obsługiwane na maszynach wirtualnych programu SQL Server. Ponieważ funkcja wystąpienia klastra trybu failover wymaga magazynu udostępnionego, pięć rozwiązań będzie działać z programem SQL Server na maszynach wirtualnych platformy Azure:

— Używanie dysków udostępnionych platformy Azure dla systemu Windows Server 2019. Udostępnione dyski zarządzane to produkt platformy Azure, który umożliwia jednoczesne dołączanie dysku zarządzanego do wielu maszyn wirtualnych. Maszyny wirtualne w klastrze mogą odczytywać lub zapisywać na dołączonym dysku na podstawie rezerwacji wybranej przez aplikację klastrowaną za pośrednictwem trwałych rezerwacji SCSI (SCSI PR). Żądanie SCSI to standardowe rozwiązanie magazynu, które jest używane przez aplikacje działające w lokalnej sieci magazynowania (SAN). Włączenie żądania ŚCIągnięcia SCSI na dysku zarządzanym umożliwia migrowanie tych aplikacji na platformę Azure w taki sposób, jak to jest.

— Używanie Miejsca do magazynowania Direct (S2D) do zapewnienia programowej wirtualnej sieci SAN dla systemu Windows Server 2016 i nowszych.

— Używanie udziału plików w warstwie Premium dla systemu Windows Server 2012 lub nowszego. Udziały plików w warstwie Premium są obsługiwane przez dyski SSD, mają stale małe opóźnienia i są w pełni obsługiwane w przypadku używania z klastrem trybu failover.

— Używanie magazynu obsługiwanego przez rozwiązanie partnerskie do klastrowania. Aby zapoznać się z konkretnym przykładem korzystającym z usługi SIOS DataKeeper, zobacz wpis w blogu Klaster trybu failover i usługa DataKeeper SIOS.

— Używanie udostępnionego magazynu blokowego dla zdalnego obiektu docelowego iSCSI za pośrednictwem usługi Azure ExpressRoute. Na przykład usługa NetApp Private Storage (NPS) uwidacznia obiekt docelowy iSCSI za pośrednictwem usługi ExpressRoute z aplikacją Equinix na maszynach wirtualnych platformy Azure.

W przypadku rozwiązań do magazynowania udostępnionego i replikacji danych od partnerów firmy Microsoft skontaktuj się z dostawcą, aby uzyskać informacje dotyczące uzyskiwania dostępu do danych w trybie failover.

Aby rozpocząć, przygotuj maszynę wirtualną do wystąpienia klastra trybu failover

Tylko platforma Azure: rozwiązania odzyskiwania po awarii

Możesz mieć rozwiązanie odzyskiwania po awarii dla baz danych programu SQL Server na platformie Azure przy użyciu grup dostępności, dublowania bazy danych lub tworzenia kopii zapasowych i przywracania za pomocą obiektów blob magazynu.

Technologia Przykładowe architektury
Grupy dostępności Repliki dostępności działające w wielu centrach danych na maszynach wirtualnych platformy Azure na potrzeby odzyskiwania po awarii. To rozwiązanie obejmujące wiele regionów pomaga chronić przed całkowitą awarią witryny.
Diagram przedstawiający dwa regiony z repliką podstawową i repliką pomocniczą połączoną za pomocą zatwierdzenia asynchronicznego.
W obrębie regionu wszystkie repliki powinny znajdować się w tej samej usłudze w chmurze i tej samej sieci wirtualnej. Ponieważ każdy region będzie miał oddzielną sieć wirtualną, te rozwiązania wymagają łączności między sieciami. Aby uzyskać więcej informacji, zobacz Configure a network-to-network connection by using the Azure Portal (Konfigurowanie połączenia sieciowego-sieć przy użyciu witryny Azure Portal). Aby uzyskać szczegółowe instrukcje, zobacz Konfigurowanie zawsze włączonej grupy dostępności programu SQL Server w różnych regionach świadczenia usługi Azure.
Dublowanie bazy danych Podmiot zabezpieczeń i serwerów i serwerów działających w różnych centrach danych na potrzeby odzyskiwania po awarii. Należy je wdrożyć przy użyciu certyfikatów serwera.
Diagram przedstawiający podmiot zabezpieczeń w jednym regionie połączonym z dublowaniem w innym regionie z wysoką wydajnością.
Tworzenie kopii zapasowych i przywracanie za pomocą usługi Azure Blob Storage Produkcyjne bazy danych kopii zapasowej bezpośrednio do magazynu obiektów blob w innym centrum danych na potrzeby odzyskiwania po awarii.
Diagram przedstawiający bazę danych w jednym regionie kopii zapasowej do usługi Blob Storage w innym regionie.
Aby uzyskać więcej informacji, zobacz Tworzenie kopii zapasowych i przywracanie dla programu SQL Server na maszynach wirtualnych platformy Azure.
Replikowanie i przełączanie programu SQL Server w tryb failover na platformę Azure za pomocą usługi Azure Site Recovery Produkcyjne wystąpienie programu SQL Server w jednym centrum danych platformy Azure replikowane bezpośrednio do usługi Azure Storage w innym centrum danych platformy Azure na potrzeby odzyskiwania po awarii.
Diagram przedstawiający bazę danych w jednym centrum danych platformy Azure przy użyciu replikacji usługi ASR na potrzeby odzyskiwania po awarii w innym centrum danych.
Aby uzyskać więcej informacji, zobacz Ochrona programu SQL Server przy użyciu odzyskiwania po awarii programu SQL Server i usługi Azure Site Recovery.

Hybrydowe dział IT: rozwiązania odzyskiwania po awarii

Możesz mieć rozwiązanie odzyskiwania po awarii dla baz danych programu SQL Server w hybrydowym środowisku IT przy użyciu grup dostępności, dublowania bazy danych, wysyłania dzienników oraz tworzenia kopii zapasowych i przywracania za pomocą usługi Azure Blob Storage.

Technologia Przykładowe architektury
Grupy dostępności Niektóre repliki dostępności uruchomione na maszynach wirtualnych platformy Azure i inne repliki działające lokalnie na potrzeby odzyskiwania po awarii między lokacjami. Lokacja produkcyjna może być lokalna lub w centrum danych platformy Azure.
Diagram grup dostępności.
Ponieważ wszystkie repliki dostępności muszą znajdować się w tym samym klastrze trybu failover, klaster musi obejmować obie sieci (klaster trybu failover z wieloma podsieciami). Ta konfiguracja wymaga połączenia sieci VPN między platformą Azure i siecią lokalną.

W przypadku pomyślnego odzyskiwania po awarii baz danych należy również zainstalować kontroler domeny repliki w lokacji odzyskiwania po awarii. Aby rozpocząć, zapoznaj się z samouczkiem dotyczącym grupy dostępności.
Dublowanie bazy danych Jeden partner działający na maszynie wirtualnej platformy Azure i drugi działający lokalnie na potrzeby odzyskiwania po awarii między lokacjami przy użyciu certyfikatów serwera. Partnerzy nie muszą znajdować się w tej samej domenie usługi Active Directory i nie jest wymagane żadne połączenie sieci VPN.
Diagram dublowania bazy danych.
Inny scenariusz dublowania bazy danych obejmuje jednego partnera uruchomionego na maszynie wirtualnej platformy Azure, a drugi działający lokalnie w tej samej domenie usługi Active Directory na potrzeby odzyskiwania po awarii między lokacjami. Wymagane jest połączenie sieci VPN między siecią wirtualną platformy Azure a siecią lokalną.

W przypadku pomyślnego odzyskiwania po awarii baz danych należy również zainstalować kontroler domeny repliki w lokacji odzyskiwania po awarii.
Wysyłanie dziennika Jeden serwer działający na maszynie wirtualnej platformy Azure i drugi działający lokalnie na potrzeby odzyskiwania po awarii między lokacjami. Wysyłanie dziennika zależy od udostępniania plików systemu Windows, dlatego wymagane jest połączenie sieci VPN między siecią wirtualną platformy Azure a siecią lokalną.
Diagram przedstawiający wysyłanie dziennika.
W przypadku pomyślnego odzyskiwania po awarii baz danych należy również zainstalować kontroler domeny repliki w lokacji odzyskiwania po awarii.
Tworzenie kopii zapasowych i przywracanie za pomocą usługi Azure Blob Storage Lokalne produkcyjne bazy danych utworzone bezpośrednio w usłudze Azure Blob Storage na potrzeby odzyskiwania po awarii.
Diagram przedstawiający tworzenie kopii zapasowych i przywracanie.
Aby uzyskać więcej informacji, zobacz Tworzenie kopii zapasowych i przywracanie dla programu SQL Server na maszynach wirtualnych platformy Azure.
Replikowanie i przełączanie programu SQL Server w tryb failover na platformę Azure za pomocą usługi Azure Site Recovery Lokalne wystąpienie produkcyjne programu SQL Server replikowane bezpośrednio do usługi Azure Storage na potrzeby odzyskiwania po awarii.
Diagram replikowania przy użyciu usługi Azure Site Recovery.
Aby uzyskać więcej informacji, zobacz Ochrona programu SQL Server przy użyciu odzyskiwania po awarii programu SQL Server i usługi Azure Site Recovery.

Bezpłatna replika odzyskiwania po awarii na platformie Azure

Jeśli masz pakiet Software Assurance, możesz zaimplementować plany odzyskiwania po awarii hybrydowej za pomocą programu SQL Server bez ponoszenia dodatkowych kosztów licencjonowania dla pasywnego wystąpienia odzyskiwania po awarii. Kwalifikujesz się również do licencjonowanych replik odzyskiwania po awarii z licencjonowaniem z płatnością zgodnie z rzeczywistym użyciem, jeśli wszystkie repliki są hostowane na platformie Azure.

Na przykład możesz mieć dwa bezpłatne pasywne sekundy, gdy wszystkie trzy repliki są hostowane na platformie Azure:

Diagram dwóch bezpłatnych pasywnych elementów, gdy wszystko na platformie Azure.

Możesz też skonfigurować hybrydowe środowisko trybu failover z licencjonowanym podstawowym środowiskiem lokalnym, jednym bezpłatnym pasywnym dla wysokiej dostępności, jednym bezpłatnym pasywnym dla środowiska lokalnego odzyskiwania po awarii i jednym bezpłatnym pasywnym dla odzyskiwania po awarii na platformie Azure:

Diagram trzech wolnych pasywów, gdy środowisko jest hybrydowe z jedną podstawową repliką lokalną.

Aby uzyskać więcej informacji, zobacz postanowienia licencyjne dotyczące produktów.

Aby włączyć tę korzyść, przejdź do zasobu maszyny wirtualnej programu SQL Server. Wybierz pozycję Konfiguruj w obszarze Ustawienia, a następnie wybierz opcję wysokiej dostępności/odzyskiwania po awarii w obszarze Licencja programu SQL Server. Zaznacz pole wyboru, aby potwierdzić, że ta maszyna wirtualna z programem SQL Server będzie używana jako replika pasywna, a następnie wybierz pozycję Zastosuj , aby zapisać ustawienia. Gdy wszystkie trzy repliki są hostowane na platformie Azure, klienci z płatnością zgodnie z rzeczywistym użyciem mają również prawo do korzystania z typu licencji wysokiej dostępności/odzyskiwania po awarii.

Diagram przedstawiający konfigurowanie repliki odzyskiwania po awarii na platformie Azure.

Ważne zagadnienia dotyczące usługi HADR programu SQL Server na platformie Azure

Maszyny wirtualne platformy Azure, magazyn i sieć mają różne cechy operacyjne niż lokalna, niezwirtualizowana infrastruktura IT. Pomyślna implementacja rozwiązania HADR SQL Server na platformie Azure wymaga zrozumienia tych różnic i zaprojektowania rozwiązania w celu ich uwzględnienia.

Węzły wysokiej dostępności w zestawie dostępności

Zestawy dostępności na platformie Azure umożliwiają umieszczenie węzłów wysokiej dostępności w oddzielnych domenach błędów i domenach aktualizacji. Platforma Azure przypisuje domenę aktualizacji i domenę błędów do każdej maszyny wirtualnej w zestawie dostępności. Ta konfiguracja w centrum danych gwarantuje, że podczas planowanego lub nieplanowanego zdarzenia konserwacji co najmniej jedna maszyna wirtualna jest dostępna i spełnia umowę SLA platformy Azure na poziomie 99,95%.

Aby skonfigurować konfigurację wysokiej dostępności, umieść wszystkie uczestniczące maszyny wirtualne programu SQL Server w tym samym zestawie dostępności, aby uniknąć utraty aplikacji lub danych podczas zdarzenia konserwacji. Tylko węzły w tej samej usłudze w chmurze mogą uczestniczyć w tym samym zestawie dostępności. Aby uzyskać więcej informacji, zobacz Manage the availability of virtual machines (Zarządzanie dostępnością maszyn wirtualnych).

Węzły wysokiej dostępności w strefie dostępności

Strefy dostępności to unikatowe lokalizacje fizyczne w regionie świadczenia usługi Azure. Każda strefa składa się z co najmniej jednego centrum danych wyposażonego w niezależne zasilanie, chłodzenie i sieć. Fizyczne rozdzielenie stref dostępności w regionie pomaga chronić aplikacje i dane przed awariami centrum danych, zapewniając dostępność co najmniej jednej maszyny wirtualnej i spełnia umowę SLA platformy Azure na poziomie 99,99%.

Aby skonfigurować wysoką dostępność, umieść uczestniczące maszyny wirtualne programu SQL Server rozmieszczone w różnych strefach dostępności w regionie. Między strefami dostępności będą naliczane dodatkowe opłaty za transfery między sieciami. Aby uzyskać więcej informacji, zobacz Strefy dostępności.

Opóźnienie sieci w hybrydowym środowisku IT

Wdróż rozwiązanie HADR z założeniem, że mogą występować okresy dużego opóźnienia sieci między siecią lokalną a platformą Azure. Podczas wdrażania replik na platformie Azure użyj zatwierdzenia asynchronicznego zamiast synchronicznego zatwierdzenia dla trybu synchronizacji. Podczas wdrażania serwerów dublowania baz danych zarówno w środowisku lokalnym, jak i na platformie Azure, należy użyć trybu wysokiej wydajności zamiast trybu wysokiego bezpieczeństwa.

Zapoznaj się z najlepszymi rozwiązaniami dotyczącymi konfiguracji usługi HADR dla ustawień klastra i usługi HADR, które mogą pomóc w uwzględnienia środowiska chmury.

Obsługa replikacji geograficznej

Replikacja geograficzna na dyskach platformy Azure nie obsługuje pliku danych i pliku dziennika tej samej bazy danych, która ma być przechowywana na oddzielnych dyskach. Magazyn GRS replikuje zmiany na każdym dysku niezależnie i asynchronicznie. Ten mechanizm gwarantuje kolejność zapisu na jednym dysku na kopii zreplikowanej geograficznie, ale nie w kopiach zreplikowanych geograficznie wielu dysków. Jeśli skonfigurujesz bazę danych do przechowywania pliku danych i jego pliku dziennika na osobnych dyskach, odzyskane dyski po awarii mogą zawierać bardziej aktualną kopię pliku danych niż plik dziennika, który przerywa dziennik zapisu w programie SQL Server i właściwości ACID (niepodzielność, spójność, izolacja i trwałość) transakcji.

Jeśli nie masz opcji wyłączenia replikacji geograficznej na koncie magazynu, zachowaj wszystkie pliki danych i plików dziennika dla bazy danych na tym samym dysku. Jeśli musisz użyć więcej niż jednego dysku ze względu na rozmiar bazy danych, wdróż jedno z wymienionych wcześniej rozwiązań odzyskiwania po awarii, aby zapewnić nadmiarowość danych.

Następne kroki

Zdecyduj, czy grupa dostępności lub wystąpienie klastra trybu failover jest najlepszym rozwiązaniem w zakresie ciągłości działalności biznesowej dla Twojej firmy. Następnie zapoznaj się z najlepszymi rozwiązaniami dotyczącymi konfigurowania środowiska pod kątem wysokiej dostępności i odzyskiwania po awarii.