Поделиться через


Отказоустойчивая кластеризация Windows Server с SQL Server

Область применения: SQL Server

В этой статье представлен обзор использования отказоустойчивого кластера Windows Server (WSFC) с SQL Server для обеспечения высокой доступности и аварийного восстановления. Отказоустойчивый кластер Windows Server (WSFC) представляет собой группу независимых серверов, совместная работа которых позволяет повысить доступность приложений и служб. SQL Server использует службы и возможности WSFC для поддержки групп доступности AlwaysOn и экземпляров отказоустойчивого кластера SQL Server.

Термины и определения

Отказоустойчивый кластер Windows Server (WSFC) — это группа независимых серверов, совместная работа которых позволяет повысить доступность приложений и служб.

Узел
Сервер, который является членом WSFC.

Ресурс кластера
Физическая или логическая сущность, которая может принадлежать узлу, которую можно переводить в режимы «в сети» и «вне сети», перемещать между узлами и которой можно управлять как объектом кластера. Ресурс кластера может принадлежать одновременно только одному узлу.

Роль
Коллекция ресурсов кластера, управляемая как единый объект кластера и предоставляющая определенные функциональные возможности. Для SQL Server роль будет либо группой доступности AlwaysOn (AG), либо экземпляром отказоустойчивого кластера AlwaysOn (FCI). Роль содержит все ресурсы кластера, необходимые для роли группы доступности или экземпляра отказоустойчивого кластера. Отработка отказа и восстановление размещения всегда выполняются в контексте ролей. Для FCI роль содержит ресурс IP-адреса, ресурс имени сети и ресурсы SQL Server. Роль группы доступности содержит ресурс группы доступности, а если прослушиватель настроен, сетевое имя и РЕСУРС IP.

Ресурс сетевого имени
Имя логического сервера, которое управляется как ресурс кластера. Ресурс сетевого имени должен использоваться с ресурсом IP-адреса. Для этих записей могут потребоваться объекты в службах домен Active Directory и (или) DNS.

Зависимость ресурсов
Ресурс, от которого зависит другой ресурс. Если ресурс A зависит от ресурса B, то B — это зависимость от A. Ресурс A не сможет запуститься без ресурса B.

Предпочитаемый владелец
Предпочтительный узел для запуска группы ресурсов. Каждая группа ресурсов связана со списком предпочитаемых владельцев, отсортированных в порядке предпочтения. Во время автоматического перехода на другой ресурс группа ресурсов перемещается на следующий предпочтительный узел в списке.

Возможный владелец
Дополнительный узел, на котором может запускаться ресурс. Каждая группа ресурсов связана со списком возможных владельцев. Отработка отказа ролей может выполняться только на узлы из списка возможных владельцев.

Режим кворума
Конфигурация кворума в отказоустойчивом кластере, определяющая количество сбоев узлов, которое может выдержать кластер.

Обязательный кворум
Процесс запуска кластера несмотря на то, что на связи недостаточное количество элементов для кворума.

Обзор отказоустойчивого кластера Windows Server

Отказоустойчивая кластеризация Windows Server предоставляет функции инфраструктуры, поддерживающие сценарии высокого уровня доступности и аварийного восстановления размещенных серверных приложений, таких как Microsoft SQL Server и Microsoft Exchange. При отказе узла кластера или службы все службы, которые размещались на этом узле, могут автоматически или вручную переноситься на другой доступный узел в рамках процесса под названием отработка отказа.

Узлы в кластере WSFC за счет совместной работы обеспечивают следующие типы возможностей:

  • Распределенные метаданные и уведомления. Метаданные служб и размещенных приложений WSFC хранятся на каждом узле кластера. Среди этих метаданных не только параметры размещенных приложений, но также конфигурация и состояние WSFC. Изменения в метаданных или состоянии узла автоматически распространяются на другие узлы кластера WSFC.

  • Управление ресурсами. Отдельные узлы в WSFC могут предоставлять физические ресурсы, такие как хранилище с прямым подключением, сетевые интерфейсы и доступ к общему хранилищу дисков. Размещенные приложения регистрируются в качестве ресурса кластера и могут настраивать зависимости запуска и работоспособности от других ресурсов.

  • Наблюдение за работоспособностью. Определение исправности основного узла и исправности между узлами осуществляется за счет сочетания сетевых соединений по типу тактовых импульсов и мониторинга ресурсов. Общее состояние работоспособности кластера WSFC определяется голосами кворума узлов в кластере.

  • Координация отработки отказа. Каждый ресурс настроен для размещения на основном узле, и каждый можно автоматически или вручную переносить на один или несколько второстепенных узлов. Политика отработки отказа в зависимости от исправности управляет автоматическим переносом владения ресурсами между узлами. Узлы и размещенные приложения уведомляются при отработки отказа, чтобы они могли реагировать соответствующим образом.

Дополнительные сведения см. в статье "Обзор отказоустойчивой кластеризации " Windows Server".

Технологии SQL Server AlwaysOn и WSFC

SQL Server AlwaysOn — это решение высокого уровня доступности и аварийного восстановления, которое использует преимущества WSFC. Компоненты AlwaysOn представляют собой интегрированные, гибкие решения, повышающие доступность приложений, окупаемость вложений в оборудование и упрощающее развертывание систем высокого уровня доступности и управление ими.

Как группы доступности AlwaysOn, так и экземпляры отказоустойчивого кластера AlwaysOn используют WSFC в качестве технологии платформы, регистрируя компоненты в качестве ресурсов кластера WSFC. Связанные ресурсы объединяются в роль, которую можно сделать зависимой от других ресурсов кластера WSFC. WSFC может понять и сообщить о необходимости перезапуска экземпляра SQL Server или автоматического отработки отказа на другой узел сервера в WSFC.

Внимание

Чтобы воспользоваться всеми преимуществами технологий SQL Server AlwaysOn, необходимо применить несколько необходимых компонентов, связанных с WSFC.

Дополнительные сведения см. в статье "Предварительные требования", "Ограничения" и "Рекомендации" для групп доступности AlwaysOn.

Высокий уровень доступности экземпляров с экземплярами отказоустойчивого кластера AlwaysOn

Экземпляр отказоустойчивого кластера AlwaysOn (FCI) — это экземпляр SQL Server, установленный на разных узлах в WSFC. Этот тип экземпляра зависит от ресурсов для хранения и имени виртуальной сети. Хранилище может использовать общее дисковое пространство на базе Fibre Channel, iSCSI, FCoE или SAS либо локально подключенное хранилище на основе локальных дисковых пространств (S2D). Ресурс имени виртуальной сети зависит от одного или нескольких виртуальных IP-адресов, которые расположены в разных подсетях. Служба SQL Server и служба агента SQL Server также являются ресурсами, и обе они зависят от ресурсов хранилища и имени виртуальной сети.

В случае отработки отказа служба WSFC переносит владение ресурсов экземпляра на указанный узел отработки отказа. Затем экземпляр SQL Server перезапускается на узле отработки отказа, а базы данных восстанавливаются как обычно. В любой момент времени FCI и базовые ресурсы могут размещаться только на одном узле в кластере.

Примечание.

Экземпляр отказоустойчивого кластера AlwaysOn требует симметричного общего дискового хранилища, например сети хранения (SAN) или общей папки SMB. Тома общего дискового хранилища должны быть доступны всем потенциальным узлам отработки отказа в кластере WSFC.

Дополнительные сведения см. в статье " Экземпляры отказоустойчивого кластера AlwaysOn".

Высокий уровень доступности базы данных с группами доступности AlwaysOn

Группа доступности AlwaysOn — это группирование одной или нескольких пользовательских баз данных, которые отработки отказа объединяются. Группа доступности состоит из первичной реплики доступности и от одной до четырех вторичных реплик, которые поддерживаются за счет перемещения данных на основании журнала SQL Server для обеспечения защиты данных, не требующей общего хранилища. Каждая реплика размещается экземпляром SQL Server на другом узле WSFC. Группа доступности и соответствующее имя виртуальной сети регистрируются как ресурсы в кластере WSFC.

Прослушиватель группы доступности на узле первичной реплики отвечает на входящие запросы клиента для подключения к имени виртуальной сети и на основе атрибутов в строка подключения он перенаправляет каждый запрос на соответствующий экземпляр SQL Server.

В случае отработки отказа вместо передачи владения общими физическими ресурсами на другой узел WSFC используется для перенастройки вторичной реплики на другом экземпляре SQL Server, чтобы стать основной репликой группы доступности. Затем ресурс виртуального сетевого имени группы доступности переводится на этот экземпляр.

В любой момент только один экземпляр SQL Server может размещать основную реплику баз данных группы доступности, все связанные вторичные реплики должны находиться в отдельном экземпляре, и каждый экземпляр должен находиться на отдельных физических узлах.

Примечание.

Группы доступности AlwaysOn не требуют развертывания экземпляра отказоустойчивого кластера или использования симметричного общего хранилища (SAN или SMB).

Экземпляр отказоустойчивого кластера (FCI) может использоваться вместе с группой доступности для повышения доступности реплики доступности. Однако во избежание соперничества в кластере WSFC автоматический переход на другой ресурс группы доступности не поддерживается для реплики доступности, размещенной в FCI.

Дополнительные сведения см. в статье "Обзор групп доступности AlwaysOn".

Мониторинг работоспособности и отработка отказа WSFC

Высокая доступность решения AlwaysOn осуществляется с помощью упреждающего мониторинга работоспособности физических и логических ресурсов кластера WSFC, а также автоматической отработки отказа на избыточное оборудование и их перенастройку. Системный администратор также может инициировать отработку отказа вручную группы доступности или экземпляра SQL Server с одного узла на другой.

Политики отработки отказа для узлов, экземпляров отказоустойчивого кластера и групп доступности

Политика отработки отказа настраивается на узле WSFC, экземпляре отказоустойчивого кластера SQL Server (FCI) и уровнях группы доступности. Эти политики, основанные на серьезности, длительности и частоте неработоспособного состояния ресурсов кластера и скорости реагирования узла, могут активировать перезапуск службы или автоматическую отработку отказа ресурсов кластера с одного узла на другой или активировать перемещение первичной реплики группы доступности из одного экземпляра SQL Server в другой.

Отработка отказа реплики группы доступности не влияет на базовый экземпляр SQL Server. Отработка отказа FCI перемещает размещенные реплики группы доступности с экземпляром.

Дополнительные сведения см. в статье " Политика отработки отказа для экземпляров отказоустойчивого кластера".

Обнаружение работоспособности ресурсов WSFC

Все ресурсы в кластере WSFC могут сообщать о своем состоянии и работоспособности периодически или по запросу. Различные обстоятельства могут указывать на сбой ресурсов; Например, сбой питания, ошибки диска или памяти, ошибки сетевого взаимодействия или неответственные службы.

Ресурсы кластера WSFC, например сети, хранилища и службы, можно делать зависимыми друг от друга. Совокупная исправность ресурса определяется путем последовательного суммирования его работоспособности с исправностью каждого из зависимых ресурсов.

Обнаружение работоспособности между узлами WSFC и голосование кворума

Все узлы в кластере WSFC участвуют в периодической передаче пульса, сообщающего состояние работоспособности узла другим узлам. Неотвечающие узлы считаются неисправными.

Кворум — это механизм, позволяющий обеспечивать работоспособность кластера WSFC путем проверки наличия достаточного количества ресурсов в нем. Если WSFC имеет достаточно голосов, он работоспособен и может обеспечить отказоустойчивость на уровне узла.

Режим кворума настраивается в кластере WSFC, который определяет методику голосования кворума, а также момент выполнения автоматического перехода на другой ресурс или перевода кластера в режим "вне сети".

Совет

Рекомендуется, чтобы число голосов кворума в кластере WSFC всегда было нечетным. В целях голосования кворума SQL Server не должен быть установлен на всех узлах в кластере. Дополнительный сервер может выступать в качестве члена кворума, либо модель кворума WSFC можно настроить для использования удаленной общей папки в качестве решающего голоса.

Дополнительные сведения см. в разделе : Режимы кворума WSFC и конфигурация голосования.

Аварийное восстановление путем принудительного кворума

В зависимости от операционных методик и конфигурации WSFC можно выполнять автоматическую и ручную отработку отказа, а также поддерживать надежное отказоустойчивое решение SQL Server AlwaysOn. Однако, если кворум соответствующих узлов голосования в WSFC не может взаимодействовать друг с другом, или если кластер WSFC в противном случае завершает проверку работоспособности, WSFC может перейти в автономный режим.

При переходе кластера WSFC в автономный режим из-за неожиданной аварии или по причине постоянно возникающего сбоя в работе оборудования или ошибки связи требуется вмешательство администратора для принудительного создания кворума и переключения работоспособных кластеров обратно в режим "в сети" в неотказоустойчивой конфигурации.

После этого будет необходимо также предпринять ряд действий по перенастройке кластера WSFC, восстановлению затронутых реплик баз данных и повторному созданию кворума.

Дополнительные сведения см. в статье об аварийном восстановлении WSFC с помощью принудительного кворума .

Связь компонентов AlwaysOn SQL Server с WSFC

Между функциями и компонентами и компонентами SQL Server AlwaysOn существует несколько уровней связей.

Группы доступности AlwaysOn размещаются в экземплярах SQL Server.
Клиентский запрос, указывающий сетевое имя прослушивателя группы логической доступности для подключения к базе данных-источнику или базе данных-получателю, перенаправляется в соответствующее имя сети экземпляра SQL Server или FCI SQL Server.

Экземпляры SQL Server активно размещаются на одном узле.
При наличии автономный экземпляр SQL Server всегда находится на одном узле со статическим именем сети экземпляра. При наличии FCI SQL Server активен на одном из двух или более возможных узлов отработки отказа с одним именем сети виртуального экземпляра.

Узлы являются членами кластера WSFC.
Метаданные и состояние конфигурации WSFC для всех узлов сохраняются на каждом узле. Каждый сервер может предоставлять асимметричное хранилище или тома общего хранилища (SAN) для пользовательских или системных баз данных. Каждый сервер имеет по крайней мере один физический сетевой интерфейс в одной или нескольких IP-подсетях.

Кластер WSFC контролирует работоспособность группы серверов и управляет их конфигурацией.
Механизмы WSFC распространяют изменения в метаданных и состоянии конфигурации WSFC во всех узлах кластера WSFC. Если используется диск-свидетель, метаданные также хранятся на нем. По умолчанию каждый узел WSFC получает голосование по кворуму, а свидетель будет использоваться при необходимости и настроен.

Разделы реестра групп доступности AlwaysOn — это подразделы кластера WSFC.

При удалении и повторном создании WSFC необходимо отключить и повторно включить функцию групп доступности AlwaysOn на каждом экземпляре сервера, который был включен для групп доступности AlwaysOn в исходном WSFC. Дополнительные сведения см. в разделе "Включение и отключение групп доступности AlwaysOn".

Снимок экрана: отказоустойчивый кластер Windows Server.

Связанные задачи