Бөлісу құралы:


Отказоустойчивая кластеризация Windows Server с SQL Server

Область применения: SQL Server

Отказоустойчивый кластер Windows Server (WSFC) представляет собой группу независимых серверов, совместная работа которых позволяет повысить доступность приложений и служб. SQL Server использует службы И возможности WSFC для поддержки групп доступности AlwaysOn и экземпляров отказоустойчивого кластера SQL Server.

Условия и определения

Отказоустойчивый кластер Windows Server (WSFC) — это группа независимых серверов, совместная работа которых позволяет повысить доступность приложений и служб.

Узел
Сервер, который является членом WSFC.

Ресурс кластера
Физическая или логическая сущность, которая может принадлежать узлу, которую можно переводить в режимы «в сети» и «вне сети», перемещать между узлами и которой можно управлять как объектом кластера. Ресурс кластера может принадлежать одновременно только одному узлу.

Роль
Коллекция ресурсов кластера, управляемая как единый объект кластера и предоставляющая определенные функциональные возможности. Для SQL Server ролью будет группа доступности AlwaysOn или экземпляр отказоустойчивого кластера AlwaysOn. Роль содержит все ресурсы кластера, необходимые для роли группы доступности или экземпляра отказоустойчивого кластера. Отработка отказа и восстановление размещения всегда выполняются в контексте ролей. Роль экземпляра отказоустойчивого кластера содержит ресурс IP-адреса, ресурс сетевого имени и ресурсы SQL Server. Роль группы доступности содержит ресурс группы доступности, а также, если настроен прослушиватель, ресурсы сетевого имени и IP-адреса.

Ресурс сетевого имени
Имя логического сервера, которое управляется как ресурс кластера. Ресурс сетевого имени должен использоваться с ресурсом IP-адреса. Для этих элементов могут требоваться объекты в доменных службах Active Directory или в службе доменных имен (DNS).

Зависимость ресурсов
Ресурс, от которого зависит другой ресурс. Если ресурс А зависит от ресурса Б, то Б является зависимостью А. Ресурс A невозможно будет запустить, если отсутствует ресурс Б.

Предпочитаемый владелец
Предпочтительный узел для запуска группы ресурсов. Каждая группа ресурсов связана со списком предпочитаемых владельцев, отсортированных в порядке предпочтения. Во время автоматического перехода на другой ресурс группа ресурсов перемещается на следующий предпочтительный узел в списке.

Возможный владелец
Дополнительный узел, на котором может запускаться ресурс. Каждая группа ресурсов связана со списком возможных владельцев. Отработка отказа ролей может выполняться только на узлы из списка возможных владельцев.

Режим кворума
Конфигурация кворума в отказоустойчивом кластере, определяющая количество сбоев узлов, которое может выдержать кластер.

Обязательный кворум
Процесс запуска кластера несмотря на то, что на связи недостаточное количество элементов для кворума.

Обзор отказоустойчивого кластера Windows Server

Отказоустойчивая кластеризация Windows Server предоставляет функции инфраструктуры, поддерживающие сценарии высокого уровня доступности и аварийного восстановления размещенных серверных приложений, таких как Microsoft SQL Server и Microsoft Exchange. При отказе узла кластера или службы все службы, которые размещались на этом узле, могут автоматически или вручную переноситься на другой доступный узел в рамках процесса под названием отработка отказа.

Узлы в кластере WSFC за счет совместной работы обеспечивают следующие типы возможностей:

  • Распределенные метаданные и уведомления. Метаданные служб и размещенных приложений WSFC хранятся на каждом узле кластера. Среди этих метаданных не только параметры размещенных приложений, но также конфигурация и состояние WSFC. Изменения в метаданных или состоянии узла автоматически распространяются на другие узлы кластера WSFC.

  • Управление ресурсами. Отдельные узлы в кластере WSFC могут предоставлять физические ресурсы, например подключаемое напрямую хранилище, сетевые интерфейсы и доступ к общему дисковому хранилищу. Размещенные приложения регистрируют себя как ресурсы кластера и могут настраивать запуск и зависимости от исправности других ресурсов.

  • Наблюдение за работоспособностью. Определение исправности основного узла и исправности между узлами осуществляется за счет сочетания сетевых соединений по типу тактовых импульсов и мониторинга ресурсов. Общее состояние работоспособности кластера WSFC определяется голосами кворума узлов в кластере.

  • Координация отработки отказа. Каждый ресурс настроен для размещения на основном узле, и каждый можно автоматически или вручную переносить на один или несколько второстепенных узлов. Политика отработки отказа в зависимости от исправности управляет автоматическим переносом владения ресурсами между узлами. Узлы и размещенные приложения получают уведомления об отработке отказа, что позволяет им выполнить соответствующие действия.

Дополнительные сведения см. в статье Failover Clustering Overview — Windows Server(Обзор отказоустойчивой кластеризации — Windows Server).

Технологии SQL Server AlwaysOn и WSFC

SQL Server AlwaysOn — это решение высокого уровня доступности и аварийного восстановления, которое использует преимущества WSFC. Компоненты AlwaysOn представляют собой интегрированные, гибкие решения, повышающие доступность приложений, окупаемость вложений в оборудование и упрощающее развертывание систем высокого уровня доступности и управление ими.

Как группы доступности AlwaysOn, так и экземпляры отказоустойчивого кластера AlwaysOn используют WSFC в качестве технологии платформы, регистрируя компоненты в качестве ресурсов кластера WSFC. Связанные ресурсы объединяются в роль, которую можно сделать зависимой от других ресурсов кластера WSFC. WSFC может понять и сообщить о необходимости перезапуска экземпляра SQL Server или автоматического отработки отказа на другой узел сервера в WSFC.

Внимание

Чтобы воспользоваться всеми преимуществами технологий SQL Server AlwaysOn, необходимо применить несколько необходимых компонентов, связанных с WSFC.

Дополнительные сведения см. в разделе Предварительные требования, ограничения и рекомендации для групп доступности Always On (SQL Server).

Высокий уровень доступности на уровне экземпляра с помощью экземпляров отказоустойчивого кластера AlwaysOn

Экземпляр отказоустойчивого кластера AlwaysOn (FCI) — это экземпляр SQL Server, установленный на узлах в WSFC. Этот тип экземпляра зависит от ресурсов для хранения и имени виртуальной сети. Хранилище может использовать общее дисковое пространство на базе Fibre Channel, iSCSI, FCoE или SAS либо локально подключенное хранилище на основе локальных дисковых пространств (S2D). Ресурс имени виртуальной сети зависит от одного или нескольких виртуальных IP-адресов, которые расположены в разных подсетях. Служба SQL Server и служба агента SQL Server также являются ресурсами, и обе они зависят от ресурсов хранилища и имени виртуальной сети.

В случае отработки отказа служба WSFC переносит владение ресурсов экземпляра на указанный узел отработки отказа. Затем экземпляр SQL Server повторно запускается на узле отработки отказа, а базы данных восстанавливаются как обычно. В любой момент времени FCI и базовые ресурсы могут размещаться только на одном узле в кластере.

Примечание.

Экземпляру отказоустойчивого кластера Always On требуется симметричное общее дисковое хранилище, например сеть хранения данных (SAN) или общая папка SMB. Тома общего дискового хранилища должны быть доступны всем потенциальным узлам отработки отказа в кластере WSFC.

Дополнительные сведения см. в статье Экземпляры отказоустойчивого кластера групп доступности Always On (SQL Server).

Высокий уровень доступности базы данных с группами доступности AlwaysOn

Группа доступности AlwaysOn — это одна или несколько пользовательских баз данных, для которых отработка отказа выполняется одновременно. Группа доступности состоит из первичной реплики доступности и от одной до четырех вторичных реплик, которые поддерживаются за счет перемещения данных на основании журнала SQL Server для обеспечения защиты данных, не требующей общего хранилища. Каждая реплика размещается экземпляром SQL Server на другом узле WSFC. Группа доступности и соответствующее имя виртуальной сети регистрируются как ресурсы в кластере WSFC.

Прослушиватель группы доступности на узле первичной реплики отвечает на входящие запросы клиента для подключения к имени виртуальной сети и на основе атрибутов в строка подключения он перенаправляет каждый запрос на соответствующий экземпляр SQL Server.

В случае отработки отказа вместо передачи владения общими физическими ресурсами на другой узел WSFC используется для перенастройки вторичной реплики на другом экземпляре SQL Server, чтобы стать основной репликой группы доступности. Затем ресурс виртуального сетевого имени группы доступности переводится на этот экземпляр.

В любой момент только один экземпляр SQL Server может размещать основную реплику баз данных группы доступности, все связанные вторичные реплики должны находиться в отдельном экземпляре, и каждый экземпляр должен находиться на отдельных физических узлах.

Примечание.

Группы доступности AlwaysOn не требует развертывать экземпляр отказоустойчивого кластера или использовать симметричное общее хранилище (SAN или SMB).

Экземпляр отказоустойчивого кластера (FCI) может использоваться совместно с группой доступности для повышения доступности реплики доступности. Однако во избежание соперничества в кластере WSFC автоматический переход на другой ресурс группы доступности не поддерживается для реплики доступности, размещенной в FCI.

Дополнительные сведения см. в статье Обзор групп доступности AlwaysOn SQL Server)

Мониторинг исправности WSFC и отработка отказа

Высокий уровень доступности для решения AlwaysOn осуществляется с помощью упреждающего мониторинга работоспособности физических и логических ресурсов кластера WSFC, а также автоматической отработки отказа на избыточное оборудование и повторной настройки. Системный администратор также может инициировать отработку отказа вручную группы доступности или экземпляра SQL Server с одного узла на другой.

Политики отработки отказа для узлов, экземпляров отказоустойчивого кластера и групп доступности

Политика отработки отказа настраивается на узле WSFC, экземпляре отказоустойчивого кластера SQL Server (FCI) и уровнях группы доступности. Эти политики, основанные на серьезности, длительности и частоте неработоспособного состояния ресурсов кластера и скорости реагирования узла, могут активировать перезапуск службы или автоматическую отработку отказа ресурсов кластера с одного узла на другой или активировать перемещение первичной реплики группы доступности из одного экземпляра SQL Server в другой.

Отработка отказа реплики группы доступности не влияет на базовый экземпляр SQL Server. При отработке отказа экземпляра отказоустойчивого кластера вместе с этим экземпляром перемещаются размещенные реплики группы доступности.

Дополнительные сведения см. в разделе Политика отработки отказа для экземпляров откзоустойчивого кластера.

Определение исправности ресурсов WSFC

Все ресурсы в кластере WSFC могут сообщать о своем состоянии и работоспособности периодически или по запросу. Об отказе ресурса могут говорить различные обстоятельства, например неисправность электропитания, ошибки дисков или памяти, ошибки в сети, неотвечающие службы.

Ресурсы кластера WSFC, например сети, хранилища и службы, можно делать зависимыми друг от друга. Совокупная исправность ресурса определяется путем последовательного суммирования его работоспособности с исправностью каждого из зависимых ресурсов.

Определение исправности между узлами WSFC и определение голосов в кворуме

Все узлы в кластере WSFC участвуют в периодической передаче пульса, сообщающего состояние работоспособности узла другим узлам. Неотвечающие узлы считаются неисправными.

Кворум — это механизм, позволяющий обеспечивать работоспособность кластера WSFC путем проверки наличия достаточного количества ресурсов в нем. Если кластер WSFC имеет достаточно голосов, он работоспособен и может обеспечивать отказоустойчивость на уровне узлов.

Режим кворума настраивается в кластере WSFC, который определяет методику голосования кворума, а также момент выполнения автоматического перехода на другой ресурс или перевода кластера в режим "вне сети".

Совет

Рекомендуется, чтобы число голосов кворума в кластере WSFC всегда было нечетным. В целях голосования кворума SQL Server не должен быть установлен на всех узлах в кластере. Дополнительный сервер может выступать в качестве члена кворума, либо модель кворума WSFC можно настроить для использования удаленной общей папки в качестве решающего голоса.

Дополнительные сведения см. в разделе Режим кворума и участвующая в голосовании конфигурация WSFC (SQL Server).

Аварийное восстановление через принудительный кворум

В зависимости от операционных методик и конфигурации WSFC можно выполнять автоматическую и ручную отработку отказа, а также поддерживать надежное отказоустойчивое решение SQL Server AlwaysOn. Однако если кворуму узлов с правом голоса в кластере WSFC не удается связаться друг с другом либо если кластеру WSFC по другим причинам не удается проверить работоспособность, то кластер WSFC может перейти в автономный режим.

При переходе кластера WSFC в автономный режим из-за неожиданной аварии или по причине постоянно возникающего сбоя в работе оборудования или ошибки связи требуется вмешательство администратора для принудительного создания кворума и переключения работоспособных кластеров обратно в режим "в сети" в неотказоустойчивой конфигурации.

После этого будет необходимо также предпринять ряд действий по перенастройке кластера WSFC, восстановлению затронутых реплик баз данных и повторному созданию кворума.

Дополнительные сведения см. в статье Аварийное восстановление WSFC через принудительный кворум (SQL Server).

Связь компонентов групп доступности Always On сервера SQL Server с WSFC

Между функциями и компонентами и компонентами SQL Server AlwaysOn существует несколько уровней связей.

Группы доступности AlwaysOn размещаются в экземплярах SQL Server.
Клиентский запрос, указывающий сетевое имя прослушивателя группы логической доступности для подключения к базе данных-источнику или базе данных-получателю, перенаправляется в соответствующее имя сети экземпляра SQL Server или FCI SQL Server.

Экземпляры SQL Server активно размещаются на одном узле.
При наличии автономный экземпляр SQL Server всегда находится на одном узле со статическим именем сети экземпляра. При наличии FCI SQL Server активен на одном из двух или более возможных узлов отработки отказа с одним именем сети виртуального экземпляра.

Узлы являются членами кластера WSFC.
Метаданные и состояние конфигурации WSFC для всех узлов сохраняются на каждом узле. Каждый сервер может предоставлять тома асимметричного хранения или общего хранения (SAN) для пользовательских и системных баз данных. Каждый сервер имеет по крайней мере один физический сетевой интерфейс в одной или нескольких IP-подсетях.

Кластер WSFC контролирует работоспособность группы серверов и управляет их конфигурацией.
Механизмы WSFC распространяют изменения в метаданных и состоянии конфигурации WSFC во всех узлах кластера WSFC. Если используется диск-свидетель, метаданные также хранятся на нем. По умолчанию каждый узел кластера WSFC имеет голос в кворуме, а ресурс-свидетель используется, если он необходим и настроен.

Разделы реестра групп доступности AlwaysOn — это подразделы кластера WSFC.
При удалении и повторном создании WSFC необходимо отключить и повторно включить функцию групп доступности AlwaysOn на каждом экземпляре сервера, который был включен для групп доступности AlwaysOn в исходном WSFC. Дополнительные сведения см. в разделе Включение и отключение групп доступности Always On (SQL Server).

Снимок экрана: отказоустойчивый кластер Windows Server.

Связанные задачи

См. также

См. также

Экземпляры отказоустойчивого кластера AlwaysOn (SQL Server)Обзор групп доступности AlwaysOn (SQL Server)Режимы кворума WSFC и политика отработки отказа (SQL Server)Отработка отказа для экземпляровотказоустойчивого кластера WSFC Аварийное восстановление с помощью принудительного кворума (SQL Server)
Windows Server 2016 поддерживает функцию локальных дисковых пространств Windows Server 2016