Поделиться через


Отказоустойчивая кластеризация Windows Server (WSFC) с SQL Server

Новая Отказоустойчивая кластеризация Windows Server (WSFC) представляет собой группу независимых серверов, совместная работа которых позволяет повысить доступность приложений и служб. SQL Server 2014 использует службы и возможности WSFC для поддержки групп доступности Always On и экземпляров отказоустойчивого кластера SQL Server.

Термины и определения

Кластер WSFC Кластер отказоустойчивости Windows Server (WSFC) — это группа независимых серверов, которые совместно работают для повышения доступности приложений и служб.

Экземпляр отказоустойчивого кластера Экземпляр службы Windows, которая управляет ресурсом IP-адреса, ресурсом сетевого имени и дополнительными ресурсами, необходимыми для запуска одного или нескольких приложений или служб. Клиенты могут использовать сетевое имя для доступа к ресурсам в группе аналогично использованию имени компьютера для доступу к службам на физическом сервере. Однако, поскольку экземпляр отказоустойчивого кластера является группой, для него возможен переход на другой узел без изменения базового имени или адреса.

Node — система Microsoft Windows Server, которая является активным или неактивным членом кластера серверов.

Ресурс кластера — физическая или логическая сущность, которая может принадлежать узлу, переведена в режим "в сети" и переведена в автономный режим, перемещается между узлами и управляется как объектом кластера. Ресурс кластера может принадлежать одновременно только одному узлу.

Группа ресурсов Коллекция ресурсов кластера, управляемых как один объект кластера. Обычно группа ресурсов содержит все ресурсы кластера, которые требуются для выполнения конкретного приложения или службы. Отработка отказа и возврат всегда выполняются для групп ресурсов.

Зависимость ресурса Ресурс, от которого зависит другой ресурс. Если ресурс A зависит от ресурса B, то B является зависимостью A.

Ресурс имени сети Имя логического сервера, управляемого как ресурс кластера. Ресурс сетевого имени должен использоваться с ресурсом IP-адреса.

Предпочтительный владелец Узел, на котором группа ресурсов предпочитает выполняться. Каждая группа ресурсов связана со списком предпочитаемых владельцев, отсортированных в порядке предпочтения. Во время автоматического перехода на другой ресурс группа ресурсов перемещается на следующий предпочтительный узел в списке.

Возможный владелец Вторичный узел, на котором может выполняться ресурс. Каждая группа ресурсов связана со списком возможных владельцев. Группы ресурсов могут выполнять переход только на узлы из списка возможных владельцев.

Режим кворума Конфигурация кворума в отказоустойчивом кластере, которая определяет количество сбоев узлов, которые может поддерживать кластер.

Принудительный кворум Процесс запуска кластера, несмотря на то, что только меньшинство элементов, необходимых для кворума, находятся в обмене данными.

Дополнительные сведения см. в статье Глоссарий отказоустойчивого кластера

Обзор отказоустойчивого кластера Windows Server

Отказоустойчивая кластеризация Windows Server предусматривает инфраструктурные компоненты, поддерживающие сценарии высокого уровня доступности и аварийного восстановления для таких размещенных серверных приложений, как Microsoft SQL Server и Microsoft Exchange. При отказе узла кластера или службы все службы, которые размещались на этом узле, могут автоматически или вручную переноситься на другой доступный узел в рамках процесса под названием отработка отказа.

Узлы в кластере WSFC за счет совместной работы обеспечивают следующие типы возможностей:

  • Распределенные метаданные и уведомления. Метаданные служб и размещенных приложений WSFC хранятся на каждом узле кластера. Среди этих метаданных не только параметры размещенных приложений, но также конфигурация и состояние WSFC. Изменения в метаданных или состоянии узла автоматически распространяются на других узлах кластера.

  • Управление ресурсами. Отдельные узлы в кластере могут предоставлять физические ресурсы, например подключаемое напрямую хранилище, сетевые интерфейсы и доступ к общему дисковому хранилищу. Размещенные приложения регистрируют себя как ресурсы кластера и могут настраивать запуск и зависимости от исправности других ресурсов.

  • Мониторинг исправности. Определение исправности основного узла и исправности между узлами осуществляется за счет сочетания сетевых соединений по типу тактовых импульсов и мониторинга ресурсов. Общее состояние работоспособности кластера определяется голосами кворума узлов в кластере.

  • Координация отработки отказа. Каждый ресурс настроен для размещения на основном узле, и каждый можно автоматически или вручную переносить на один или несколько второстепенных узлов. Политика отработки отказа в зависимости от исправности управляет автоматическим переносом владения ресурсами между узлами. Узлы и размещенные приложения получают уведомления об отработке отказа, что позволяет им выполнить соответствующие действия.

Дополнительные сведения см. в статье Отказоустойчивые кластеры в Windows Server 2008 R2

Технологии SQL Server AlwaysOn и WSFC

SQL Server 2014 AlwaysOn — это новое решение для обеспечения высокого уровня доступности и аварийного восстановления, использующее WSFC. AlwaysOn представляет собой интегрированное, гибкое решение, повышающее доступность приложения, окупаемость вложений в оборудование и упрощающее развертывание систем высокого уровня доступности и управление ими.

Как Always On группы доступности, так и экземпляры отказоустойчивого кластера AlwaysOn используют WSFC в качестве платформы, регистрируя компоненты в качестве ресурсов кластера WSFC. Связанные ресурсы объединяются в группу ресурсов, которую можно сделать зависимой от других ресурсов кластера WSFC. Затем служба кластера WSFC может понять и сообщить о необходимости перезапуска экземпляра SQL Server или автоматической отработки отказа на другой узел сервера в кластере WSFC.

Важно!

Чтобы в полной мере воспользоваться преимуществами SQL Server технологий AlwaysOn, необходимо применить несколько предварительных требований, связанных с WSFC.

Дополнительные сведения см. в разделе Предварительные требования, ограничения и рекомендации для групп доступности AlwaysOn (SQL Server)

Высокий уровень доступности на уровне экземпляра с помощью экземпляров отказоустойчивого кластера AlwaysOn

Экземпляр отказоустойчивого кластера (FCI) AlwaysOn — это экземпляр SQL Server, который устанавливается на разных узлах в кластере WSFC. Этот тип экземпляра имеет зависимости ресурсов от общего дискового хранилища (через Fibre Channel или iSCSI SAN) и от имени виртуальной сети. Имя виртуальной сети имеет зависимость ресурсов от одного или нескольких виртуальных IP-адресов, каждый в отдельной подсети. Служба SQL Server и служба агента SQL Server регистрируются в качестве ресурсов, и обе службы становятся зависимыми от виртуального ресурса сетевого имени.

В случае отработки отказа служба WSFC переносит владение ресурсов экземпляра на указанный узел отработки отказа. Затем экземпляр SQL Server перезапускается на узле отработки отказа и выполняется обычное восстановление баз данных. В любой момент времени FCI и базовые ресурсы могут размещаться только на одном узле в кластере.

Примечание

Экземпляру отказоустойчивого кластера AlwaysOn требуется симметричное общее дисковое хранилище, например сеть хранения данных (SAN) или общая папка SMB. Тома общего дискового хранилища должны быть доступны всем потенциальным узлам отработки отказа в кластере WSFC.

Дополнительные сведения см. в статье Экземпляры отказоустойчивого кластера AlwaysOn.

Высокий уровень доступности на уровне базы данных с Always On группами доступности

Группа доступности — это набор пользовательских баз данных, для которых отработка отказа выполняется одновременно. Группа доступности состоит из первичной реплики доступности и от одной до четырех вторичных реплик, которые поддерживаются за счет перемещения данных на основании журнала SQL Server для обеспечения защиты данных, не требующей общего хранилища. Каждый реплика размещается экземпляром SQL Server на другом узле кластера WSFC. Группа доступности и соответствующее имя виртуальной сети регистрируются как ресурсы в кластере WSFC.

Прослушиватель группы доступности на узле первичной реплики отвечает на входящие клиентские запросы на подключение к имени виртуальной сети и в зависимости от атрибутов в строке подключения перенаправляет каждый запрос в соответствующий экземпляр SQL Server .

При отработке отказа вместо переноса владения общих физических ресурсов на другой узел WSFC используется для перенастройки вторичной реплики на другом экземпляре SQL Server в первичную реплику группы доступности. Затем ресурс виртуального сетевого имени группы доступности переводится на этот экземпляр.

Первичная реплика баз данных группы доступности одновременно может размещаться только на одном экземпляре SQL Server , все связанные вторичные реплики должны находиться на отдельном экземпляре, и каждый экземпляр должен находиться на отдельном физическом узле.

Примечание

Always On группы доступности не требуют развертывания экземпляра отказоустойчивого кластера или использования симметричного общего хранилища (SAN или SMB).

Экземпляр отказоустойчивого кластера (FCI) может использоваться совместно с группой доступности для повышения доступности реплики доступности. Однако во избежание соперничества в кластере WSFC автоматический переход на другой ресурс группы доступности не поддерживается для реплики доступности, размещенной в FCI.

Дополнительные сведения см. в статье Общие сведения о группах доступности AlwaysOn (SQL Server)

Мониторинг исправности WSFC и отработка отказа

Высокий уровень доступности для решения AlwaysOn достигается за счет упреждающего мониторинга исправности физических и логических ресурсов кластера WSFC, а также за счет автоматического перехода на другой ресурс с переходом на дублирующее оборудование и его перенастройкой. Системный администратор также может запустить переход на другой ресурс вручную для группы доступности или экземпляра SQL Server для перехода с одного узла на другой.

Политики отработки отказа для узлов, экземпляров отказоустойчивого кластера и групп доступности

Политика отработки отказа настраивается на узле кластера WSFC, SQL Server экземпляре отказоустойчивого кластера (FCI) и на уровнях группы доступности. Эта политика на основе серьезности, продолжительности и частоты неисправного состояния ресурса кластера и времени отклика узла может включать перезапуск службы или автоматический переход на другой ресурс с переходом с одного узла на другой либо включать перевод первичной реплики группы доступности с одного экземпляра SQL Server на другой.

Отработка отказа реплики группы доступности не влияет на базовый экземпляр SQL Server . При отработке отказа экземпляра отказоустойчивого кластера вместе с этим экземпляром перемещаются размещенные реплики группы доступности.

Дополнительные сведения см. в разделе Политика отработки отказа для экземпляров откзоустойчивого кластера.

Определение исправности ресурсов WSFC

Все ресурсы на узле кластера WSFC могут сообщать о своем состоянии и исправности периодически или по запросу. Об отказе ресурса могут говорить различные обстоятельства, например неисправность электропитания, ошибки дисков или памяти, ошибки в сети, неотвечающие службы.

Ресурсы кластера WSFC, например сети, хранилища и службы, можно делать зависимыми друг от друга. Совокупная исправность ресурса определяется путем последовательного суммирования его работоспособности с исправностью каждого из зависимых ресурсов.

Определение исправности между узлами WSFC и определение голосов в кворуме

Все узлы в кластере WSFC участвуют в периодической передаче тактового импульса, сообщающего состояние исправности узла другим узлам. Неотвечающие узлы считаются неисправными.

Набор узлов кворума — это большинство узлов с правом голоса и следящих объектов в кластере WSFC. Общая исправность и состояние кластера WSFC определяется периодическим голосованием с кворумом. Наличие кворума означает, что кластер работоспособен и может обеспечивать отказоустойчивость на уровне узла.

Режим кворума настраивается на уровне кластера WSFC, который определяет методику голосования кворума, а также момент выполнения автоматического перехода на другой ресурс или перевода кластера в режим «вне сети».

Совет

Рекомендуется, чтобы число голосов кворума в кластере WSFC всегда было нечетным. По соображениям голосования кворума нет необходимости устанавливать SQL Server на всех узлах в кластере. Дополнительный сервер может выступать в качестве члена кворума, либо модель кворума WSFC можно настроить для использования удаленной общей папки в качестве решающего голоса.

Дополнительные сведения см. в разделе Режим кворума и участвующая в голосовании конфигурация WSFC (SQL Server).

Аварийное восстановление через принудительный кворум

В зависимости от рабочих методик и конфигурации кластера WSFC можно выполнять как автоматический, так и ручной переход на другой ресурс, а также поддерживать надежное и отказоустойчивое решение SQL Server AlwaysOn. Однако если кворуму узлов с правом голоса в кластере WSFC не удается связаться друг с другом либо если кластеру WSFC по другим причинам не удается проверить исправность, то кластер WSFC может перейти в режим «вне сети».

При переходе кластера WSFC в автономный режим из-за неожиданной аварии или по причине постоянно возникающего сбоя в работе оборудования или ошибки связи требуется вмешательство администратора для принудительного создания кворума и переключения работоспособных кластеров обратно в режим "в сети" в неотказоустойчивой конфигурации.

После этого будет необходимо также предпринять ряд действий по перенастройке кластера WSFC, восстановлению затронутых реплик баз данных и повторному созданию нового кворума.

Дополнительные сведения см. в статье Аварийное восстановление WSFC через принудительный кворум (SQL Server).

Связь компонентов SQL Server AlwaysOn с WSFC

Между функциями и компонентами SQL Server AlwaysOn и WSFC существует несколько уровней.

Группы доступности AlwaysOn размещаются в экземплярах SQL Server. Запрос клиента, указывающий сетевое имя прослушивателя логической группы доступности для подключения к базе данных-источнику или базе данных-получателю, перенаправляется на соответствующее сетевое имя экземпляра базового экземпляра SQL Server или экземпляра отказоустойчивого кластера (FCI) SQL Server.

Экземпляры SQL Server активно размещаются на одном узле. Если имеется изолированный экземпляр SQL Server , то он всегда находится на отдельном узле со статическим сетевым именем экземпляра. Экземпляр отказоустойчивого кластера SQL Server (если он есть) активен на одном из нескольких возможных узлов отработки отказа с единым виртуальным сетевым именем экземпляра.

Узлы являются членами кластера WSFC. Метаданные и состояние конфигурации WSFC для всех узлов сохраняются на каждом узле. Каждый сервер может предоставлять тома асимметричного хранения или общего хранения (SAN) для пользовательских и системных баз данных. Каждый сервер имеет по крайней мере один физический сетевой интерфейс в одной или нескольких IP-подсетях.

Служба WSFC контролирует исправность группы серверов и управляет их конфигурацией. Служба отказоустойчивого кластера (WSFC) распространяет изменения в метаданных и состоянии конфигурации WSFC во всех узлах кластера. Частичные метаданные и состояние могут храниться в удаленной общей папке следящего сервера кворума WSFC. Несколько активных узлов или следящих экземпляров образуют кворум для голосования по исправности кластера WSFC.

Always On разделы реестра групп доступности являются подразделами кластера WSFC. При удалении и повторном создании кластера WSFC необходимо отключить и повторно включить функцию групп доступности Always On на каждом экземпляре сервера, который был включен для Always On групп доступности в исходном кластере WSFC. Дополнительные сведения см. в статье Включение и отключение групп доступности AlwaysOn (SQL Server).

SQL Server схема контекста компонента AlwaysOn

Связанные задачи

См. также

См. также:

Экземпляры отказоустойчивого кластера AlwaysOn (SQL Server)Обзор групп доступности AlwaysOn (SQL Server)Режимы кворума WSFC и конфигурация голосования (SQL Server)Политика отработки отказа для экземпляровотказоустойчивого кластера Аварийное восстановление WSFC с помощью принудительного кворума (SQL Server)