Поделиться через


Отказоустойчивая кластеризация Windows Server (WSFC) с SQL Server

Новая Отказоустойчивая кластеризация Windows Server (WSFC) представляет собой группу независимых серверов, совместная работа которых позволяет повысить доступность приложений и служб. В SQL Server 2012 поддержка экземпляров отказоустойчивого кластера Группы доступности AlwaysOn и SQL Server осуществляется с использованием служб и возможностей WSFC.

В этом разделе:

  • Термины и определения

  • Обзор отказоустойчивого кластера Windows Server

  • Технологии SQL Server AlwaysOn и WSFC

  • Мониторинг исправности WSFC и отработка отказа

  • Связь компонентов SQL Server AlwaysOn с WSFC

  • Связанные задачи

  • См. также

Термины и определения

  • Кластер WSFC
    Новая Отказоустойчивая кластеризация Windows Server (WSFC) представляет собой группу независимых серверов, совместная работа которых позволяет повысить доступность приложений и служб.

  • Экземпляр отказоустойчивого кластера
    Экземпляр службы Windows, управляющий ресурсом IP-адреса, ресурсом сетевого имени и дополнительными ресурсами, которые требуются для запуска приложений и служб. Клиенты могут использовать сетевое имя для доступа к ресурсам в группе аналогично использованию имени компьютера для доступу к службам на физическом сервере. Однако, поскольку экземпляр отказоустойчивого кластера является группой, для него возможен переход на другой узел без изменения базового имени или адреса.

  • Узел
    Система Microsoft Windows Server, которая является активным или неактивным членом кластера серверов.

  • Ресурс кластера
    Физическая или логическая сущность, которая может принадлежать узлу, которую можно переводить в режимы «в сети» и «вне сети», перемещать между узлами и которой можно управлять как объектом кластера. Ресурс кластера может принадлежать одновременно только одному узлу.

  • Группа ресурсов
    Коллекция ресурсов кластера, управляемая как единый объект кластера. Обычно группа ресурсов содержит все ресурсы кластера, которые требуются для выполнения конкретного приложения или службы. Отработка отказа и возврат всегда выполняются для групп ресурсов.

  • Зависимость ресурсов
    Ресурс, от которого зависит другой ресурс. Если ресурс A зависит от ресурса B, то B является зависимостью A.

  • Ресурс сетевого имени
    Имя логического сервера, которое управляется как ресурс кластера. Ресурс сетевого имени должен использоваться с ресурсом IP-адреса.

  • Предпочитаемый владелец
    Предпочтительный узел для запуска группы ресурсов. Каждая группа ресурсов связана со списком предпочитаемых владельцев, отсортированных в порядке предпочтения. Во время автоматического перехода на другой ресурс группа ресурсов перемещается на следующий предпочтительный узел в списке.

  • Возможный владелец
    Дополнительный узел, на котором может запускаться ресурс. Каждая группа ресурсов связана со списком возможных владельцев. Группы ресурсов могут выполнять переход только на узлы из списка возможных владельцев.

  • Режим кворума
    Конфигурация кворума в отказоустойчивом кластере, определяющая количество сбоев узлов, которое может выдержать кластер.

  • Принудительный кворум
    Процесс запуска кластера несмотря на то, что на связи недостаточное количество элементов для кворума.

Дополнительные сведения см. в разделе Глоссарий отказоустойчивого кластера

[В начало]

Обзор отказоустойчивого кластера Windows Server

Отказоустойчивая кластеризация Windows Server предусматривает инфраструктурные компоненты, поддерживающие сценарии высокого уровня доступности и аварийного восстановления для таких размещенных серверных приложений, как Microsoft SQL Server и Microsoft Exchange. При отказе узла кластера или службы все службы, которые размещались на этом узле, могут автоматически или вручную переноситься на другой доступный узел в рамках процесса под названием отработка отказа.

Узлы в кластере WSFC за счет совместной работы обеспечивают следующие типы возможностей:

  • Распределенные метаданные и уведомления. Метаданные служб и размещенных приложений WSFC хранятся на каждом узле кластера. Среди этих метаданных не только параметры размещенных приложений, но также конфигурация и состояние WSFC. Изменения в метаданных или состоянии узла автоматически распространяются на других узлах кластера.

  • Управление ресурсами. Отдельные узлы в кластере могут предоставлять физические ресурсы, например подключаемое напрямую хранилище, сетевые интерфейсы и доступ к общему дисковому хранилищу. Размещенные приложения регистрируют себя как ресурсы кластера и могут настраивать запуск и зависимости от исправности других ресурсов.

  • Мониторинг исправности. Определение исправности основного узла и исправности между узлами осуществляется за счет сочетания сетевых соединений по типу тактовых импульсов и мониторинга ресурсов. Общее состояние работоспособности кластера определяется голосами кворума узлов в кластере.

  • Координация отработки отказа. Каждый ресурс настроен для размещения на основном узле, и каждый можно автоматически или вручную переносить на один или несколько второстепенных узлов. Политика отработки отказа в зависимости от исправности управляет автоматическим переносом владения ресурсами между узлами. Узлы и размещенные приложения получают уведомления об отработке отказа, что позволяет им выполнить соответствующие действия.

Дополнительные сведения см. в разделе Отказоустойчивые кластеры в Windows Server 2008 R2

Значок стрелки, используемый со ссылкой «В начало»[В начало]

Технологии SQL Server AlwaysOn и WSFC

SQL Server 2012 AlwaysOn — это новое решение высокого уровня доступности и аварийного восстановления с использованием WSFC. AlwaysOn представляет собой интегрированное, гибкое решение, повышающее доступность приложения, окупаемость вложений в оборудование и упрощающее развертывание систем высокого уровня доступности и управление ими.

Группы доступности AlwaysOn и экземпляры отказоустойчивого кластера AlwaysOn используют WSFC как технологическую платформу, регистрируя компоненты в качестве ресурсов кластера WSFC. Связанные ресурсы объединяются в группу ресурсов, которую можно сделать зависимой от других ресурсов кластера WSFC. В таком случае служба кластера WSFC может выявлять необходимость в перезапуске экземпляра SQL Server (и сигнализировать об этом) или автоматически выполнять отработку отказа с переходом на другой серверный узел в кластере WSFC.

Важное примечаниеВажно!

Чтобы воспользоваться всеми возможностями технологий SQL Server AlwaysOn, вам следует выполнить несколько связанных с WSFC предварительных требований.

Дополнительные сведения см. в разделе: предварительными требованиями, и ограничениями и рекомендациями для групп доступности AlwaysOn (SQL Server)

Высокий уровень доступности на уровне экземпляра с помощью экземпляров отказоустойчивого кластера AlwaysOn

Экземпляр отказоустойчивого кластера (FCI) AlwaysOn представляет собой экземпляр SQL Server, установленный на нескольких узлах в кластере WSFC. Этот тип экземпляра имеет зависимости ресурсов от общего дискового хранилища (через Fibre Channel или iSCSI SAN) и от имени виртуальной сети. Имя виртуальной сети имеет зависимость ресурсов от одного или нескольких виртуальных IP-адресов, где каждый находится в отдельной подсети. Служба SQL Server и служба агента SQL Server регистрируются в качестве ресурсов, и обе службы становятся зависимыми от ресурса имени виртуальной сети.

В случае отработки отказа служба WSFC переносит владение ресурсов экземпляра на назначенный узел отработки отказа. Затем экземпляр SQL Server перезапускается на узле отработки отказа и выполняется обычное восстановление баз данных. В любой момент времени FCI и базовые ресурсы могут размещаться только на одном узле в кластере.

ПримечаниеПримечание

Экземпляру отказоустойчивого кластера AlwaysOn требуется симметричное общее дисковое хранилище, например сеть хранения данных (SAN) или общая папка SMB. Тома общего дискового хранилища должны быть доступны всем потенциальным узлам отработки отказа в кластере WSFC.

Дополнительные сведения см. в разделе: Экземпляры отказоустойчивого кластера (режим AlwaysOn) (SQL Server)

Высокий уровень доступности на уровне баз данных с Группы доступности AlwaysOn

Группа доступности — это набор пользовательских баз данных, для которых отработка отказа выполняется одновременно. Группа доступности состоит из первичной реплики доступности и от одной до четырех вторичных реплик, которые поддерживаются за счет перемещения данных на основании журнала SQL Server для обеспечения защиты данных, не требующей общего хранилища. Каждая реплика размещается на экземпляре SQL Server в отдельном узле кластера WSFC. Группа доступности и соответствующее имя виртуальной сети регистрируются как ресурсы в кластере WSFC.

Прослушиватель группы доступностина узле первичной реплики отвечает на входящие клиентские запросы на подключение к имени виртуальной сети и в зависимости от атрибутов в строке подключения перенаправляет каждый запрос в соответствующий экземпляр SQL Server.

При отработке отказа вместо переноса владения общих физических ресурсов на другой узел WSFC используется для перенастройки вторичной реплики на другом экземпляре SQL Server в первичную реплику группы доступности. Затем ресурс виртуального сетевого имени группы доступности переводится на этот экземпляр.

Первичная реплика баз данных группы доступности одновременно может размещаться только на одном экземпляре SQL Server, все связанные вторичные реплики должны находиться на отдельном экземпляре, и каждый экземпляр должен находиться на отдельном физическом узле.

ПримечаниеПримечание

Группы доступности AlwaysOn не требует развертывания экземпляра отказоустойчивого кластера или использования симметричного общего хранилища (SAN или SMB).

Экземпляр отказоустойчивого кластера (FCI) может использоваться совместно с группой доступности для повышения доступности реплики доступности. Однако во избежание соперничества в кластере WSFC автоматический прямой или обратный переход на другой ресурс группы доступности не поддерживается для реплики доступности, размещенной в FCI.

Дополнительные сведения см. в разделе: Обзор групп доступности AlwaysOn (SQL Server)

[В начало]

Мониторинг исправности WSFC и отработка отказа

Высокий уровень доступности для решения AlwaysOn достигается за счет упреждающего мониторинга исправности физических и логических ресурсов кластера WSFC, а также за счет автоматического перехода на другой ресурс с переходом на дублирующее оборудование и его перенастройкой. Системный администратор также может запустить переход на другой ресурс вручную для группы доступности или экземпляра SQL Server для перехода с одного узла на другой.

Политики отработки отказа для узлов, экземпляров отказоустойчивого кластера и групп доступности

Политика отработки отказа настраивается на уровне узла кластера WSFC, экземпляра отказоустойчивого кластера (FCI) SQL Server и группы доступности. Эта политика на основе серьезности, продолжительности и частоты неисправного состояния ресурса кластера и времени отклика узла может включать перезапуск службы или автоматический переход на другой ресурс с переходом с одного узла на другой либо включать перевод первичной реплики группы доступности с одного экземпляра SQL Server на другой.

Отработка отказа реплики группы доступности не влияет на базовый экземпляр SQL Server. При отработке отказа экземпляра отказоустойчивого кластера вместе с этим экземпляром перемещаются размещенные реплики группы доступности.

Дополнительные сведения см. в разделе: Политика отработки отказа для экземпляров отказоустойчивого кластера

Определение исправности ресурсов WSFC

Все ресурсы на узле кластера WSFC могут сообщать о своем состоянии и исправности периодически или по запросу. Об отказе ресурса могут говорить различные обстоятельства, например: неисправность электропитания, ошибки дисков или памяти, ошибки в сети, неотвечающие службы.

Ресурсы кластера WSFC, например сети, хранилища и службы, можно делать зависимыми друг от друга. Совокупная исправность ресурса определяется путем последовательного суммирования его работоспособности с исправностью каждого из зависимых ресурсов.

Определение исправности между узлами WSFC и определение голосов в кворуме

Все узлы в кластере WSFC участвуют в периодической передаче тактового импульса, сообщающего состояние исправности узла другим узлам. Неотвечающие узлы считаются неисправными.

Набор узлов кворума — это большинство узлов с правом голоса и следящих объектов в кластере WSFC. Общая исправность и состояние кластера WSFC определяется периодическим голосованием с кворумом. Наличие кворума означает, что кластер работоспособен и может обеспечивать отказоустойчивость на уровне узла.

Режим кворума настраивается на уровне кластера WSFC, который определяет методику голосования кворума, а также момент выполнения автоматического перехода на другой ресурс или перевода кластера в режим «вне сети».

СоветСовет

Рекомендуется, чтобы число голосов кворума в кластере WSFC всегда было нечетным. По соображениям голосования кворума нет необходимости устанавливать SQL Server на всех узлах в кластере. Дополнительный сервер может выступать в качестве члена кворума, либо модель кворума WSFC можно настроить для использования удаленной общей папки в качестве решающего голоса.

Дополнительные сведения см. в разделе: Режим кворума и участвующая в голосовании конфигурация WSFC (SQL Server)

Аварийное восстановление через принудительный кворум

В зависимости от принятых методов работы и конфигурации кластера WSFC можно использовать как автоматический, так и переход на другой ресурс вручную, при этом решение SQL Server AlwaysOn остается всегда надежным и отказоустойчивым. Однако если кворуму узлов с правом голоса в кластере WSFC не удается связаться друг с другом либо если кластеру WSFC по другим причинам не удается проверить исправность, то кластер WSFC может перейти в режим «вне сети».

При переходе кластера WSFC в автономный режим из-за неожиданной аварии или по причине постоянно возникающего сбоя в работе оборудования или ошибки связи требуется вмешательство администратора для принудительного создания кворума и переключения работоспособных кластеров обратно в режим «в сети» в неотказоустойчивой конфигурации.

После этого будет необходимо также предпринять ряд действий по перенастройке кластера WSFC, восстановлению затронутых реплик баз данных и повторному созданию нового кворума.

Дополнительные сведения см. в разделе: Аварийное восстановление WSFC через принудительный кворум (SQL Server)

[В начало]

Связь компонентов SQL Server AlwaysOn с WSFC

Между функциями и компонентами SQL Server AlwaysOn и WSFC существуют связи нескольких уровней.

  • Группы доступности AlwaysOn размещаются в экземплярах SQL Server.
    Клиентский запрос с указанием логического сетевого имени прослушивателя группы доступности для подключения к первичной или базе данных-получателю направляется на соответствующее сетевое имя экземпляра базового экземпляра SQL Server или экземпляра отказоустойчивого кластера SQL Server.

  • Экземпляры SQL Server активно размещаются на одном узле.
    Если имеется изолированный экземпляр SQL Server, то он всегда находится на отдельном узле со статическим сетевым именем экземпляра. Экземпляр отказоустойчивого кластера SQL Server (если он есть) активен на одном из нескольких возможных узлов отработки отказа с единым виртуальным сетевым именем экземпляра.

  • Узлы являются членами кластера WSFC.
    Метаданные и состояние конфигурации WSFC для всех узлов сохраняются на каждом узле. Каждый сервер может предоставлять тома асимметричного хранения или общего хранения (SAN) для пользовательских и системных баз данных. Каждый сервер имеет по крайней мере один физический сетевой интерфейс в одной или нескольких IP-подсетях.

  • Служба WSFC контролирует исправность группы серверов и управляет их конфигурацией.
    Служба отказоустойчивого кластера (WSFC) распространяет изменения в метаданных и состоянии конфигурации WSFC во всех узлах кластера. Частичные метаданные и состояние могут храниться в удаленной общей папке следящего сервера кворума WSFC. Несколько активных узлов или следящих экземпляров образуют кворум для голосования по исправности кластера WSFC.

  • Разделы реестра Группы доступности AlwaysOn — это подразделы кластера WSFC.
    При удалении и повторном создании кластера WSFC необходимо отключить и повторно включить функцию Группы доступности AlwaysOn на каждом экземпляре сервера, на котором была включена функция Группы доступности AlwaysOn в исходном кластере WSFC. Дополнительные сведения см. в разделе Включение и отключение групп доступности AlwaysOn (SQL Server).

Диаграмма контекста компонента SQL Server AlwaysOn

[В начало]

Связанные задачи

Значок стрелки, используемый со ссылкой «В начало»[В начало]

См. также

[В начало]

См. также

Основные понятия

Экземпляры отказоустойчивого кластера (режим AlwaysOn) (SQL Server)

Обзор групп доступности AlwaysOn (SQL Server)

Режим кворума и участвующая в голосовании конфигурация WSFC (SQL Server)

Политика отработки отказа для экземпляров отказоустойчивого кластера

Аварийное восстановление WSFC через принудительный кворум (SQL Server)