Экземпляры отказоустойчивого кластера AlwaysOn (SQL Server)

Статья
06/13/2017

В рамках SQL Server AlwaysOn экземпляры отказоустойчивой кластеризации AlwaysOn используют функциональные возможности отказоустойчивой кластеризации Windows Server (WSFC) для обеспечения высокого уровня доступности локальных ресурсов за счет избыточности на уровне экземпляра сервера — экземпляра отказоустойчивого кластера (FCI). Экземпляр отказоустойчивого кластера (FCI) является единственным экземпляром SQL Server , установленным на всех узлах отказоустойчивой кластеризации Windows Server (WSFC) и, возможно, в нескольких подсетях. Экземпляр отказоустойчивого кластера выглядит в сети как экземпляр SQL Server , запущенный на одном компьютере, но экземпляр отказоустойчивого кластера обеспечивает отработку отказа с переходом одного узла WSFC на другой узел, если текущий узел становится недоступным.

Экземпляр отказоустойчивого кластера (FCI) может эффективно использовать Группы доступности AlwaysOn для выполнения удаленного аварийного восстановления на уровне базы данных. Дополнительные сведения см. в разделе Отказоустойчивая кластеризация и группы доступности AlwaysOn (SQL Server).

Примечание

Начиная с SQL Server 2014 г. экземпляры отказоустойчивого кластера Always On поддерживают кластеризованные общие тома (CSV) как в Windows Server 2008 R2, так и в Windows Server 2012. Дополнительные сведения о CSV-файле см. в разделе Основные сведения о кластерных общих томах в отказоустойчивом кластере.

В этом разделе.

Преимущества
Рекомендации
Общие сведения об экземпляре отказоустойчивого кластера
Элементы экземпляра отказоустойчивого кластера
Основные понятия и задачи отработки отказа SQL Server
См. также

Преимущества экземпляра отказоустойчивого кластера

При сбое оборудования или программного обеспечения сервера приложения или клиенты, связывающиеся с сервером, будут простаивать. Если экземпляр SQL Server настроен как отказоустойчивый кластер (а не как независимый экземпляр), высокий уровень доступности такого экземпляра SQL Server защищен наличием избыточных узлов в отказоустойчивом кластере. Только один из узлов в FCI принадлежит группе ресурсов WSFC одновременно. В случае сбоя (отказа оборудования, сбоя операционной системы, приложений или служб) либо при выполнении запланированного обновления группа передается во владение другому узлу отказоустойчивого кластера. Данный процесс не заметен для клиента или приложения, связывающегося с SQL Server, и сводит к минимуму время ожидания приложения или клиента во время сбоя. Ниже перечислены некоторые ключевые преимущества, которые обеспечивают экземпляры отказоустойчивого кластера SQL Server :

Защита на уровне экземпляра через избыточность
Автоматический переход на другой ресурс в случае сбоя (отказа оборудования, сбоя операционной системы, приложений или служб)

Важно!

В группе доступности AlwaysOn не поддерживается автоматический переход на другие узлы в пределах доступности группы от FCI. Это означает, что отказоустойчивые кластеры и независимые узлы не следует объединять внутри одной группы доступности, если автоматический переход на другой ресурс является важным компонентом решения высокого уровня доступности. Однако такое объединение можно сделать для решения аварийного восстановления .
Поддержка широкого массива решения хранения, включая диски кластеров WSFC (iSCSI, Fiber Channel и т. д.) и общие папки протокола SMB.
Решение для аварийного восстановления с помощью FCI с несколькими подсетями или запуска базы данных, размещенной в FCI, внутри группы доступности AlwaysOn. Благодаря новой поддержке нескольких подсетей в MicrosoftSQL Server 2012 экземпляр отказоустойчивого кластера с несколькими подсетами больше не требует виртуальной локальной сети, что повышает управляемость и безопасность отказоустойчивого кластера с несколькими подсетами.
Нулевая реконфигурация приложений и клиентов при сбое
Гибкая политика отработки отказа для гранулированных событий триггера для автоматической отработки отказа
Надежная отработка отказа посредством периодического подробного отслеживания исправности системы с помощью выделенных и постоянных соединений
Возможность настройки и предсказуемость во время отработки отказа посредством косвенных контрольных точек
Использование регулируемых ресурсов при отработке отказа

Общие сведения об экземпляре отказоустойчивого кластера

FCI работает в группе ресурсов WSFC вместе с одним или несколькими узлами WSFC. При запуске экземпляра отказоустойчивого кластера один из узлов берет на себя ответственность за группу ресурсов и переводит свой экземпляр SQL Server в оперативный режим. Ресурсы, принадлежащие данному узлу включают в себя:

Сетевое имя
IP-адрес
Общие диски
SQL Server Служба компонента Database Engine
SQL Server Служба агента
SQL Server Analysis Services, если эти служб установлены
Один файловый ресурс общего доступа, если установлен компонент FILESTREAM

В любое время только владелец группы ресурсов (и никакой другой узел в FCI) запускает соответствующие службы SQL Server в группе ресурсов. Когда происходит переход на другой ресурс, будь то автоматический или запланированный переход на другой ресурс, происходит следующая последовательность событий.

Если событие не является сбоем оборудования или системы, все «грязные» страницы в буферном кэше записываются на диск.
Все соответствующие службы SQL Server в группе ресурсов останавливаются на активном узле.
Права владения группой ресурсов переносятся на другой узел в FCI.
Новый владелец группы ресурсов запускает свои службы SQL Server .
Клиентские запросы на подключение приложения автоматически перенаправляются на новый активный узел, используя то же имя виртуальной сети (VNN).

FCI находится в сети, если его базовый кластер WSFC находится в исправном состоянии (большая часть узлов кворума WSFC доступны в качестве целей автоматического перехода на другой ресурс). Когда кластер WSFC теряет кворум из-за сбоя аппаратной части, программного обеспечения, сети или неверной настройки кворума, весь кластер WSFC вместе с FCI выводится из сети. Для этого незапланированного сценария отработки отказа требуется вмешательство пользователя, который должен переустановить кворум для оставшихся доступных узлов, чтобы вернуть кластер WSFC и FCI обратно в сеть. Дополнительные сведения см. в разделе Режимы кворума WSFC и конфигурация голосования (;SQL Server);.

Прогнозируемое время отработки отказа

В зависимости от того, когда экземпляр SQL Server в последний раз выполнял операцию контрольной точки, в буферном кэше может находиться значительное количество грязное страниц. Последующая отработка отказа длится столько, сколько потребуется времени для записи оставшихся «грязных» страниц на диск, что может увеличить время отработки отказа непредсказуемым образом. Начиная с MicrosoftSQL Server 2012, FCI может использовать косвенные контрольные точки для регулирования объема грязное страниц, хранящихся в буферном кэше. Несмотря на то что это занимает дополнительные ресурсы при нормальной рабочей нагрузке, время отработки отказа становится более прогнозируемым и регулируемым. Это очень полезно, когда в соглашении об уровне обслуживания в организации указана цель времени восстановления (RTO) для решения высокого уровня доступности. Дополнительные сведения о косвенных контрольных точках см. в разделе Indirect Checkpoints.

Надежный мониторинг исправности и гибкая политика отработки отказа

После успешного запуска FCI служба WSFC мониторит состояние базового кластера WSFC, а также состояние экземпляра SQL Server . Начиная с MicrosoftSQL Server 2012, служба WSFC использует выделенное подключение для опроса активного экземпляра SQL Server на наличие подробных диагностика компонентов с помощью системной хранимой процедуры. Это имеет три последствия.

Выделенное соединение с экземпляром SQL Server позволяет получать надежную диагностику компонентов в любое время, даже когда FCI испытывает перегрузку. В результате можно выделить систему, испытывающую большую нагрузку, и систему, которая находится на грани отработки отказа, позволяя избежать проблем, связанных с ложной отработкой отказа.
Подробная диагностика компонентов позволяет настроить более гибкую политику отработки отказа, с помощью которой вы можете выбрать, какие условия отказа запускают отработку отказа, а какие нет.
Подробная диагностика компонентов также позволяет лучше устранять ошибки автоматической отработки отказа. Сведения диагностики сохраняются в файлы журналов, связанные с журналами ошибок SQL Server . Файлы можно загрузить в средство просмотра файлов журнала для изучения состояний компонентов, которые привели к отработке отказа, чтобы определить причину сбоя.

Дополнительные сведения см. в разделе Failover Policy for Failover Cluster Instances.

Элементы экземпляра отказоустойчивого кластера

FCI включает набор физических серверов (узлов), которые имеют схожую аппаратную и программную конфигурацию, в том числе версию операционной системы и уровень обновления, версию SQL Server , ее уровень обновления, компоненты и имя экземпляра. Идентичная программная конфигурация необходима для того, чтобы FCI смог работать после отработки отказа между двумя узлами.

Группа ресурсов WSFC
FCI SQL Server работает в группе ресурсов WSFC. Каждый узел в группе ресурсов поддерживает синхронизированную копию параметров конфигурации и разделов реестра для того, чтобы сохранить полную функциональность FCI после отработки отказа, при этом только один узел в кластере владеет группой ресурсов одновременно (активный узел). Служба WSFC управляет кластером сервера, конфигурацией кворума, политикой и операциями отработки отказа, а также именем виртуальной сети и виртуальными IP-адресами для FCI. В случае сбоя (сбои оборудования, сбои операционной системы, сбои приложений или служб) или планового обновления права владения группой ресурсов перемещаются на другой узел отказоустойчивого кластера. Количество узлов, поддерживаемых в группе ресурсов WSFC, зависит от выпуска SQL Server. Также один кластер WSFC может запускать несколько FCI (множественные группы ресурсов), в зависимости от возможностей оборудования, например ЦП, памяти и числа дисков.

Двоичные файлы SQL Server
Двоичные файлы устанавливаются локально на каждом узле FCI, так же как и в случае изолированной установки SQL Server . Однако во время запуска службы не запускаются автоматически, а управляются службой WSFC.

Память
В отличие от группы доступности AlwaysOn, FCI должен использовать общее хранилище для всех узлов FCI для базы данных и хранения журналов. Общее хранилище может быть в форме кластерных дисков WSFC, дисков на SAN или общих папок SMB. Таким образом, все узлы в FCI имеют одинаковое представление данных экземпляра всегда, когда происходит отработка отказа. Однако в этом случае общее хранилище может стать единственной точкой сбоя, в то время как FCI зависит от базового решения хранилища для обеспечения защиты данных.

Сетевое имя
VNN для FCI предоставляет единую точку соединения для FCI. Это позволяет приложениям подключаться к VNN без необходимости знать текущий активный узел. Когда происходит отработка отказа, VNN регистрируется на новом активном узле после его запуска. Данный процесс не заметен для клиента или приложения, связывающегося с SQL Server, и сводит к минимуму время ожидания приложения или клиента во время сбоя.

Виртуальные IP-адреса
В случае многоподсетевого кластера FCI виртуальный IP-адрес присваивается каждой подсети FCI. В ходе отработки отказа VNN-имя DNS-сервера обновляется и указывает на виртуальный IP-адрес соответствующей подсети. Приложения и клиенты могут подключиться к FCI, используя то же самое имя VNN после многоподсетевой отработки отказа.

Основные понятия и задачи отработки отказа SQL Server

Основные понятия и задачи	Раздел
Описывает механизм обнаружения сбоя и гибкую политику отработки отказа.	Failover Policy for Failover Cluster Instances
Описание основных понятий в управлении и обслуживании экземпляров отказоустойчивых кластеров.	Администрирование и обслуживание экземпляров отказоустойчивого кластера
Описание и понятия конфигурации с несколькими подсетями	SQL Server кластеризации с несколькими подсетами (;SQL Server);

См. также

Описание раздела	Раздел
Описывает, как установить новый FCI SQL Server .	Создание нового SQL Server отказоустойчивого кластера (; Настройка);
Описание процесса обновления до отказоустойчивого кластера SQL Server 2014.	Обновление отказоустойчивого кластера SQL Server
Описание основных понятий отказоустойчивых кластеров Windows, а также ссылки на связанные с ними задачи.	Windows Server 2008: обзор отказоустойчивых кластеров Windows Server 2008 R2: обзор отказоустойчивых кластеров
Описывает различия в основных понятиях между узлами в экземпляре отказоустойчивого кластера и репликами внутри группы доступности, а также содержит рекомендации по использованию экземпляра отказоустойчивого кластера для размещения реплики для группы доступности.	Отказоустойчивая кластеризация и группы доступности Always On (SQL Server)

Поделиться через