Поделиться через


Экземпляры отказоустойчивого кластера AlwaysOn (SQL Server)

Область применения:SQL Server

Экземпляры отказоустойчивого кластера SQL Server AlwaysOn используют отказоустойчивую кластеризацию Windows Server (WSFC) для обеспечения локальной высокой доступности. Экземпляр отказоустойчивого кластера (FCI) является избыточным на уровне экземпляра сервера. FCI — это один экземпляр SQL Server, установленный на узлах кластера Windows Server и, возможно, в нескольких подсетях. В сети FCI отображается как экземпляр SQL Server, работающий на одном компьютере, но FCI обеспечивает отработку отказа с одного узла WSFC на другой, если текущий узел становится недоступным.

FCI может использовать группы доступности AlwaysOn для обеспечения удаленного аварийного восстановления на уровне базы данных. Дополнительные сведения см. в разделе "Отказоустойчивая кластеризация" и "Группы доступности AlwaysOn" (SQL Server).

Экземпляры отказоустойчивого кластера SQL Server поддерживают Storage Spaces Direct (S2D) для кластерных ресурсов хранилища, представленных в выпуске Windows Server 2016 Datacenter. Дополнительные сведения можно найти в статье о локальных дисковых пространствах в Windows Server.

Экземпляры отказоустойчивого кластера также поддерживают кластеризованные общие тома (CSV). Дополнительные сведения см. в разделе "Общие тома кластера" в отказоустойчивом кластере.

Преимущества экземпляра отказоустойчивого кластера

При сбое оборудования или программного обеспечения сервера приложения или клиенты, подключающиеся к серверу, испытывают простой. Избыточные узлы обеспечивают доступность экземпляра SQL Server, если используется FCI, а не одиночный экземпляр. Только один из узлов в FCI принадлежит группе ресурсов WSFC одновременно. Если происходит сбой (например, сбой оборудования, сбой операционной системы, приложение или служба) или во время запланированного обновления, кластер перемещает владение группой ресурсов на другой узел WSFC. Этот процесс является прозрачным для клиента или приложения, подключающегося к SQL Server. Это позволяет свести к минимуму время простоя приложения или клиентов во время сбоя. Ниже перечислены некоторые ключевые преимущества, предоставляемые экземплярами отказоустойчивого кластера SQL Server:

  • Защита на уровне экземпляра с помощью избыточности.

  • Автоматическое переключение в случае сбоя (сбои оборудования, операционной системы или приложений и служб).

    Внимание

    В группе доступности автоматическая отработка отказа из FCI на другие узлы в группе доступности не поддерживается. Это означает, что кластерные экземпляры отказоустойчивости и автономные узлы не должны быть объединены в группу доступности, если автоматическое переключение при отказе является важным компонентом вашего решения по обеспечению высокой доступности. Однако такое объединение можно сделать для решения аварийного восстановления .

  • Поддержка широкого массива решения хранения, включая диски кластеров WSFC (iSCSI, Fiber Channel и т. д.) и общие папки протокола SMB.

  • Аварийное восстановление с помощью FCI с несколькими подсетью или запуска базой данных, размещенной в FCI, в группе доступности. Благодаря новой поддержке нескольких подсетей в Microsoft SQL Server 2012 (11.x) многосеть FCI больше не требует виртуальной локальной сети, повышая управляемость и безопасность FCI с несколькими подсетями.

  • Ноль перенастройки приложений и клиентов во время отработки отказа.

  • Гибкая политика отработки отказа для событий детализации триггеров для автоматической отработки отказа.

  • Надежная отработка отказа через периодическое и подробное обнаружение работоспособности с помощью выделенных и сохраненных подключений.

  • Настройка и прогнозируемость во время отработки отказа через косвенные фоновые контрольные точки.

  • Регулирование использования ресурсов во время отработки отказа.

Рекомендации

В рабочей среде используйте статические IP-адреса в сочетании с виртуальным IP-адресом экземпляра отказоустойчивого кластера.

Не используйте DHCP в рабочей среде. В случае простоя, если время действия IP-адреса протокола DHCP истекло, на регистрацию нового сетевого IP-адреса протокола DHCP, связанного с DNS-именем, уйдет дополнительное время.

Общие сведения об экземпляре отказоустойчивого кластера

FCI работает в группе ресурсов WSFC вместе с одним или несколькими узлами WSFC. При запуске FCI один из узлов берет на себя ответственность за группу ресурсов и переносит его экземпляр SQL Server в режим "в сети". Ресурсы, принадлежащие данному узлу включают в себя:

  • Имя сети
  • IP-адрес
  • Общие диски
  • Служба ядро СУБД SQL Server
  • служба агента SQL Server
  • Служба SQL Server Analysis Services, если она установлена
  • Один файловый ресурс общего доступа, если установлен компонент FILESTREAM

В любое время только владелец группы ресурсов (и ни один другой узел в FCI) выполняет соответствующие службы SQL Server в группе ресурсов. При автоматическом или запланированном переходе на другой ресурс происходит следующая последовательность событий.

  1. Если событие не является сбоем оборудования или системы, все «грязные» страницы в буферном кэше записываются на диск.

  2. Все соответствующие службы SQL Server в группе ресурсов остановлены на активном узле.

  3. Права владения группой ресурсов переносятся на другой узел в FCI.

  4. Новый владелец группы ресурсов запускает службы SQL Server.

  5. Клиентские запросы на подключение приложения автоматически перенаправляются на новый активный узел, используя то же имя виртуальной сети (VNN).

FCI находится в сети, если его базовый кластер WSFC находится в исправном состоянии (большая часть узлов кворума WSFC доступны в качестве целей автоматического перехода на другой ресурс). Когда кластер WSFC теряет кворум из-за сбоя аппаратной части, программного обеспечения, сети или неверной настройки кворума, весь кластер WSFC вместе с FCI выводится из сети. Для этого незапланированного сценария отработки отказа требуется вмешательство пользователя, который должен переустановить кворум для оставшихся доступных узлов, чтобы вернуть кластер WSFC и FCI обратно в сеть. Дополнительные сведения см. в разделе Режим кворума и участвующая в голосовании конфигурация WSFC (SQL Server).

Прогнозируемая отработка отказа

В зависимости от того, когда экземпляр SQL Server последний раз выполнил операцию контрольной точки, в буферном кэше может быть значительное количество грязных страниц. Последующая отработка отказа длится столько, сколько потребуется времени для записи оставшихся «грязных» страниц на диск, что может увеличить время отработки отказа непредсказуемым образом. Начиная с Microsoft SQL Server 2012 (11.x), FCI может использовать косвенные контрольные точки для регулирования количества грязных страниц, хранящихся в кэше буфера. Хотя для этого требуется больше ресурсов при обычной рабочей нагрузке, время аварийного переключения становится более предсказуемым и с более гибкой настройкой. Это полезно, если соглашение уровня обслуживания в организации указывает целевое время восстановления (RTO) для решения с высоким уровнем доступности. Дополнительные сведения о косвенных контрольных точках см. в разделе Indirect Checkpoints.

Надежная политика мониторинга работоспособности и гибкой политики отработки отказа

После успешного запуска FCI служба WSFC отслеживает работоспособность базового кластера WSFC и работоспособность экземпляра SQL Server. Начиная с Microsoft SQL Server 2012 (11.x), служба WSFC использует выделенное подключение для опроса активного экземпляра SQL Server для получения подробных диагностика компонентов с помощью системной хранимой процедуры. Это имеет три последствия.

  • Выделенное подключение к экземпляру SQL Server позволяет надежно опрашивать компонент диагностика все время, даже если FCI находится под тяжелой нагрузкой. В результате можно выделить систему, испытывающую большую нагрузку, и систему, которая находится на грани отработки отказа, позволяя избежать проблем, связанных с ложной отработкой отказа.

  • Подробная диагностика компонентов дает возможность настроить более гибкую политику резервирования, при которой можно выбрать, какие условия сбоя запускают переключение, а какие нет.

  • Подробная диагностика компонентов также позволяет лучше устранять ошибки автоматической отработки отказа. Диагностические сведения хранятся в файлах журналов, которые сопоставляются с журналами ошибок SQL Server. Файлы можно загрузить в средство просмотра файлов журнала для изучения состояний компонентов, которые привели к отработке отказа, чтобы определить причину сбоя.

Дополнительные сведения см. в политике отказоустойчивости для экземпляров отказоустойчивого кластера.

Элементы экземпляра отказоустойчивого кластера

FCI состоит из набора физических серверов (узлов), содержащих аналогичную конфигурацию оборудования, а также идентичную конфигурацию программного обеспечения, которая включает версию операционной системы и уровень исправлений, а также версию SQL Server, уровень исправлений, компоненты и имя экземпляра. Идентичная программная конфигурация необходима для того, чтобы FCI смог работать после отработки отказа между двумя узлами.

Группа ресурсов WSFC

FCI SQL Server выполняется в группе ресурсов WSFC. Каждый узел в группе ресурсов поддерживает синхронизированную копию параметров конфигурации и разделов реестра для того, чтобы сохранить полную функциональность FCI после отработки отказа, при этом только один узел в кластере владеет группой ресурсов одновременно (активный узел). Служба WSFC управляет кластером сервера, конфигурацией кворума, политикой и операциями отработки отказа, а также именем виртуальной сети и виртуальными IP-адресами для FCI. В случае сбоя (сбой оборудования, операционной системы или приложений и служб) или запланированного обновления владение группой ресурсов перемещается на другой узел в FCI. Количество узлов, поддерживаемых в группе ресурсов WSFC, зависит от выпуска SQL Server. Также один кластер WSFC может запускать несколько FCI (множественные группы ресурсов), в зависимости от возможностей оборудования, например ЦП, памяти и числа дисков.

Двоичные файлы SQL Server

Двоичные файлы продукта устанавливаются локально на каждом узле FCI, как и в автономных установках SQL Server. Тем не менее, при запуске службы не запускаются автоматически, а находятся под управлением WSFC.

Хранилище

В отличие от группы доступности, на всех узлах FCI должно использоваться общее хранилище для базы данных и журналов. Это общее хранилище может быть организовано в форме дисков кластера WSFC, дисков в сети хранения данных (SAN), локальных дисковых пространств (S2D) или общих папок SMB. Таким образом, все узлы в FCI имеют одинаковое представление данных экземпляра всегда, когда происходит отработка отказа. Однако в этом случае общее хранилище может стать единственной точкой сбоя, в то время как FCI зависит от базового решения хранилища для обеспечения защиты данных.

Имя сети

VNN для FCI предоставляет единую точку соединения для FCI. Это позволяет приложениям подключаться к VNN без необходимости знать текущий активный узел. Когда происходит отработка отказа, VNN регистрируется на новом активном узле после его запуска. Этот процесс является прозрачным для клиента или приложения, подключающегося к SQL Server, и это сокращает время простоя приложения или клиентов во время сбоя.

Виртуальные IP-адреса

В случае многоподсетевого кластера FCI виртуальный IP-адрес присваивается каждой подсети FCI. В ходе отработки отказа VNN-имя DNS-сервера обновляется и указывает на виртуальный IP-адрес соответствующей подсети. Приложения и клиенты могут подключиться к FCI, используя то же самое имя VNN после многоподсетевой отработки отказа.

Основные понятия и задачи отработки отказа SQL Server

Основные понятия и задачи Статья
Описывает механизм обнаружения сбоя и гибкую политику отработки отказа. Политика отработки отказа для экземпляров отказоустойчивого кластера
Описание основных понятий в управлении и обслуживании экземпляров отказоустойчивых кластеров. Администрирование и обслуживание экземпляра отказоустойчивого кластера
Описание и понятия конфигурации с несколькими подсетями Кластеры SQL Server с несколькими подсетями (SQL Server)

Поддерживаемая конфигурация SQL Server FCI на кластере отказоустойчивости Windows Server (WSFC)

Корпорация Майкрософт поддерживает sql Server FCIs на основе WSFC в следующих продуктах:

  • Windows Server 2012
  • Windows Server 2012 R2
  • Выпуски Windows Server 2016 Standard и Datacenter
  • Выпуски Windows Server 2019 Standard и Datacenter
  • Выпуски Windows Server 2022 Standard и Datacenter

Примечание.

Сведения о Windows Server 2012 и Windows Server 2012 R2 см. в политике поддержки Майкрософт для отказоустойчивых кластеров Windows Server.

Windows Server предоставляет два типа служб кластеризации:

Только решения кластера серверов можно использовать вместе с SQL Server для обеспечения высокой доступности, если узел потерян или возникла проблема с экземпляром SQL Server. Балансировка нагрузки сети может использоваться в некоторых случаях вместе с автономными установками SQL Server только для чтения.

Для каждого FCI SQL Server требуется:

  • Выделенная группа кластеров с уникально назначенными буквами дисковода.
  • По крайней мере один уникальный IP-адрес.
  • Уникальные имена виртуальных серверов и инстансов в рамках домена.

Поддержка стороннего кластерного решения

SQL Server разрабатывается и тестируется с помощью кластеризации Microsoft Server. При использовании стороннего продукта кластеризации вашим основным контактом для поддержки по вопросам установки, производительности или поведения кластера должен быть сторонний поставщик решений. Корпорация Майкрософт предлагает коммерческую поддержку сторонних установок кластера, аналогичную поддержке автономных развертываний SQL Server.

Количество поддерживаемых узлов

Дополнительные сведения о максимальном количестве поддерживаемых узлов для экземпляров отказоустойчивого кластера Always On см. в следующей статье:

Поддерживаемая операционная система

Поддерживаемые операционные системы для отказоустойчивой кластеризации SQL Server см. в статье "Проверка операционной системы перед установкой отказоустойчивой кластеризации".

Подключенные диски

Использование подключенных дисков не поддерживается в кластере, который включает установку SQL Server. Дополнительные сведения см. в статье о поддержке SQL Server для подключенных томов.

Общие тома кластера (CSV)

SQL Server 2012 (11.x) и более ранние версии не поддерживают использование CSV для SQL Server в отказоустойчивом кластере.

Чтобы использовать CSV-файл с SQL Server 2014 (12.x) или более поздними версиями, ознакомьтесь со следующими ресурсами:

Ограничения контроллера домена

Экземпляры отказоустойчивого кластера SQL Server не поддерживаются на узлах экземпляров отказоустойчивого кластера, настроенных как контроллеры домена.

Рекомендации по миграции домена

SQL Server 2005 (9.x) и более поздних версий нельзя перенести в новый домен. Необходимо удалить и переустановить компоненты отказоустойчивого кластера. Дополнительные сведения о перемещении кластера Windows Server из одного домена в другой см. в статье "Перемещение кластера Windows Server из одного домена в другой".

Перед удалением SQL Server необходимо выполнить следующие действия.

  • Задайте SQL Server для использования безопасности в смешанном режиме или добавления новых учетных записей домена в имена входа SQL Server.

  • Переименуйте папку DATA, содержащую системные базы данных, чтобы ее можно было переключить обратно после переустановки, чтобы сократить время простоя.

  • Не удаляйте какие-либо из следующих компонентов: файлы поддержки SQL Server, собственный клиент SQL Server, службы Integration Services или компоненты рабочей станции, если вы не перестроите весь узел.

Предупреждение

Если во время процесса деинсталляции возникают ошибки, может потребоваться перестроить узел для успешной повторной установки SQL Server.