Режимы кворума WSFC и участвующая в голосовании конфигурация (SQL Server)

Применимо к:SQL Server

Как SQL Server Always On группы доступности, так и Always On экземпляры отказоустойчивого кластера (FCI) используют преимущества отказоустойчивой кластеризации Windows Server (WSFC) в качестве технологии платформы. В WSFC для мониторинга общей исправности кластера и обеспечения максимальной отказоустойчивости на уровне узлов используется подход, основанный на кворуме. Для проектирования, эксплуатации и устранения неполадок решений высокого уровня доступности режима AlwaysOn и решений аварийного восстановления требуется отличное знание режимов кворума WSFC и конфигурации голосования узлов.

Определение исправности кластера по кворуму

Все узлы в кластере WSFC участвуют в периодической передаче тактового импульса, сообщающего состояние исправности узла другим узлам. Неотвечающие узлы считаются неисправными.

Набор узлов кворума — это большинство узлов с правом голоса и следящих объектов в кластере WSFC. Общая исправность и состояние кластера WSFC определяется периодическим голосованием с кворумом. Наличие кворума означает, что кластер работоспособен и может обеспечивать отказоустойчивость на уровне узла.

Отсутствие кворума указывает, что кластер неработоспособен. Необходимо поддерживать общую исправность кластера WSFC, чтобы обеспечить доступность и работоспособность вторичных узлов, на которые смогут переключаться первичные узлы в случае сбоя. Если голосование с кворумом завершается неудачей, кластер WSFC переводится в режим «вне сети» в качестве меры предосторожности. При этом также останавливаются все экземпляры SQL Server , зарегистрированные в кластере.

Важно!

Если кластер WSFC переводится в режим «вне сети» из-за отсутствия кворума, перевести его обратно в оперативный режим потребуется вручную.

Дополнительные сведения см. в статье Аварийное восстановление WSFC через принудительный кворум (SQL Server).

Режимы кворума

Режим кворума настраивается на уровне кластера WSFC, который определяет метод проведения голосования с кворумом. Диспетчер отказоустойчивого кластера рекомендует режим кворума на основании количества узлов в кластере.

Для определения кворума голосов можно использовать следующие режимы кворума:

  • Большинство узлов. Кластер признается работоспособным, если больше половины узлов подтверждают работоспособность кластера.

  • Большинство узлов и общих папок. Аналогичен режиму кворума большинства узлов, за исключением того, что удаленная общая папка также настраивается в качестве следящей папки с правом голоса, и подключения от любого узла к этой папке также считаются голосами, подтверждающими работоспособность. Кластер признается работоспособным, если больше половины возможных голосов подтверждают работоспособность кластера.

    Рекомендуется, чтобы следящая общая папка не размещалась ни на одном узле в кластере и была видима для всех узлов в кластере.

  • Большинство узлов и дисков. Аналогичен режиму кворума большинства узлов, за исключением того, что общий дисковый кластерный ресурс также признается следящим объектом с правом голоса, а все подключения от любого узла к этому общему диску считаются голосами, подтверждающими работоспособность. Кластер признается работоспособным, если больше половины возможных голосов подтверждают работоспособность кластера.

  • только диск. Общий дисковый кластерный ресурс признается следящим, а подключение от любого узла к этому общему диску считается голосом, подтверждающим работоспособность.

Совет

При использовании асимметричной системы хранения для Группы доступности AlwaysOnв общем случае следует использовать режим кворума «Большинство узлов» при нечетном числе узлов с правом голоса и режим кворума «Большинство узлов и общих папок» при четном числе узлов с правом голоса.

Узлы с правом и без права голоса

По умолчанию каждый узел в кластере WSFC включается в качестве члена кворума кластера. Каждый узел имеет один голос, который учитывается при определении общей исправности кластера, и каждый узел постоянно пытается образовать кворум. На данный момент были четко определены узлы кластера WSFC, принимающие участие в голосовании по исправности кластера, которые называются узлами с правом голоса.

Ни один отдельный узел в кластере WSFC не может окончательно определить, является ли кластер в целом работоспособным. В любой момент времени с точки зрения любого узла может казаться, что некоторые другие узлы не работают, находятся в процессе отработки отказа или не отвечают из-за сбоя сетевого подключения. Главная задача голосования с кворумом — определить, является ли видимое состояние каждого узла в кластере WSFC фактическим состоянием этих узлов.

Для всех режимов кворума, кроме "только диски", эффективность голосования кворума зависит от надежности соединений между всеми узлами с правом голоса в кластере. Сетевые соединения между узлами в одной физической подсети следует считать надежными, и голосование кворума следует считать надежным.

Однако если в голосовании кворума кажется, что узел или другая подсеть не отвечают, но на самом деле они находятся в рабочем состоянии, то, скорее всего, это происходит из-за сбоя соединения между подсетями. В зависимости от топологии кластера, режима кворума и конфигурации политики отработки отказа, сбой сетевого соединения может приводить к созданию более одного набора узлов с правом голоса.

Если свой собственный кворум могут организовать несколько наборов узлов с правом голоса, это называется сценарием с дроблением. В этом случае узлы в отдельных кворумах могут вести себя по-разному и находиться в конфликте друг с другом.

Примечание

Сценарий с дроблением возможен только в случаях, когда системный администратор вручную организует принудительную работу кворума или в очень редких случаях принудительной отработки отказа при явном разделении набора узлов кворума.

Чтобы упростить настройку кворума и увеличить время безотказной работы, можно задать параметр NodeWeight каждого узла, который указывает, учитывается ли голос этого узла при определении кворума.

Важно!

Для использования параметров NodeWeight необходимо применить следующее исправление ко всем серверам в кластере WSFC:

KB2494036: доступно исправление, позволяющее настраивать узел кластера, не имеющий голосов кворума, в Windows Server 2008 и Windows Server 2008 R2

Рекомендуемые настройки для голосования с кворумом

При включении или отключении голоса конкретного узла WSFC соблюдайте следующие правила.

  • Отсутствие голосования по умолчанию. Предполагается, что каждый узел не должен голосовать без явного выравнивания.

  • Охватите все основные реплики. Каждый узел WSFC, на котором размещена первичная реплика группы доступности или предпочитаемый владелец FCI, должен иметь голос.

  • Включайте возможных владельцев автоматического перехода на другой ресурс. Каждый узел, на котором в результате автоматического перехода группы доступности или экземпляра отказоустойчивого кластера на другой ресурс может размещаться первичная реплика доступности, должен иметь голос. Если имеется только одна группа доступности в кластере WSFC, а реплики доступности размещаются только на автономных экземплярах, то это правило охватывает только вторичную реплику, которая является целью автоматического перехода на другой ресурс.

  • Исключайте узлы вторичного сайта. В общем случае не давайте голоса узлам WSFC, которые находятся на вторичном сайте аварийного восстановления. Не следует, чтобы узлы на вторичном сайте могли принимать участие в решение о переводе кластера в режим «вне сети», когда на первичном сайте нет никаких проблем.

  • Нечетное число голосов. Если необходимо, добавьте в кластер следящую общую папку, следящий узел или следящий диск и измените режим кворума, чтобы избежать возможного разделения голосов пополам при голосовании с кворумом.

  • Перераспределяйте назначение голосов после отработки отказа. Не следует допускать отработку отказа с переходом на конфигурацию кластера, которая не поддерживает работоспособность кворума.

Важно!

При проверке конфигурации кворума голосования WSFC мастер создания групп доступности в режиме AlwaysOn отображает предупреждение, если выполняется любое из следующих условий:

  • Узел кластера, на котором размещена первичная реплика, не имеет голоса.
  • Вторичная реплика настроена для автоматического перехода на другой ресурс, а ее узел кластера не имеет голоса.
  • KB2494036 не установлено на всех узлах кластера, на которых размещены реплики доступности. Это обновление необходимо для добавления или удаления голосов для узлов кластера в многосайтовых развертываниях. Однако в односайтовых развертываниях это обычно не требуется, поэтому можно безопасно пропустить предупреждение.

Совет

SQL Server предлагает несколько системных динамических административных представлений, которые могут помочь в управлении параметрами конфигурации кластера WSFC и голосовании с кворумом узлов.

Дополнительные сведения можно найти в разделах: sys.dm_hadr_cluster, sys.dm_hadr_cluster_members, sys.dm_os_cluster_nodes, sys.dm_hadr_cluster_networks

Связанные задачи

См. также

См. также:

Аварийное восстановление WSFC через принудительный кворум (SQL Server)
Отказоустойчивая кластеризация Windows Server (WSFC) с SQL Server