Поделиться через


Гибкая политика отработки отказа для автоматического перехода на другой ресурс группы доступности (SQL Server)

Гибкая политика отработки отказа обеспечивает гранулярное управление условиями, которые могут вызвать автоматический переход на другой ресурс для группы доступности. Изменяя условия отказа, которые инициируют автоматический переход на другой ресурс, и частоту проверки исправности, вы можете увеличить или уменьшить вероятность автоматического перехода на другой ресурс и добиться высокого уровня доступности соглашения об уровне обслуживания.

Гибкая политика отработки отказа группы доступности определяется уровнем условий сбоя и пороговым значением времени ожидания проверки работоспособности. При обнаружении, что группа доступности превысила уровень условий сбоя или пороговое значение проверки времени ожидания работоспособности, DLL-ресурс группы доступности ответит WSFC-кластеру. После этого WSFC-кластер инициирует автоматический переход на вторичную реплику.

Важное примечаниеВажно!

Если в группе доступности превышен порог сбоя WSFC, то кластер WSFC не выполняет автоматический переход на другой ресурс для этой группы доступности. Более того, группа ресурсов WSFC для группы доступности остается в состоянии сбоя, пока администратор кластера вручную не переведет сбойную группу ресурсов в режим «в сети» или пока администратор базы данных вручную не выполнит переход группы доступности на другой ресурс. Порог сбоя WSFC определяется как максимальное число сбоев, которые могут произойти в группе доступности за заданный период времени. По умолчанию используется период в шесть часов, а максимальное число сбоев за этот период по умолчанию равно n-1, где n — число узлов WSFC. Чтобы изменить пороговые значения сбоя для заданной группы доступности, используйте консоль диспетчера отработки отказа WSFC.

В этом разделе содержатся следующие подразделы:

  • Пороговое значение времени ожидания проверки работоспособности

  • Уровень условий сбоя

  • Связанные задачи

  • См. также

Пороговое значение времени ожидания проверки работоспособности

Библиотека ресурсов группы доступности в WSFC-кластере выполняет проверку исправности первичной реплики путем вызова хранимой процедуры sp_server_diagnostics для экземпляра SQL Server, на котором располагается первичная реплика. sp_server_diagnostics возвращает результаты на интервал, равный 1/3 порогового значения времени ожидания проверки работоспособности для группы доступности. Пороговое значение времени ожидания проверки работоспособности по умолчанию составляет 30 секунд, то есть sp_server_diagnostics возвращает сведения с интервалом в 10 секунд. Если sp_server_diagnostics работает медленно или не возвращает сведения, библиотека ресурсов ждет до конца полного интервала проверки времени ожидания работоспособности, прежде чем определить, что первичная реплика не отвечает. Если первичная реплика не отвечает, инициируется автоматический переход на другой ресурс, если она поддерживается.

Важное примечаниеВажно!

Хранимая процедура sp_server_diagnostics не выполняет проверку исправности на уровне базы данных.

Значок стрелки, используемый со ссылкой «В начало»[В начало]

Уровень условий сбоя

Возвращаются ли сведения диагностики и исправности командой sp_server_diagnostics, гарантирует, что автоматический переход на другой ресурс зависит от уровня условий сбоя группы доступности. Уровень условия сбоя определяет, какие условия сбоя инициируют автоматический переход на другой ресурс. Существует пять уровней условий сбоя, которые варьируются от наименее ограничительного (уровень 1) до наиболее ограничительного (уровень 5). Заданный уровень включает в себя ограничения всех предыдущих уровней. Таким образом, наиболее строгий уровень 5 включает в себя менее строгие уровни ограничений с 1 по 4 и т. д.

Важное примечаниеВажно!

Ни на одном из уровней условий сбоя не обнаружено поврежденных и подозрительных баз данных. Следовательно, поврежденная или подозрительная база данных (из-за ошибки оборудования, повреждения данных или по другой причине) никогда не вызывает автоматического перехода на другой ресурс.

В следующей таблице описываются условия сбоя, которые соответствуют каждому уровню.

Уровень

Условия сбоя

Значение Transact-SQL

Значение PowerShell

Один

При остановке работы сервера. Указывает, что автоматический переход на другой ресурс инициируется при возникновении любой из следующих ситуаций:

Это наименее ограничительный уровень.

1

OnServerDown

Два

При отсутствии ответа от сервера. Указывает, что автоматический переход на другой ресурс инициируется при возникновении любой из следующих ситуаций:

  • Экземпляр SQL Server не подключается к кластеру, а определяемый пользователем порог времени ожидания проверки исправности для группы доступности превышен.

  • Реплика доступности находится в неисправном состоянии.

2

OnServerUnresponsive

Три  

В случае критической ошибки сервера. Указывает, что автоматический переход на другой ресурс инициируется в случае появления критических внутренних ошибок SQL Server, таких как потерянные спин-блокировки, серьезные нарушения доступа для записи или формирование слишком больших дампов.

Это уровень, заданный по умолчанию.

3

OnCriticalServerError

Четыре

В случае ошибки сервера средней значимости. Указывает, что автоматический переход на другой ресурс инициируется в случае появления умеренных внутренних ошибок SQL Server, например устойчивое состояние нехватки памяти в пуле внутренних ресурсов SQL Server.

4

OnModerateServerError

Пять

При любых подходящих условиях сбоя. Указывает, что автоматический переход на другой ресурс инициируется при любом удовлетворяющем условиям состоянии сбоя, включая:

  • Исчерпание рабочих потоков SQL Engine.

  • Обнаружение неразрешимой взаимоблокировки.

Это наиболее ограничительный уровень.

5

OnAnyQualifiedFailureConditions

ПримечаниеПримечание

Отсутствие ответа экземпляра SQL Server на клиентские запросы не является существенным для групп доступности.

Значок стрелки, используемый со ссылкой «В начало»[В начало]

Связанные задачи

Настройка автоматического перехода на другой ресурс

Значок стрелки, используемый со ссылкой «В начало»[В начало]

См. также

Значок стрелки, используемый со ссылкой «В начало»[В начало]

См. также

Справочник

sp_server_diagnostics (Transact-SQL)

Основные понятия

Обзор групп доступности AlwaysOn (SQL Server)

Режимы доступности (группы доступности AlwaysOn)

Отработка отказа и режимы отработки отказа (группы доступности AlwaysOn)

Отказоустойчивая кластеризация Windows Server (WSFC) с SQL Server

Политика отработки отказа для экземпляров отказоустойчивого кластера