Поделиться через


Отказоустойчивая кластеризация в Windows Server и локальной среде Azure

Отказоустойчивая кластеризация — это мощная стратегия обеспечения высокой доступности и непрерывной работы в критически важных средах. Она включает в себя конфигурацию независимых компьютеров, известных как узлы, которые совместно работают для повышения доступности и масштабируемости приложений и служб, которые теперь называются кластеризованными ролями. Эти узлы взаимосвязаны как с помощью физического кабеля, так и программного обеспечения.

Если в одном или нескольких узлах происходит сбой, оставшиеся узлы автоматически перераспределяют рабочую нагрузку — процесс, называемый фейловером, минимизируя сбои. Кроме того, работоспособность кластеризованных ролей постоянно отслеживается. Если обнаружены какие-либо проблемы, роли перезапускаются или переносятся на другой узел для обеспечения простой работы. Этот упреждающий подход гарантирует, что службы остаются постоянно доступными, даже если возникают сбои оборудования или программного обеспечения.

Сеть является важной ролью в отказоустойчивых кластерах, обеспечивая надежную связь и эффективный обмен данными между узлами кластера и внешними клиентами. Кластеры часто используют выделенные частные сети для внутренних функций, таких как сигналы пульса и управление кластерами, а отдельные общедоступные сети обрабатывают доступ клиентов и данные приложения. Это разделение сети повышает производительность и безопасность, изолируя критически важный трафик кластера от внешних сбоев. Он также повышает устойчивость к сбоям, обеспечивая непрерывность внутренних операций кластера и высокую доступность клиентских подключений во время событий переключения на резерв.

Работоспособность кластера постоянно отслеживается с помощью сигналов пульса, которые помогают обнаруживать проблемы. Если возникает проблема, система может автоматически инициировать переключение на резерв для поддержания непрерывности обслуживания. Чтобы защитить конфиденциальные данные и соответствовать стандартам организации, отказоустойчивые кластеры включают надежные меры безопасности, такие как шифрование для защиты данных как при передаче, так и в состоянии хранения. Они также используют детализированный контроль доступа для эффективного управления разрешениями и правами доступа.

Дополнительные сведения о отказоустойчивой кластеризации в локальной среде Azure см. в статье Общие сведения о кластере и кворуме пула.

Конфигурация активного и пассивного резервирования

Отказоустойчивые кластеры можно настроить в двух основных конфигурациях, active-active и active-passive. Каждая конфигурация имеет собственные компромиссы: активная-активная сосредоточена на производительности и эффективности ресурсов, в то время как активная-пассивная подчеркивает простоту и надежность в сценариях переключения при отказе. Выбор зависит от конкретных потребностей организации и важности кластеризации приложений.

Конфигурация Операция
Активен В активном-активном отказоустойчивом кластере все узлы задействованы и работают одновременно, чтобы обеспечить балансировку рабочей нагрузки по всему кластеру. Эта конфигурация распределяет задачи, мощность обработки или службы между всеми доступными узлами, что позволяет эффективно использовать ресурсы. Вот как это работает:

  • Балансировка нагрузки: Каждый узел обрабатывает часть всей рабочей нагрузки, повышает производительность и гарантирует, что ни один узел не становится узким местом. Это равное распределение может повысить скорость реагирования и пропускную способность, так как несколько узлов одновременно обслуживают запросы.
  • Использование ресурсов: Настройка active-active обеспечивает максимальное использование ресурсов, так как все узлы работают и способствуют производительности кластера. Эта настройка идеально подходит для сред, где максимизация доступных ресурсов имеет решающее значение.
  • Отказоустойчивость: Если один узел выходит из строя, оставшиеся узлы в кластере могут продолжать обрабатывать нагрузку. Потеря узла может временно сократить общую емкость, но система остается операционной без сбоев в обслуживании.
  • Пассивный В кластере отказоустойчивости с активным-пассивным режимом некоторые узлы назначаются активными, а другие находятся в режиме ожидания, готовые перейти в активный режим в случае сбоя активного узла. Вот как это работает:

  • Резервные узлы: Пассивные узлы, по сути, находятся в состоянии ожидания, не обрабатывая никакие задачи или службы во время обычных операций. Эти узлы готовы взять на себя обязанности в случае, если активный узел выйдет из строя.
  • Процесс переключения на резервный узел: При обнаружении сбоя резервный узел активируется и берет на себя функции неисправного узла. Это позволяет быстро принести пассивный узел в режим "в сети", чтобы обеспечить непрерывность служб.
  • Распределение ресурсов: Активно-пассивные конфигурации могут не использовать доступные аппаратные ресурсы во время обычных операций, так как резервные узлы остаются бездействующими. Однако эта настройка может быть проще управлять и обеспечить прогнозируемую производительность в определенных условиях.
  • Простота и надежность: Активная пассивное настройка может быть выгодной для приложений, где стабильность и прогнозируемость более важны, чем максимизация операционной эффективности. Часто проще реализовать и поддерживать по сравнению с конфигурацией active-active.
  • Функции отказоустойчивой кластеризации

    Отказоустойчивая кластеризация предоставляет полный набор функциональных возможностей, предназначенных для максимальной доступности, обеспечения целостности данных и упрощения управления критически важными рабочими нагрузками. Эти функции позволяют организациям поддерживать непрерывность служб, эффективно управлять ресурсами и быстро восстанавливаться после сбоев оборудования или программного обеспечения. Некоторые функции, предоставляемые отказоустойчивой кластеризации, включают:

    • Узлы кластера и кворум:

      Узлы кластера совместно работают для поддержания того, что называется кворумом, что, по сути, является минимальным количеством голосов от членов кластера, необходимых для правильной работы кластера. Этот механизм предотвращает сценарии разделения мозга, где разделенные части кластера могут пытаться работать независимо, потенциально вызывая несоответствия. Модели кворума, такие как Большинство узлов, Большинство узлов и дисков, Большинство узлов и файловых разделов, а также Отсутствие большинства (только диск), определяют, как назначаются и подсчитываются голоса. Например, большинство узлов назначает каждому узлу голос, а большинство узлов и дисков включает дополнительные голоса с диска или общей папки.

    • Конфигурация хранилища:

      Важной особенностью отказоустойчивых кластеров является общий том кластера (CSV), который позволяет нескольким узлам одновременно получить доступ к одному хранилищу, что позволяет плавно управлять дисками и координацией без потери производительности. CsVs — это неотъемлемая часть конфигураций хранилища в отказоустойчивых кластерах. Кластерные общие тома способствуют эффективному доступу к диску, позволяя узлам совместно выполнять задачи хранения.

    • Упреждающий мониторинг и управление:

      Отказоустойчивые кластеры используют сигналы пульса в качестве средства мониторинга работоспособности узлов и их ролей. Эти сигналы помогают обнаруживать такие проблемы, как сбои узлов или нарушения работы служб. При обнаружении таких проблем система может автоматически инициировать процедуры переключения, обеспечивая непрерывность работы и минимизируя простой.

    • Безопасность и соответствие требованиям:

      Безопасность является жизненно важным аспектом отказоустойчивых кластеров, включая такие функции, как шифрование и управление доступом для защиты данных и кластерных операций. Кластеры помогают организациям соответствовать требованиям к критически важным приложениям, обеспечивая безопасную обработку данных и надежную производительность системы. Это делает их подходящими для сред, требующих строгой защиты данных и соблюдения нормативных требований.

    • Варианты использования:

      Отказоустойчивая кластеризация имеет несколько практических приложений, включая аварийное восстановление, балансировку нагрузки и высокопроизводительные вычисления. Она поддерживает критически важные приложения, обеспечивая высокий уровень доступности, позволяя предприятиям поддерживать операции даже в неблагоприятных условиях. Например, в сценариях аварийного восстановления кластеры могут быстро восстановить сервисы, передав операции на непострадавшие узлы.

      • Отказоустойчивая кластеризация обеспечивает высокий уровень доступности или непрерывную доступность критически важных приложений и служб (кластеризованных ролей), работающих на физических серверах или виртуальных машинах. Если происходит сбой, эти роли можно быстро переместить или перезапустить на другом узле, свести к минимуму время простоя и обеспечить согласованную производительность и избыточность.

      • Такие приложения, как Microsoft SQL Server и Hyper-V виртуальные машины, получают преимущества от отказоустойчивой кластеризации путем минимального прерывания работы службы даже во время сбоев оборудования или программного обеспечения.

    Ресурсы отказоустойчивой кластеризации

    Эта курированная таблица ресурсов предназначена для эффективного понимания, планирования, развертывания и управления отказоустойчивой кластеризации.

    Общие сведения Планирование Развертывание
    Что нового в отказоустойчивой кластеризации? Планирование требований к оборудованию для отказоустойчивой кластеризации и варианты хранилища Создание отказоустойчивого кластера
    Масштабируемый файловый сервер для данных приложений Используйте общие тома кластера (CSV) Развертывание двухузлового файлового сервера
    Кворум кластера и пула Использование кластеров гостевых виртуальных машин с Storage Spaces Direct Предварительное создание кластерных объектов компьютеров в службах домена Active Directory
    Учет области отказов Настройка учетных записей кластеров в Active Directory
    Упрощенные сети кластера SMB Multichannel и Multi-NIC Восстановление отказоустойчивого кластера без кворума
    Балансировка нагрузки для виртуальных машин Развернуть свидетеля кворума
    Наборы кластеров Последовательное обновление ОС кластера
    Сходство кластеров Обновление отказоустойчивого кластера на одном оборудовании
    Развертывание отсоединенного от Active Directory кластера
    Управление Средства и параметры Ресурсы сообщества
    Кластерно-ориентированное обновление Командлеты PowerShell для отказоустойчивой кластеризации Форум отказоустойчивого кластера
    Служба здравоохранения Командлеты PowerShell для обновления с учетом кластера Блог об отказоустойчивой кластеризации
    Миграция домена кластера
    Устранение неполадок с помощью отчетов об ошибках Windows