Поделиться через


Надежность в Операторе Azure Nexus

Важно!

Эта функция в настоящее время находится на стадии предварительной версии. Предварительные версии предоставляются только в том случае, если вы принимаете дополнительные условия использования.

В этой статье описывается поддержка надежности в Операторе Azure Nexus и охватывает устойчивость внутри региона с зонами доступности. Более подробный обзор надежности в Azure см. в статье "Надежность Azure".

Поддержка зоны доступности

Зоны доступности Azure — это по крайней мере три физически отдельные группы центров обработки данных в каждом регионе Azure. Центры обработки данных в каждой зоне оснащены независимой питанием, охлаждения и сетевой инфраструктурой. В случае сбоя локальной зоны зоны зоны создаются таким образом, чтобы при возникновении влияния одной зоны, региональных служб, емкости и высокой доступности поддерживались остальными двумя зонами.

Сбои могут варьироваться от сбоев программного обеспечения и оборудования до таких событий, как землетрясения, наводнения и пожары. Устойчивость к сбоям достигается с избыточностью и логической изоляцией служб Azure. Дополнительные сведения о зонах доступности в Azure см. в разделе "Регионы и зоны доступности".

Службы с поддержкой зон доступности Azure предназначены для обеспечения правильного уровня надежности и гибкости. Их можно настроить двумя способами. Они могут быть избыточными по зонам с автоматическим реплика tion между зонами или зональными экземплярами, закрепленными в определенной зоне. Эти подходы также можно объединить. Дополнительные сведения об зональной архитектуре, избыточной между зонами, см. в Рекомендации использования зональных зон и регионов.

Оператор Azure Nexus предлагает развертывания, избыточные между зонами доступности, по умолчанию. Компоненты Nexus операторов, такие как Диспетчер кластеров и контроллер Network Fabric, развертываются в кластере Служба Azure Kubernetes (AKS), который включен с зонами доступности. Другие зависимости служб, такие как служба учетной записи служба хранилища и KeyVault, также настроены с избыточностью зоны доступности.

Примечание.

Локальный экземпляр Оператора Nexus реализует много стойку, которая обеспечивает физическую избыточность на всех уровнях стека. Каждая стойка предназначена в качестве домена сбоя или зоны Nexus. Рабочие нагрузки клиентов можно развертывать на нескольких стойких или узлах, что, по сути, обеспечивает аналогичный интерфейс зоны доступности.

Простой интерфейс зоны доступности Azure

В сценарии уменьшения зоны доступности вызовы API к кластеру и поставщикам ресурсов будут продолжать работать без прерывания. Влияние на текущие рабочие нагрузки локального клиента или на возможность создания новых рабочих нагрузок клиента не будет. Кроме того, потеря данных не должна возникать, так как обеспечивается устойчивость оператора Nexus и других типов ресурсов.

Поддержка отработки отказа в зоне доступности Azure

В случае сбоя зоны доступности повторное подключение к другой зоне доступности Azure выполняется автоматически и не требует взаимодействия с пользователем.

Доступность в развертываниях экземпляров Operator Nexus

Обеспечение доступности в развертываниях рабочих нагрузок Оператора Azure Nexus является разделением ответственности. Как указано в предыдущем разделе, ресурсы на основе Оператора Nexus AKS развертываются с избыточностью зоны доступности. В этом разделе мы рассмотрим рекомендации по доступности локальной рабочей нагрузки.

Как правило, целевые показатели доступности достигаются с помощью локальных и геоизбыточного развертываний.

Зона Nexus: механизм избыточности локальной рабочей нагрузки

Локальные экземпляры Оператора Nexus состоят из нескольких стоек, обеспечивающий физическую избыточность на всех уровнях стека. Каждая стойка назначается в качестве домена сбоя и, таким образом, может быть настроена в качестве зоны Nexus, где эти зоны могут и, предпочтительно, должны использоваться для развертывания локальных избыточных рабочих нагрузок.

Экземпляр Nexus: механизм избыточности георабочая нагрузка

Локальные экземпляры Nexus размещаются в определенном регионе Azure. Как упоминалось ранее, используемые службы Azure и ресурсы Nexus развертываются в нескольких зонах доступности этого региона Azure.

Экземпляры Nexus, географически распределенные, т. е. не в одном и том же центре обработки данных оператора (возможно, даже в одном географическом регионе) и размещенные в разных регионах Azure должны использоваться для избыточного развертывания рабочих нагрузок для геоизбыточного обеспечения.

Предупреждение

Например, развертывание рабочих нагрузок в двух географически распределенных экземплярах Nexus недостаточно для достижения истинной геоизбыточности, если геоизбыточные экземпляры Nexus не размещаются в разных регионах Azure.

В маловероятном случае, когда регион Azure становится недоступным, службы Azure, а также ресурсы Nexus в этом регионе также становятся недоступными. Хотя это не влияет на выполнение рабочих нагрузок, это предотвращает такие возможности, как запуск новых рабочих нагрузок, аналитика и т. д.

Несколько экземпляров Nexus в одном географическом расположении

Существуют сценарии, в которых необходимо развернуть несколько экземпляров Nexus в одном географическом расположении. Геоизбыточность рабочей нагрузки, очевидно, не достигается путем развертывания рабочих нагрузок в экземплярах Nexus в том же географическом расположении.

Одним из соображений надежности, кроме доступности, является устойчивость и возможность восстановления после сбоев. Восстановление от сбоев и возможность удовлетворения целей во время восстановления требует, чтобы мы ограничиваем "взрыв" или радиус влияния сбоев. В сценарии развертывания нескольких экземпляров Nexus в одном географическом расположении устойчивый дизайн требует размещения этих экземпляров Nexus в разных регионах Azure. Таким образом, если регион Azure завершается сбоем, его влияние ограничено одним экземпляром Nexus.

Следующие шаги