Общая ответственность за надежность

На Azure общедоступной облачной платформе Microsoft и вы несете ответственность за надежность. Каждая рабочая нагрузка, которую вы разрабатываете и развертываете, предлагает различные уровни надежности, поэтому важно понимать, кто несет основную ответственность за каждый уровень с точки зрения надежности.

Чтобы лучше понять, как работает общая ответственность, особенно при устранении сбоя или аварии, в этой статье описывается модель общей ответственности за надежность. Дополнительные сведения об использовании этой модели для планирования аварийного восстановления см. в рекомендациях по разработке стратегии аварийного восстановления.

Модель общей ответственности за надежность

Модель общей ответственности за надежность имеет три уровня:

  • Надежность основной платформы. Платформа Azure обеспечивает базовый уровень надежности для всех клиентов и всех служб через базовую инфраструктуру, службы и процессы.
  • Возможности повышения надежности. Azure предлагает набор встроенных функций и служб, которые повышают надежность, такие как использование зон доступности, развертывание в нескольких регионах и реализация стратегий резервного копирования. Хотя Azure предоставляет эти возможности, вы несете ответственность за оценку и настройку этих возможностей в соответствии с конкретными требованиями. Требования могут включать надежность, стоимость, производительность и соответствие нормативным стандартам.
  • Приложения. Чтобы эффективно использовать другие уровни, необходимо разработать приложение и рабочую нагрузку для надежности.

Схема, показывающая модель общей ответственности за надежность: надежность основной платформы, повышение надежности возможностей и приложений.

Корпорация Майкрософт несет ответственность за надежность основной платформы. Корпорация Майкрософт также отвечает за обеспечение возможностей повышения надежности, которые можно использовать. Вы несете ответственность за выбор и использование соответствующих компонентов.

Выбранная категория службы — SaaS, PaaS или IaaS — определяет, какие решения вы принимаете. Например, если вы используете службу SaaS, обычно не нужно использовать зоны доступности. Если вы используете службы PaaS для уровня данных, возможно, у вас есть автоматизированные возможности для резервного копирования. Если вы используете службы IaaS, вам обычно нужно спланировать и реализовать множество возможностей надежности самостоятельно.

Замечание

Категории служб (SaaS, PaaS и IaaS) полезны как широкая группа служб, но важно понимать свои обязанности по каждой используемой вами службе.

Руководства по надежности предоставляют обзор работы каждой службы с точки зрения надежности и помогают принимать обоснованные решения о настройке служб в соответствии с вашими потребностями.

Вы также отвечаете за разработку приложения и рабочей нагрузки, а также за определение требований к надежности, которые помогут вам решить, как разработать и настроить решение. Необходимо убедиться, что ваш дизайн соответствует любым применимым нормативным или договорным требованиям, таким как географическое расположение, в котором хранятся данные.

Надежность основной платформы

Облачная платформа Майкрософт состоит из большого объема инфраструктуры, оборудования, программного обеспечения и процессов для поддержки развертывания и управления службами. Каждый компонент предназначен для обеспечения высокой устойчивости, с несколькими уровнями избыточности оборудования и программными процессами, основанными на исследованиях. Вместе эти компоненты составляют базовый уровень надежности платформы. Некоторые примеры того, как Microsoft предоставляет надежную платформу, включают следующие функции:

  • Сети имеют избыточные ссылки и могут динамически обходить неисправные сегменты.
  • В каждом регионе центры обработки данных подключаются через сеть с низкой задержкой, которая обеспечивает различные подходы к репликации данных.
  • Объекты центра обработки данных имеют избыточное питание, охлаждение и сетевые подключения. Команды на объекте эксплуатируют эти объекты, обеспечивают их безопасность, контролируют их состояние и управляют ими.
  • Для оборудования, включая кластеры и стойки, предусмотрено резервирование на нескольких уровнях.
  • Обновления вычислительных кластеров, стоек и узлов следуют управляемому процессу. Платформа использует такие методы, как горячее патчирование, чтобы свести к минимуму или полностью устранить воздействие на хосты.
  • Обновления платформы программного обеспечения и изменения конфигурации соответствуют безопасным методикам развертывания.
  • Корпорация Майкрософт выполняет аудит критически важных внешних поставщиков, чтобы гарантировать, что сторонний сбой не нарушает Azure службы.
  • Каждая служба Azure должна иметь подробный план аварийного восстановления. Microsoft выполняет детализацию полного региона в регионах, соответствующих рабочим средам.

Все службы Azure получают преимущества от этих основных возможностей надежности платформы и от текущих улучшений Microsoft делает.

Возможности повышения надежности

Azure предоставляет множество различных возможностей повышения надежности. Хотя Microsoft отвечает за предоставление этих возможностей, вы полностью отвечаете за выбор и использование подходящих для ваших потребностей. Ниже приведены некоторые примеры этих возможностей.

  • Регионы. Azure имеет более 70 регионов, и вы можете использовать несколько регионов в одном решении для обеспечения геоизбыточной избыточности, удовлетворения потребностей расположения данных и обеспечения низкой задержки связи с пользователями во всем мире. Дополнительные сведения о регионах см. в статье Что такое регионы Azure?

  • зоны доступности Многие Azure регионы поддерживают зоны доступности, которые позволяют распределять рабочие нагрузки между несколькими независимыми наборами центров обработки данных. Службы Azure поддерживают зоны доступности в соответствии со своим назначением, как правило, за счёт поддержки зональных развертываний (закреплённых в одной зоне) или развертываний с избыточностью между зонами (распределённых по нескольким зонам). Дополнительные сведения о зонах доступности см. в статье "Что такое зоны доступности?"

  • Уровни служб. Службы предоставляют ряд предложений и уровней, которые соответствуют разным требованиям. Вы несете ответственность за выбор соответствующего уровня в зависимости от ваших целей надежности и других потребностей. Например, при создании виртуальной машины можно выбрать между стандартным диском, который является более экономичным вариантом, или диском класса Premium для достижения более высокого уровня доступности.

  • Резервное копирование. Многие службы Azure, которые хранят данные, поддерживают резервное копирование, которое может быть как автоматическим, так и выполняться вручную. С помощью резервных копий можно защитить рабочую нагрузку от сбоев, а также повреждения данных и других событий потери данных. Вы несете ответственность за проверку включения резервных копий и их настройку соответствующим образом.

  • Управление. Вы можете настроить такие возможности платформы, как Политика Azure, управление доступом на основе ролей и Microsoft Entra ID возможности защиты идентификации для обеспечения согласованного применения требований организации. Используя эти подходы, вы можете защитить рабочие нагрузки от инцидентов безопасности и случайных изменений, которые могут привести к простою или другим проблемам с рабочей нагрузкой. Корпорация Майкрософт предоставляет эти средства управления, но вы отвечаете за настройку и обслуживание этих средств.

Это важно

Важно понимать соглашения об уровне обслуживания (SLA) для каждой службы Azure. Соглашения об уровне обслуживания предоставляют важную информацию о ожидаемом времени простоя службы, и любые условия, необходимые для предоставления соглашения об уровне обслуживания. Вы несете ответственность за понимание и соблюдение этих условий; Microsoft не отслеживает или не применяет ваши права.

Сведения об уровне обслуживания для каждой службы см. в соглашениях об уровне обслуживания для веб-служб.

Приложения

Вы несете ответственность за обеспечение устойчивости приложений к сбоям и выполнение других рекомендаций по надежности. Используйте пилары Azure Well-Architected Framework для достижения архитектурного совершенства на фундаментальном уровне рабочей нагрузки. "Столп надежности сосредотачивается на том, как сделать рабочие нагрузки и приложения устойчивыми к различным типам сбоев, а также обеспечить их восстановление в случае этих сбоев."

Дальнейшие шаги

Модель общей ответственности применяется к другим частям решения за пределами надежности. Дополнительные сведения о модели общей ответственности за безопасность смотрите в Центре управления доверием Майкрософт.