Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Хранилище дисков Azure предоставляет управляемые диски для Azure виртуальных машин. Созданная для критически важных рабочих нагрузок, обеспечивает надежность и доступность корпоративного уровня. Данные автоматически реплицируются для защиты от сбоев оборудования с несколькими вариантами избыточности для удовлетворения ваших требований к надежности.
При использовании Azure надежность является общей ответственностью. Майкрософт предоставляет ряд возможностей для поддержки устойчивости и восстановления. Вы несете ответственность за понимание того, как работают эти возможности во всех используемых вами службах, а также за выбор возможностей, необходимых для достижения бизнес-целей и целей бесперебойной работы.
В этой статье описывается, как обеспечить устойчивость Хранилище дисков Azure к различным потенциальным сбоям и проблемам, включая временные сбоя, сбои зоны доступности и сбои в пределах региона. В нем также описываются параметры резервного копирования и восстановления, а также выделены ключевые сведения о соглашении об уровне обслуживания Хранилище дисков Azure (соглашение об уровне обслуживания).
Это важно
При рассмотрении надежности диска также необходимо учитывать надежность виртуальных машин, сетевой инфраструктуры и приложений, работающих на виртуальных машинах. Повышение устойчивости только диска может привести к ограниченному влиянию, если другие компоненты не являются одинаково устойчивыми. В зависимости от требований к устойчивости может потребоваться внести изменения конфигурации в нескольких областях.
Рекомендации по развертыванию в производственной среде
Платформа Azure Well-Architected предоставляет рекомендации по надежности, производительности, безопасности, затратам и операциям. Чтобы понять, как эти области влияют друг на друга и способствуют надежному решению Хранилище дисков Azure, см. статью Рекомендации по архитектуре для Хранилище дисков Azure.
Обзор архитектуры надежности
Каждая виртуальная машина использует диски для разных целей:
- Диск ОС: один диск ОС запускает операционную систему. По умолчанию это управляемый диск, который сохраняет данные. Вы также можете использовать эфемерные диски ОС, которые не управляются. Избегайте использования диска ОС для хранения приложений или данных.
- Диски данных: ноль или более управляемых дисков для хранения приложений и данных.
- Временный диск: неуправляемый диск, включенный в каждую виртуальную машину.
В этом руководстве особое внимание уделяется управляемым дискам, которые надежно сохраняют данные. Дополнительные сведения о различных ролях дисков см. в разделе "Роли диска".
Управляемые диски разработаны для обеспечения доступности виртуальных машин на уровне 99,999% и долговечности не менее 99,999999999% (11 девяток). С управляемыми дисками данные реплицируются три раза. Если одна из трех копий становится недоступной, Azure автоматически создает новую копию данных в фоновом режиме. Это обеспечивает сохраняемость данных и высокую отказоустойчивость.
По умолчанию управляемые диски используют локально избыточное хранилище (LRS). LRS сохраняет три копии данных диска в одном центре обработки данных, обеспечивая защиту от сбоев оборудования, таких как проблемы с диском или стойкой сервера.
Хотя LRS защищает диски от сбоев стойки сервера и диска, он не учитывает такие аварии, как пожар или наводнение в центре обработки данных. Для более высокого уровня защиты используйте зонально-избыточное хранилище (ZRS), которое реплицирует ваши диски в нескольких зонах доступности.
Для приложений, работающих на нескольких виртуальных машинах, несколько виртуальных машин имеют максимальное соглашение об уровне обслуживания доступности при распределении между несколькими зонами доступности. Для виртуальных машин и дисков, распределенных между несколькими зонами доступности, диски и их родительские виртуальные машины совместно размещаются в одной зоне, что предотвращает сбой нескольких виртуальных машин, даже если вся зона выходит из строя.
Если зоны недоступны или рабочая нагрузка учитывает задержку между виртуальными машинами, развертывайте виртуальные машины и диски в нескольких доменах сбоя. Домены сбоя не обеспечивают избыточность зоны, но они снижают влияние сбоев оборудования, сбоев сети или прерываний питания. Это предотвращает сбой нескольких виртуальных машин при сбое одного сбойного домена хранилища.
Устойчивость к временным сбоям
Временные ошибки являются короткими, периодическими сбоями в компонентах. Они часто происходят в распределенной среде, такой как облачная платформа, и являются обычной частью операций. Временные ошибки исправляют себя через короткий период времени. Важно, чтобы приложения могли обрабатывать временные ошибки, обычно повторяя затронутые запросы.
Все облачные приложения должны следовать Azure рекомендации по обработке временных ошибок при обмене данными с любыми размещенными в облаке API, базами данных и другими компонентами. Дополнительные сведения см. в Рекомендациях по обработке временных сбоев.
Управляемые диски автоматически восстанавливаются после временных сбоев в инфраструктуре Azure.
Устойчивость к сбоям зоны доступности
Зоны Availability физически разделяют группы центров обработки данных в Azure регионе. При сбое одной зоны службы могут переключиться на одну из оставшихся зон.
Существует два способа использования зон доступности с управляемыми дисками:
- Вы можете развернуть зонально-избыточный диск (ZRS), который располагается в трех зонах доступности в регионе. Для обеспечения максимальной надежности рекомендуется использовать диски ZRS, так как диски ZRS обеспечивают автоматическую устойчивость зоны.
- Вы можете развернуть зональный диск LRS, который находится только в одной зоне. При использовании зональных дисков LRS вам нужно настроить рабочую нагрузку для обеспечения устойчивости к сбоям в зонах. Вы выполняете это, развертывая несколько виртуальных машин (VM) и дисков и распределяя их между зонами доступности.
Если вы не настраиваете поддержку зоны доступности, ваш диск может быть незональным или региональным и может размещаться в любой зоне доступности в регионе. Эти диски считаются LRS, так как они реплицируются в пределах региона.
Зонально избыточные диски
Хранилище с избыточностью между зонами (ZRS) синхронно реплицирует данные в трех зонах доступности в пределах региона. При включении избыточности зоны для управляемого диска Azure гарантирует, что сбой в любой отдельной зоне не влияет на доступность данных.
Диски ZRS можно совместно использовать между виртуальными машинами , чтобы повысить доступность кластеризованных или распределенных приложений, таких как SQL FCI, SAP ASCS/SCS или GFS2. Вы можете подключить общий диск ZRS к основным и вторичным виртуальным машинам в разных зонах, используя как диски ZRS, так и виртуальные машины, распределенные по нескольким зонам доступности. Если происходит выход из строя основной зоны, вы можете быстро переключиться на вторичную виртуальную машину с помощью постоянного резервирования SCSI.
Если диск ZRS подключен как диск данных к одной виртуальной машине в зоне, которая идет вниз, можно принудительно отсоединить диск от неудачной виртуальной машины и подключить его к другой виртуальной машине.
Требования
Поддержка региона: Список регионов, поддерживающих управляемые диски ZRS, см. в разделе "Параметры избыточности" для управляемых дисков.
Типы дисков: Диски с зональной избыточностью поддерживаются с управляемыми дисками Premium SSD и Standard SSD. ZRS не поддерживается с Premium SSD v2, Ultra Disks или Standard HDD управляемыми дисками.
Cost
ZRS несет более высокую стоимость, чем LRS из-за дополнительных затрат на репликацию и инфраструктуры, необходимых для обслуживания данных в нескольких зонах. Точное различие затрат зависит от региона и типа диска. Подробные сведения о ценах см. в разделе Цены на управляемые диски Azure.
Настройка поддержки зоны доступности
Создание нового диска ZRS: Чтобы создать новый управляемый диск ZRS, см. раздел Учебник: управление дисками Azure с помощью Azure CLI для виртуальных машин Linux или Учебник: управление дисками с помощью Azure PowerShell для виртуальных машин Windows. Выберите уровень дисков ZRS во время создания диска.
Вы несете ответственность за подключение диска к виртуальным машинам, включая настройку общих дисков на нескольких виртуальных машинах в разных зонах, если это подходит для рабочей нагрузки.
Измените существующий диск, чтобы использовать ZRS: Существующий незональный (региональный) диск можно преобразовать в ZRS.
Хотя вы не можете преобразовать зональный диск LRS в ZRS, вы можете создать новый диск ZRS на основе моментального снимка. Пошаговые процедуры и требования к миграции см. в разделе "Преобразование диска из LRS в ZRS ".
Отключите поддержку зоны доступности: Невозможно изменить конфигурацию зоны доступности существующего диска ZRS. Вместо этого необходимо создать новый диск с новой конфигурацией с помощью моментального снимка из предыдущего диска и удалить старый.
Поведение, когда все зоны работоспособны
В этом разделе описывается, что ожидать, если управляемые диски настроены для использования ZRS, а все зоны доступности работают.
операция межзонная: Azure автоматически управляет маршрутизацией трафика между зонами доступности при использовании виртуальной машины с зонально-избыточным диском. Во время обычных операций запросы распределяются по зонам прозрачно.
Репликация данных между зонами: Диски ZRS реплицируют каждую синхронную запись в нескольких зонах доступности в регионе. Операция записи завершается только после хранения данных в кластерах в нескольких зонах. Этот подход обеспечивает надежную согласованность и высокий уровень доступности, но может привести к немного более высокой задержке записи по сравнению с дисками LRS.
Поведение во время сбоя зоны
В этом разделе описывается, что ожидать, когда управляемый диск настроен для использования ZRS, и возникает сбой зоны доступности.
Обнаружение и ответ: Некоторые сбои в зонах могут влиять только на диски, только виртуальные машины или оба. Наблюдаемое поведение зависит от того, влияет ли сбой зоны на виртуальную машину, подключенную к диску.
Если виртуальная машина остается работоспособной, но диск пострадал от сбоя, виртуальная машина продолжает работать. Майкрософт автоматически перенаправляет операции диска для работы с данными в исправных зонах доступности, и вам не нужно предпринимать никаких действий.
Если виртуальная машина отключена, необходимо переключить рабочую нагрузку на другую виртуальную машину в другой зоне доступности.
Общие диски: Если вы уже создали вторичную виртуальную машину в другой зоне и настроили общие диски, диск доступен для вторичной виртуальной машины, которая будет использоваться без изменений конфигурации.
Диски, которые не являются общими: Вы можете принудительно отсоединить диск от неработоспособной виртуальной машины, а затем подключить ее к виртуальной машине в работоспособной зоне. Чтобы выполнить принудительное отсоединение, выполните приведенные далее действия.
- Azure CLI: Используйте команду az vm disk detach с аргументом
--force-detach. - Azure PowerShell: Используйте командлет Remove-AzVMDataDisk с аргументом
-ForceDetach.
- Azure CLI: Используйте команду az vm disk detach с аргументом
- Notification: Майкрософт не уведомляет вас, когда зона отключена. Однако вы можете использовать Azure Работоспособность ресурсов для отслеживания работоспособности отдельного ресурса и настроить оповещения Работоспособность ресурсов для уведомления о проблемах. Вы также можете использовать Работоспособность служб Azure для понимания общего состояния службы, включая любые сбои зоны, и настроить оповещения Service Health для уведомления о проблемах.
Риск потери данных: Потеря данных не происходит во время сбоев зоны.
Ожидаемое время простоя: При совместном использовании диска между несколькими виртуальными машинами время простоя не ожидается.
Redistribution: Azure автоматически перенаправляет трафик на другую копию диска в работоспособной зоне.
Восстановление зоны
Azure автоматически обнаруживает, когда ранее неработоспособная зона становится работоспособной, и восстанавливает синхронизацию данных в восстановленной зоне.
Зональные диски LRS
Зональные диски LRS находятся в определенной зоне доступности и присоединяться только к виртуальным машинам в этой зоне. Все копии данных диска находятся в одной зоне. Один зональный диск LRS и виртуальная машина не обеспечивают устойчивость зоны. Если в зоне, содержащей диск, возникает сбой, диск может стать недоступным.
Для рабочих нагрузок с несколькими виртуальными машинами можно обеспечить устойчивость зоны, развернув несколько виртуальных машин и их зональные диски LRS в разных зонах доступности. Этот подход является наиболее распространенным способом обеспечения высокой доступности рабочих нагрузок, таких как веб-серверы, уровни приложений и кластеры баз данных. Если одна из зон выходит из строя, вы можете настроить нагрузку так, чтобы она продолжала работу, используя виртуальные машины из работоспособных зон.
Этот шаблон распределения с несколькими зонами работает со всеми типами дисков, включая диски SSD уровня "Премиум" версии 2 и "Ультра", которые поддерживают только LRS. Дополнительные сведения об этом подходе см. в разделе "Распространение виртуальных машин и дисков в зонах доступности".
Требования
Поддержка региона: Зональные управляемые диски LRS поддерживаются во всех регионах с зонами доступности.
Типы дисков: Все типы управляемых дисков поддерживают зональные развертывания LRS.
Cost
Зональные диски LRS взимаются по той же ставке, что и незональные диски. Подробные сведения о ценах см. в разделе Цены на управляемые диски Azure.
Настройка поддержки зоны доступности
Создайте новый диск с поддержкой зоны доступности: Чтобы создать новый управляемый диск с зональной отказоустойчивостью LRS, см. раздел Руководство — управление дисками Azure с помощью Azure CLI для виртуальных машин Linux или Руководство: управление дисками с помощью Azure PowerShell для виртуальных машин Windows.
Выберите зону доступности во время создания диска.
Это важно
Фиксация ресурсов в одной зоне доступности рекомендуется только в том случае, если задержка между зонами слишком велика для ваших нужд и после подтверждения, что она не соответствует вашим требованиям. По себе зональный ресурс не обеспечивает устойчивость к сбоям зоны доступности. Чтобы повысить устойчивость зонального ресурса, необходимо явно развернуть ресурсы в нескольких зонах доступности и настроить маршрутизацию трафика и аварийное переключение. Дополнительные сведения см. в разделе "Зональные ресурсы" и "Устойчивость зоны".
Измените конфигурацию зоны доступности существующего диска: Невозможно изменить конфигурацию зоны доступности существующего зонального диска LRS. Вместо этого необходимо создать новый диск с новой конфигурацией с помощью моментального снимка из предыдущего диска и удалить старый.
Поведение, когда все зоны работоспособны
В этом разделе описывается, что ожидать, если управляемый диск настроен для использования зональных LRS, а все зоны доступности работают.
Операция между зонами: Трафик между зональной виртуальной машиной и зональным диском LRS в той же зоне остается в пределах зоны доступности.
При развертывании нескольких виртуальных машин в зонах вы несете ответственность за распространение входящих запросов на виртуальных машинах. Каждая виртуальная машина считывает и записывает данные в свой зональный диск.
Репликация данных между зонами: Все операции записи на зональные диски LRS реплицируются синхронно в пределах зоны доступности.
При развертывании нескольких виртуальных машин в зонах, если для рабочей нагрузки требуется согласованность данных между виртуальными машинами, вы несете ответственность за синхронизацию данных, например с помощью репликации базы данных или репликации на уровне приложений.
Поведение во время сбоя зоны
В этом разделе описывается, чего следует ожидать, когда управляемый диск настроен для использования зональных LRS, и происходит сбой зоны доступности.
Обнаружение и ответ: Если у вас есть одна виртуальная машина с зональным диском LRS, вы несете ответственность за обнаружение сбоя зоны и активацию отработки отказа или другого ответа.
При наличии виртуальных машин, распределенных по нескольким зонам, вы несете ответственность за настройку рабочей нагрузки для обнаружения сбоя зоны и продолжения работы на виртуальных машинах в работоспособных зонах.
- Notification: Майкрософт не уведомляет вас, когда зона отключена. Однако вы можете использовать Azure Работоспособность ресурсов для отслеживания работоспособности отдельного ресурса и настроить оповещения Работоспособность ресурсов для уведомления о проблемах. Вы также можете использовать Работоспособность служб Azure для понимания общего состояния службы, включая любые сбои зоны, и настроить оповещения Service Health для уведомления о проблемах.
Ожидаемая потеря данных: Репликация LRS обеспечивает по крайней мере 99.99999999% (11 9) устойчивости, что означает, что диск сохраняет свои данные и данные можно восстановить после восстановления зоны.
При наличии виртуальных машин, распределенных по зонам, все данные, которые находились только на дисках в зоне сбоя, временно недоступны. Если приложение синхронизирует данные между виртуальными машинами, виртуальные машины в работоспособных зонах продолжают обслуживать запросы с помощью собственных данных.
Ожидаемое время простоя: Один зональный диск LRS недоступен до восстановления зоны доступности.
При наличии виртуальных машин и дисков, распределенных по зонам, рабочая нагрузка может продолжать работать на виртуальных машинах в работоспособных зонах.
Перераспределение: Если у вас есть одна виртуальная машина с зональным диском LRS, вы несете ответственность за перенаправку трафика на другую виртуальную машину, если у вас есть один доступный.
При наличии виртуальных машин, распределенных по зонам, можно настроить рабочую нагрузку для автоматического распространения трафика на виртуальные машины в здоровых зонах.
Восстановление зоны
Когда не удалось восстановить зону доступности, управляемые диски восстанавливаются автоматически. Если виртуальная машина, подключенная к диску, пострадала от сбоя, она перезагрузится. Вы несете ответственность за повторное синхронизацию данных приложения с другими виртуальными машинами и дисками в других зонах доступности, если они используются.
Тестирование на сбои в зоне
Вы не можете напрямую имитировать сбои зоны на уровне диска, но вы можете использовать поддержку Azure Chaos Studio для симуляции отключения зон в масштабируемых наборах виртуальных машин и симуляции потери отдельной виртуальной машины.
Вы должны протестировать устойчивость приложения к сбоям зоны и поведению управляемого диска во время сбоев. Отслеживайте производительность диска во время имитированного сбоя зоны и убедитесь, что приложения соответствующим образом обрабатывают повышенную задержку. Реализуйте сценарии автоматического тестирования, которые проверяют, что приложения могут обрабатывать временные задержки ввода-вывода и принудительное отсоединение общих дисков.
Устойчивость к сбоям на уровне региона
Хранилище дисков Azure — это служба с одним регионом, которая работает в пределах определенного Azure региона. Служба не предоставляет встроенной поддержки мульти-региональных возможностей или автоматического переключения при отказе между регионами. Если регион становится недоступным, ресурсы управляемого диска в этом регионе также недоступны.
Индивидуальные решения для нескольких регионов для повышения устойчивости
Вы можете создать решение с несколькими регионами, развернув виртуальные машины и диски в каждом регионе, обеспечив репликацию или резервное копирование данных между регионами, а также выполните переключение на резервный канал или восстановление из резервных копий при необходимости. Вы несете ответственность за управление ресурсами в каждом регионе, координацию и синхронизацию данных, а также обеспечение отказоустойчивости или восстановление. Ниже приведены некоторые распространенные подходы.
- Azure Site Recovery, который обеспечивает репликацию виртуальных машин и дисков между регионами.
- Azure Backup предоставляет управляемые службы резервного копирования, включая диски. Вы можете использовать функцию восстановления между регионами, чтобы восстановить виртуальные машины в другом регионе.
- Вы можете создать собственное решение на основе моментальных снимков, скопировав моментальные снимки дисков в разных регионах.
- Некоторые базы данных и приложения предоставляют подходы к репликации, которые работают в разных регионах, реплицируя изменения и управляя кластерами. Например, группы доступности SQL Server Always On обеспечивают защиту данных с учетом приложений между регионами с настраиваемым поведением согласованности и при отказе.
Резервное копирование и восстановление
Azure управляемые диски поддерживают несколько подходов к резервному копированию для защиты от потери данных и повреждения. Резервное копирование дисков Azure — это встроенное облачное решение, которое автоматизирует управление жизненным циклом моментальных снимков. Она обеспечивает отказоустойчивое и добавочное резервное копирование с настраиваемыми политиками хранения. Этот подход без агента поддерживает несколько резервных копий в день без влияния на производительность приложений и интегрируется с Центром Azure Backup для централизованного управления. Добавочные моментальные снимки можно использовать для снижения затрат на хранение и времени резервного копирования.
Для защиты на уровне VM Azure Backup предлагает согласованные с приложениями резервные копии для всей виртуальной машины, включая все подключенные диски. Этот подход идеально подходит, если требуется координированное резервное копирование нескольких дисков или резервных копий с поддержкой приложений. Для рабочих нагрузок базы данных рассмотрите решения резервного копирования, относящиеся к приложению, которые обеспечивают согласованную с транзакцией защиту и более быстрые варианты восстановления.
Для критически важных рабочих нагрузок реализуйте стратегию многоуровневого резервного копирования, объединяющую Azure Disk Backup, репликацию снимков между регионами и резервные копии на уровне приложения для обеспечения согласованности транзакций. Настройте политики резервного копирования на основе требований восстановления, требований соответствия требованиям и затрат.
Соглашение об уровне обслуживания
Соглашение об уровне обслуживания (SLA) для служб Azure описывает ожидаемую доступность каждой службы и условия, которые должно соответствовать вашему решению для достижения этого ожидания доступности. Дополнительные сведения см. в разделе SLA для онлайн-услуг.
Хранилище дисков Azure не предоставляет собственное соглашение об уровне обслуживания, но вместо этого включается в соглашение об уровне обслуживания для виртуальных машин. Конфигурация диска может повлиять на соглашение об уровне обслуживания виртуальной машины.
Связанный контент
- Типы управляемых дисков Azure
- Резервное копирование и аварийное восстановление для управляемых дисков Azure
- Лучшие практики для обеспечения высокой доступности с помощью виртуальных машин Azure и управляемых дисков
- Параметры избыточности для управляемых дисков
- Надежность Azure