Работа с повреждением данных в Microsoft 365

Одним из сложных аспектов работы крупномасштабной облачной службы является обработка повреждения данных с учетом большого объема данных и независимых систем. Повреждение данных может быть вызвано следующими причинами:

  • Ошибки приложения или инфраструктуры, повредив некоторые или все состояния приложения
  • Проблемы с оборудованием, которые приводят к потере данных или невозможности чтения данных
  • Рабочие ошибки человека
  • Вредоносные хакеры и недовольные сотрудники
  • Инциденты во внешних службах, которые приводят к потере данных

Так как более высокая устойчивость в целостности данных означает меньше инцидентов повреждения данных, корпорация Майкрософт встроена в механизмы защиты Microsoft 365, чтобы предотвратить повреждение, а также системы и процессы, которые позволяют нам восстанавливать данные, если это происходит. Проверки и процессы существуют на различных этапах процесса технического выпуска для повышения устойчивости к повреждению данных, в том числе:

  • Проектирование системы
  • Организация и структура кода
  • Проверка кода
  • Модульные тесты, интеграционные тесты и системные тесты
  • Тесты проводов и шлюзы

В рабочих средах Microsoft 365 одноранговая репликация между центрами обработки данных гарантирует наличие нескольких динамических копий любых данных. Стандартные образы и скрипты используются для восстановления потерянных серверов, а реплицированные данные — для восстановления данных клиентов. В Exchange Online каждый почтовый ящик размещается в группах доступности баз данных (DAG) и реплицируется в географически отдельные центры обработки данных в одном регионе. Каждая база данных почтовых ящиков имеет четыре копии, распределенные между центрами обработки данных в DAG: одна активная копия, две последние копии и одна 7-дневная копия с отстающей копией, используемая в редких случаях катастрофического логического повреждения. В SharePoint и OneDrive файлы записываются одновременно в основной и дополнительный регион центра обработки данных. Несколько типов контрольных сумм хранятся в метаданных в отдельном расположении, чем соответствующие файлы, и используются для обеспечения целостности данных на всех этапах жизненного цикла данных.

Благодаря встроенным проверкам устойчивости данных и процессам, корпорация Майкрософт поддерживает резервные копии только документации по информационной системе Microsoft 365 (включая документацию по безопасности), используя встроенную репликацию в SharePoint Online и наше внутреннее средство репозитория кода, Хранилище источников. Документация по системе хранится в SharePoint Online, а исходное хранилище содержит образы систем и приложений. SharePoint Online и Source Depot используют управление версиями и реплицируются практически в режиме реального времени.

Ресурсы