Resistencia de datos en Microsoft 365

Dada la naturaleza compleja de la informática en la nube, Microsoft es consciente de que no es un caso de si las cosas van a salir mal, sino más bien cuándo. Diseñamos nuestros servicios en la nube para maximizar la confiabilidad y minimizar los efectos negativos en los clientes cuando las cosas van mal. Hemos ido más allá de la estrategia tradicional de confiar en una infraestructura física compleja y hemos creado redundancia directamente en nuestros servicios en la nube. Usamos una combinación de infraestructura física menos compleja y software más inteligente que crea resistencia de datos en nuestros servicios y ofrece alta disponibilidad a nuestros clientes.

La resistencia y la capacidad de recuperación están integradas

La creación de resistencia y recuperación comienza con la suposición de que la infraestructura y los procesos subyacentes producirán errores en algún momento: se producirá un error en el hardware (infraestructura), los seres humanos cometen errores y el software tendrá errores. Aunque no sería correcto decir que los desarrolladores de software no estaban pensando en estas cosas antes de la nube, la forma en que estos problemas se trataron en una implementación de TI típica era diferente antes de la nube:

  • En primer lugar, las protecciones de hardware e infraestructura eran significativas. Esta estructura significaba que los centros de datos con confiabilidad del 99,99 % requerían una redundancia significativa de red y energía, y los servidores se implementaron con clústeres basados en hardware, fuentes de alimentación duales, interfaces de red duales y similares.
  • En segundo lugar, el proceso era fundamental. Los equipos de operaciones mantenían procedimientos rigurosos, se empleaban ventanas de cambio y, a menudo, había una sobrecarga significativa en la administración de proyectos.
  • En tercer lugar, la implementación tuvo lugar a un ritmo glacial. La implementación de código sin poseer el origen significaba esperar las versiones de revisión, y las versiones principales implicaban el reemplazo de hardware y un importante desembolso de capital. Además, la única manera de corregir un problema era revertir. Por lo tanto, la mayoría de las organizaciones de TI implementarían solo las versiones principales para evitar que el trabajo se mantenga actualizado.
  • Por último, la escala de los sistemas implementados y el nivel de su interconexión era históricamente mucho menor que ahora.

En la actualidad, los clientes esperan una innovación continua de Microsoft sin poner en peligro la calidad, y esta es una de las razones por las que los servicios y el software de Microsoft se crean teniendo en cuenta la resistencia y la capacidad de recuperación.

Principios de resistencia de datos de Microsoft 365

La resistencia hace referencia a la capacidad de un servicio basado en la nube para soportar ciertos tipos de errores y, sin embargo, seguir siendo totalmente funcional desde la perspectiva de los clientes. La resistencia de los datos significa que, independientemente de los errores que se produzcan en Microsoft 365, los datos críticos del cliente permanecen intactos y no se ven afectados. Para ello, los servicios de Microsoft 365 se han diseñado en torno a cinco principios de resistencia específicos:

  • Hay datos críticos y no críticos. Los datos no críticos (por ejemplo, si se leyó un mensaje) se pueden quitar en escenarios de error poco frecuentes. Los datos críticos (por ejemplo, los datos del cliente, como los mensajes de correo electrónico) deben protegerse a un costo extremo. Como objetivo de diseño, los mensajes de correo entregados siempre son críticos y aspectos como si se ha leído un mensaje no es crítico.
  • Las copias de los datos del cliente deben separarse en diferentes zonas de error o tantos dominios de error como sea posible (por ejemplo, centros de datos, accesibles mediante credenciales únicas (proceso, servidor o operador)) para proporcionar aislamiento de errores.
  • Los datos críticos del cliente deben supervisarse para detectar errores en cualquier parte de Atomicidad, Coherencia, Aislamiento, Durabilidad (ACID).
  • Los datos del cliente deben estar protegidos contra daños. Debe examinarse o supervisarse activamente, repararse y recuperarse.
  • La mayoría de los resultados de pérdida de datos de las acciones del cliente, por lo que permiten a los clientes recuperarse por sí mismos mediante una GUI que les permite restaurar elementos eliminados accidentalmente.

Mediante la creación de nuestros servicios en la nube a estos principios, junto con pruebas y validación sólidas, Microsoft 365 es capaz de cumplir y superar los requisitos de los clientes, a la vez que garantiza una plataforma para la innovación y la mejora continuas.