Administración de la disponibilidad de las máquinas virtuales de Azure

Completado

A menudo, el éxito de una empresa de servicios está directamente relacionado con los acuerdos de nivel de servicio (SLA) que tiene con sus clientes. Los clientes esperan que los servicios que proporciona siempre estén disponibles y que sus datos se mantengan a salvo. Esta seguridad es algo que Microsoft se toma muy en serio. Azure proporciona herramientas que puede usar para administrar la disponibilidad, la seguridad de los datos y la supervisión, por lo que sabe que los servicios están siempre disponibles para los clientes.

La administración de una máquina virtual de Azure no se limita a administrar el sistema operativo o el software que se ejecuta en la máquina virtual. Resulta útil saber qué servicios proporciona Azure para garantizar la disponibilidad del servicio y admitir la automatización. Estos servicios le ayudan a planear la continuidad empresarial y la estrategia de recuperación ante desastres de su organización.

Aquí, se describe un servicio de Azure que le ayuda a mejorar la disponibilidad de las máquinas virtuales, optimizar las tareas de administración de estas y mantener a salvo copias de seguridad de los datos de las máquinas virtuales. Vamos a empezar por definir disponibilidad.

¿Qué es la disponibilidad?

Disponibilidad es el porcentaje de tiempo que un servicio está disponible para su uso.

Supongamos que tiene un sitio web y quiere que los clientes puedan acceder siempre a la información. Su expectativa es conseguir el 100 % de disponibilidad en relación con el acceso al sitio web.

¿Por qué es necesario pensar sobre la disponibilidad cuando se usa Azure?

Las máquinas virtuales de Azure se ejecutan en servidores físicos hospedados en el centro de datos de Azure. Al igual que con la mayoría de los dispositivos físicos, es probable que se pueda producir un error. Si se produce un error en el servidor físico, también se produce un error en las máquinas virtuales hospedadas en ese servidor. Si se produce un error, Azure mueve automáticamente la máquina virtual a un servidor host correcto. Pero esa migración de reparación puede tardar varios minutos en completarse, período durante el cual las aplicaciones hospedadas en esa máquina virtual no están disponibles.

Las actualizaciones periódicas iniciadas automáticamente por Azure también pueden afectar a las máquinas virtuales. Estos eventos de mantenimiento van desde actualizaciones de software a actualizaciones de hardware y son necesarios para mejorar la confiabilidad y el rendimiento de la plataforma. Normalmente, estos eventos se realizan sin afectar a las máquinas virtuales invitadas, pero, a veces, estas se reinician para completar una actualización.

Zonas de disponibilidad

Las zonas de disponibilidad expanden el nivel de control que tiene para mantener la disponibilidad de las aplicaciones y los datos en las máquinas virtuales. Una zona de disponibilidad es una zona separada físicamente dentro de una región de Azure. Hay tres zonas de disponibilidad por cada región de Azure admitida.

Cada zona de disponibilidad tiene una fuente de alimentación, una red y un sistema de refrigeración distintos. Si diseña las soluciones para que usen máquinas virtuales replicadas en zonas, puede proteger sus datos y aplicaciones frente a la pérdida de un centro de datos. Aunque una zona esté en peligro, las aplicaciones y los datos replicados estarán disponibles instantáneamente en otra zona.

Conjuntos de escalado de máquinas virtuales

Los conjuntos de escalado de máquinas virtuales de Azure permiten crear y administrar un grupo de máquinas virtuales con equilibrio de carga. El número de instancias de máquina virtual puede aumentar o disminuir automáticamente según la demanda, o de acuerdo a una programación definida. Los conjuntos de escalado proporcionan una alta disponibilidad a las aplicaciones y le permiten administrar, configurar y actualizar de forma centralizada muchas máquinas virtuales. No hay ningún costo asociado con el conjunto de escalado propiamente dicho, solo se paga por cada instancia de máquina virtual que cree.

Las máquinas virtuales de un conjunto de escalado también se pueden implementar en varias zonas de disponibilidad, en una sola o en regiones. Las opciones de implementación de zona de disponibilidad pueden diferir según el modo de orquestación.

Equilibrador de carga

Combine Azure Load Balancer con un conjunto o zona de disponibilidad para aprovechar al máximo la resistencia de la aplicación. El equilibrador de carga de Azure distribuye el tráfico entre varias máquinas virtuales. El equilibrador de carga de Azure está incluido en nuestras máquinas virtuales de niveles estándar. No todos los niveles de las máquinas virtuales incluyen Azure Load Balancer. Para obtener más información sobre el equilibrio de carga en máquinas virtuales, consulte Equilibrio de carga de máquinas virtuales para Linux o Windows.

Redundancia de Azure Storage

Azure Storage siempre almacena varias copias de los datos, con el fin de protegerlos de eventos planeados y no planeados, como errores transitorios del hardware, interrupciones del suministro eléctrico o cortes de la red, y desastres naturales masivos. La redundancia garantiza que la cuenta de almacenamiento cumple sus objetivos de disponibilidad y durabilidad, aunque se produzcan errores.

A la hora de decidir qué opción de redundancia es la más adecuada para su escenario, intente buscar un equilibrio entre bajo costo y alta disponibilidad. Entre los factores que ayudan a determinar qué opción de redundancia debe elegir se incluye:

  • Cómo se replican los datos en la región primaria.
  • Si los datos se replicarán en una segunda ubicación que está alejada geográficamente de la región primaria, para protegerse frente a desastres regionales.
  • Si la aplicación necesita acceso de lectura a los datos replicados en la región secundaria en caso de que la región primaria deje de estar disponible por cualquier motivo.

Para más información, vea Redundancia de Azure Storage.

Conmutación por error entre ubicaciones

También puede replicar su infraestructura en varios sitios para controlar la conmutación por error regional. Azure Site Recovery replica las cargas de trabajo de un sitio principal en una ubicación secundaria. Si se produce una interrupción en el sitio principal, puede conmutar por error a una ubicación secundaria. Esta conmutación por error permite a los usuarios seguir accediendo a las aplicaciones sin interrupción. Después, puede realizar una conmutación por recuperación al sitio principal una vez que esté de nuevo en ejecución. Azure Site Recovery se usa en la replicación de máquinas físicas o virtuales. Mantiene las cargas de trabajo disponibles en caso de una interrupción del servicio.

Aunque hay muchas características técnicas que resultan atractivas en Site Recovery, hay al menos dos ventajas empresariales significativas:

  • Site Recovery permite el uso de Azure como destino de la recuperación, lo que elimina el costo y la complejidad de mantener un centro de datos físico secundario.

  • Site Recovery hace que resulte extremadamente sencillo probar las conmutaciones por error para maniobras de recuperación sin afectar a los entornos de producción. Esta característica hace que sea fácil probar las conmutaciones por error, sean planeadas o no. Después de todo, no tendrá un plan de recuperación ante desastres conveniente si nunca ha intentado realizar una conmutación por error.

Los planes de recuperación que se crean con Site Recovery pueden ser sencillos o complejos, según lo requiera su escenario. Pueden incluir scripts de PowerShell personalizados, runbooks de Azure Automation o pasos de intervención manual. Puede usar los planes de recuperación para replicar cargas de trabajo en Azure, habilitar fácilmente nuevas oportunidades para la migración, ráfagas de actividad temporales durante los períodos de pico de trabajo o el desarrollo y prueba de nuevas aplicaciones.

Azure Site Recovery funciona con recursos de Azure o Hyper-V, VMware y servidores físicos de su infraestructura local. Puede constituir una parte fundamental de la estrategia de continuidad empresarial y recuperación ante desastres de su organización mediante la orquestación de la replicación, conmutación por error y recuperación de las cargas de trabajo y aplicaciones si se produce un error en la ubicación principal.