Mantenimiento de máquinas virtuales en Azure

Se aplica a: ✔️ Máquinas virtuales Linux ✔️ Máquinas virtuales Windows ✔️ Conjuntos de escalado flexibles ✔️ Conjuntos de escalado uniformes

Azure actualiza periódicamente su plataforma para mejorar la confiabilidad, el rendimiento y la seguridad de la infraestructura de host para las máquinas virtuales. El objetivo de estas actualizaciones va desde la aplicación de revisiones a componentes de software en el entorno de hospedaje hasta la actualización de los componentes de red o la retirada de hardware.

Las actualizaciones raramente afectan a las máquinas virtuales hospedadas. Cuando las actualizaciones tienen algún efecto, Azure elige el método menos agresivo en las actualizaciones:

  • Si la actualización no requiere reiniciar, la máquina virtual se pausa mientras se actualiza el host o la máquina virtual se migra en vivo a un host ya actualizado.
  • Si el mantenimiento requiere reiniciar, se le notificará del mantenimiento planificado. Asimismo, Azure proporciona un período de tiempo en el que puede iniciar el mantenimiento a la hora que le sea más conveniente. El período de mantenimiento de autoservicio es normalmente de 35 días (para máquinas host), a menos que el mantenimiento sea urgente. Azure está invirtiendo en tecnologías para reducir los casos en los que el mantenimiento planificado de la plataforma requiere el reinicio de la máquina virtual. Para obtener instrucciones sobre la administración del mantenimiento planeado, vea Control de las notificaciones de mantenimiento planeado mediante la CLI de Azure, PowerShell o el portal.

En esta página se describe cómo Azure realiza ambos tipos de mantenimiento. Para más información sobre eventos no planeados (interrupciones), consulte el artículo sobre la administración de la disponibilidad de máquinas virtuales para Windows o el artículo correspondiente para Linux.

Dentro de una máquina virtual, puede obtener una notificación sobre el próximo mantenimiento si usa Scheduled Events para Windows o para Linux.

Mantenimiento que no requiere un reinicio

La mayoría de las actualizaciones de plataforma no afectan a las máquinas virtuales del cliente. Cuando no es posible realizar una actualización sin causar impacto, Azure elige el mecanismo de actualización con menor impacto en las máquinas virtuales del cliente.

Cuando la máquina virtual afecta al mantenimiento, casi siempre se completará a través de una pausa de máquina virtual durante menos de 10 segundos. En raras circunstancias, no más de una vez cada 18 meses para tamaños de máquina virtual de uso general, Azure usa un mecanismo que pausará la máquina virtual durante unos 30 segundos. Después de cualquier operación de pausa, el reloj de la máquina virtual se sincroniza automáticamente tras la reanudación.

El mantenimiento de conservación de memoria funciona para más del 90 por ciento de las máquinas virtuales de Azure. No funciona para las series H, M, N y G. Azure usa cada vez más las tecnologías de migración en vivo y mejora el mecanismo de mantenimiento que conserva la memoria para así reducir la duración de la pausa.

Estas operaciones de mantenimiento que no requieren un reinicio se aplican por dominio de error cada vez. También se detienen si reciben señales de estado de advertencia de las herramientas de supervisión de la plataforma. Las operaciones de mantenimiento que no requieren un reinicio pueden producirse simultáneamente en regiones emparejadas o Availability Zones. Para un cambio determinado, la implementación se secuenciará principalmente en Availability Zones y en los pares de regiones, pero puede haber superposición en la cola.

Estos tipos de actualizaciones pueden afectar a algunas aplicaciones. Cuando la máquina virtual se migra en vivo a otro host, es posible que algunas cargas de trabajo sensibles sufran una pequeña degradación del rendimiento en los pocos minutos anteriores a la pausa de la máquina virtual. Para preparar el mantenimiento de la máquina virtual y reducir el impacto durante el mantenimiento de Azure, intente usar Scheduled Events para Windows o Linux para estas aplicaciones.

Para un mayor control sobre todas las actividades de mantenimiento, incluidas las actualizaciones sin impacto y sin reinicio, puede crear una característica de configuración de mantenimiento. La creación de una configuración de mantenimiento ofrece la opción de omitir todas las actualizaciones de la plataforma y aplicarlas a la hora que elija. Para obtener más información, consulte Administración de las actualizaciones de la plataforma con configuraciones de mantenimiento.

Migración en vivo

La migración en vivo es una operación que no requiere un reinicio y que conserva la memoria para la máquina virtual. Provoca una pausa o inmovilización, y normalmente no dura más de 5 segundos. Excepto para las series G, L, N y H, todas las máquinas virtuales de infraestructura como servicio (IaaS) son aptas para la migración en vivo. Live Migration está disponible en la mayoría de las SKU de la serie M. Las máquinas virtuales aptas representan más del 90 por ciento de las máquinas virtuales IaaS que se implementan en la flota de Azure.

Nota

No recibirá una notificación en Azure Portal para las operaciones de migración en vivo que no requieren un reinicio. Para ver una lista de migraciones en vivo que no requieren un reinicio, consulte los eventos programados.

La plataforma Azure inicia la migración en vivo en los escenarios siguientes:

  • Mantenimiento planeado
  • Error de hardware
  • Optimizaciones de asignación

Algunos escenarios de mantenimiento planeado usan la migración en vivo, y se puede usar Scheduled Events para saber de antemano cuando se iniciarán las operaciones de migración en vivo.

La migración en vivo también se puede usar para mover máquinas virtuales cuando los algoritmos de Azure Machine Learning predicen un error inminente de hardware o cuando se quieran optimizar las asignaciones de máquina virtual. Para obtener más información sobre el modelado predictivo que detecta las instancias de hardware degradado, vea Improving Azure VM resiliency with predictive machine learning and live migration (Mejora de la resistencia de las máquinas virtuales de Azure con la migración en vivo y el aprendizaje automático predictivo). Las notificaciones de migración en vivo aparecen en los registros de Monitor y Service Health de Azure Portal, así como en Scheduled Events si utiliza estos servicios.

Mantenimiento que requiere un reinicio

En el raro caso en que las máquinas virtuales deban reiniciarse para realizar el mantenimiento planeado, recibirá una notificación de antemano. El mantenimiento planeado tiene dos fases: la fase de autoservicio y una fase de mantenimiento programado.

Durante la fase de autoservicio, que normalmente tarda cuatro semanas, se inicia el mantenimiento en las máquinas virtuales. Como parte del autoservicio, puede consultar cada máquina virtual para ver su estado y el resultado de la última solicitud de mantenimiento.

Nota

En el caso de las series de máquinas virtuales que no admiten Migración en vivo, los datos de discos locales (efímeros) se pueden perder durante los eventos de mantenimiento. Consulte cada serie de máquinas virtuales individuales para obtener información sobre si se admite Migración en vivo.

Cuando inicia el mantenimiento de autoservicio, su máquina virtual se vuelve a implementar en un nodo ya actualizado. Como la máquina virtual se vuelve a implementar, se pierde el disco temporal y se actualizan las direcciones IP dinámicas públicas asociadas con la interfaz de red virtual.

Si surge un error durante el mantenimiento de autoservicio, la operación se detiene, la máquina virtual no se actualiza y se le ofrece la posibilidad de reintentar el mantenimiento de autoservicio.

Cuando finaliza la fase de autoservicio, comienza la fase de mantenimiento programado. Durante esta fase, puede seguir realizando consultas dentro de la fase de mantenimiento, pero no podrá iniciar el mantenimiento usted mismo.

Para obtener más información sobre la administración del mantenimiento que requiere un reinicio, consulte Control de las notificaciones de mantenimiento planeado mediante la CLI de Azure, PowerShell o el portal.

Consideraciones sobre disponibilidad durante el mantenimiento programado

Si decide esperar a la fase de mantenimiento programado, hay algunas cosas que debe tener en cuenta para mantener la máxima disponibilidad de las máquinas virtuales.

Regiones emparejadas

Cada región de Azure se empareja con otra región de la misma proximidad geográfica. Juntas, forman un par de regiones. Durante la fase de mantenimiento programado, Azure solo actualiza las máquinas virtuales en una sola región perteneciente a un par de regiones. Por ejemplo, al actualizar las máquinas virtuales de la zona Centro-norte de EE. UU., Azure no actualizará las máquinas virtuales de Centro-sur de EE. UU. al mismo tiempo. Sin embargo, otras regiones como Norte de Europa pueden estar en mantenimiento al mismo tiempo que el Este de EE. UU. Comprender cómo funcionan los pares de regiones puede ayudar a distribuir mejor las máquinas virtuales entre regiones. Para más información, consulte Regiones de Azure.

Zonas de disponibilidad

Las zonas de disponibilidad son ubicaciones físicas exclusivas dentro de una región de Azure. Cada zona de disponibilidad consta de uno o varios centros de datos equipados con alimentación, refrigeración y redes independientes. Para garantizar la resistencia, hay tres zonas independientes como mínimo en todas las regiones habilitadas.

Una zona de disponibilidad es una combinación de un dominio de error y un dominio de actualización. Si crea tres o más máquinas virtuales en tres zonas de una región de Azure, las máquinas virtuales se distribuyen eficazmente en tres dominios de error y tres dominios de actualización. La plataforma Azure reconoce esta distribución entre dominios de actualización para asegurarse de que las máquinas virtuales de distintas zonas no se actualizan al mismo tiempo.

Cada actualización de infraestructura implementa la zona por zona, dentro de una única región. Sin embargo, puede hacer que la implementación continúe en la zona 1 y una implementación distinta lo haga en la zona 2, al mismo tiempo. No todas las implementaciones se serializan. Sin embargo, una sola implementación que requiere un reinicio únicamente implementa una zona cada vez para reducir el riesgo. En general, las actualizaciones que requieren un reinicio se evitan en la medida de lo posible y Azure intenta usar Migración en vivo o proporciona control a los clientes.

Conjuntos de escalado de máquinas virtuales

Los conjuntos de escalado de máquinas virtuales en el modo de orquestación flexible constituyen un recurso de proceso de Azure que le permite combinar la escalabilidad de los conjuntos de escalado de máquinas virtuales del modo de orquestación uniforme con las garantías de disponibilidad regionales de los conjuntos de disponibilidad.

Con la orquestación flexible, puede elegir si las instancias se distribuyen entre varias zonas o entre dominios de error dentro de una sola región.

Conjuntos de disponibilidad y conjuntos de escalado uniformes

Al implementar una carga de trabajo en máquinas virtuales de Azure, puede crear las máquinas virtuales dentro de un conjunto de disponibilidad para proporcionar alta disponibilidad a la aplicación. Mediante los conjuntos de disponibilidad, puede asegurarse de que durante una interrupción o en los eventos de mantenimiento que requieren un reinicio, al menos una máquina virtual estará disponible.

En un conjunto de disponibilidad, las máquinas virtuales individuales se reparten entre un máximo de 20 dominios de actualización. Durante el mantenimiento planeado, solo un dominio de actualización se ve actualizado en un momento determinado. Los dominios de actualización no necesariamente se actualizan de forma secuencial.

Los conjuntos de escalado de máquinas virtuales en el modo de orquestación uniforme constituyen un recurso de proceso de Azure que se puede usar para implementar y administrar un conjunto de máquinas virtuales idénticas como un recurso único. El conjunto de escalado se implementa automáticamente entre dominios de actualización, como las máquinas virtuales de un conjunto de disponibilidad. Igual que sucede con los conjuntos de disponibilidad, cuando se usan conjuntos de escalado uniformes, solo un dominio de actualización se actualiza en un momento determinado durante el mantenimiento programado.

Para más información sobre la configuración de máquinas virtuales para alta disponibilidad, consulte el artículo sobre la administración de la disponibilidad de las máquinas virtuales para Windows o el artículo correspondiente para Linux.

Pasos siguientes

Puede usar la CLI de Azure, Azure PowerShell o el portal para administrar el mantenimiento planeado.