Compartir a través de


Confiabilidad en Community Training

Community Training es una solución basada en la nube con tecnología de Azure que puede ofrecer programas de entrenamiento a gran escala y de gran difusión con alta calidad y eficiencia. Con Community Training, las organizaciones de todos los tamaños y tipos pueden ejecutar programas de entrenamiento a gran escala para sus comunidades internas y externas. Las comunidades pueden incluir trabajadores de primera línea, trabajadores extendidos, un ecosistema asociado, una red de voluntarios y beneficiarios del programa.

En este artículo se describe la compatibilidad con la confiabilidad de Community Training y trata la resistencia regional con zonas de disponibilidad y recuperación ante desastres y continuidad empresarial. Para obtener información general más detallada sobre un principio de confiabilidad en Azure, consulte Confiabilidad de Azure.

Compatibilidad de zonas de disponibilidad

Las zonas de disponibilidad de Azure son al menos tres grupos de centros de datos físicamente independientes dentro de cada región de Azure. Los centros de datos de cada zona están equipados con infraestructura de alimentación, refrigeración y red independientes. En el caso de un error en la zona local, las zonas de disponibilidad están diseñadas de manera que, si se ve afectada una zona, los servicios, la capacidad y la alta disponibilidad regionales serán proporcionadas por las dos zonas restantes.

Estos errores pueden abarcar desde errores de software y hardware hasta eventos como terremotos, inundaciones e incendios. La tolerancia a los errores se logra con la redundancia y el aislamiento lógico de los servicios de Azure. Para más información sobre las zonas de disponibilidad en Azure, consulte Regiones y zonas de disponibilidad.

Los servicios habilitados para zonas de disponibilidad de Azure están diseñados para proporcionar el nivel adecuado de confiabilidad y flexibilidad. Se pueden configurar de dos maneras. Pueden tener redundancia de zona, con una replicación automática entre zonas o ser zonales, con instancias ancladas a una zona específica. También puede combinar ambos enfoques. Para más información sobre la arquitectura zonal frente a la arquitectura con redundancia de zona, consulte Recomendaciones para el uso de zonas de disponibilidad y regiones.

Community Training usa las zonas de disponibilidad de Azure para proporcionar alta disponibilidad y tolerancia a errores en una región de Azure. Community Training ofrece compatibilidad con la zona de disponibilidad del plano de datos y el control:

  • El plano de control tiene redundancia de zona en las regiones primarias de disponibilidad.

  • El plano de datos puede ser zonal o con redundancia de zona, en función de lo que elija para sus necesidades. Sin embargo, se recomienda encarecidamente elegir una implementación con redundancia de zona para evitar la pérdida de datos y mantener la disponibilidad del servicio durante una interrupción de zona.

Requisitos previos

  • Las zonas de disponibilidad son compatibles con las siguientes SKU de aprendizaje de la comunidad:

    • Estándar (menor escala de usuarios)
    • Premium (gran escala de usuarios)
  • Community Trainning solo es compatible en regiones emparejadas. Cada región secundaria se implementa con una configuración zonal. La siguiente tabla muestra todas las regiones que admiten zonas de disponibilidad para Community Training, junto con su región emparejada.

Región principal Región emparejada
UKSouth UKWest
AustraliaEast Sudeste de Australia
EastUS WestUS
EastUS2 CentralUS
Norte de Europa Oeste de Europa
WestUS3 EastUS
SwedenCentral SwedenSouth

Compatibilidad con la conmutación por error zonal

Community Training usa muchos servicios de Azure de dependencia, como App Service y Azure SQL. Al elegir una implementación con redundancia de zona, Community Training también crea ofertas con redundancia zonal de esos recursos de servicio de Azure subyacentes. Si se produce un error en una zona, todos los recursos, incluidos los recursos de dependencia, conmutan por error a una de las zonas correctas.

Creación de un recurso con la zona de disponibilidad habilitada

Community Training proporciona configuración para zonas de disponibilidad solo en el momento de la creación de la instancia. Si desea cambiar la configuración de la zona de disponibilidad después de la creación de la instancia, deberá crear una nueva instancia. Para obtener información sobre cómo crear la instancia de Community Training, consulte Crear Community Training.

Experiencia a nivel de zona

  • Zonales. Durante una interrupción del servicio en toda la zona, Community Training puede sufrir una interrupción total o parcial del servicio. El grado de disponibilidad depende de varios factores, como si todo el centro de datos está inactivo o si un servicio de dependencia específico ya no está disponible en esa zona.

  • Redundancia de zona. Durante una interrupción en toda la zona, no debería experimentar ningún impacto en los recursos aprovisionados. Sin embargo, debe estar preparado para una breve interrupción en la comunicación con esos recursos. En una situación de bajada de zona, los clientes suelen recibir códigos de error 409, así como los intentos de lógica de reintento para volver a establecer conexiones a intervalos adecuados. Las nuevas solicitudes se dirigen a nodos correctos con un impacto cero en el usuario. Durante las interrupciones de toda la zona, los usuarios pueden crear nuevos recursos y escalar correctamente los existentes.

Recuperación ante desastres y continuidad empresarial

La recuperación ante desastres (DR) consiste en recuperarse de eventos de alto impacto, como desastres naturales o implementaciones con errores, lo que produce tiempo de inactividad y pérdida de datos. Independientemente de la causa, el mejor remedio para un desastre es un plan de recuperación ante desastres bien definido y probado y un diseño de aplicaciones que apoye activamente la recuperación ante desastres. Antes de empezar a pensar en la creación del plan de recuperación ante desastres, vea Recomendaciones para diseñar una estrategia de recuperación ante desastres.

En lo que respecta a la recuperación ante desastres, Microsoft usa el modelo de responsabilidad compartida. En un modelo de responsabilidad compartida, Microsoft garantiza que la infraestructura de línea base y los servicios de plataforma estén disponibles. Al mismo tiempo, muchos servicios de Azure no replican automáticamente datos ni se revierten desde una región con errores para realizar la replicación cruzada en otra región habilitada. Para esos servicios, usted es el responsable de configurar un plan de recuperación ante desastres que funcione para la carga de trabajo. La mayoría de los servicios que se ejecutan en ofertas de plataforma como servicio (PaaS) de Azure proporcionan características e instrucciones para admitir la recuperación ante desastres y puede usar características específicas del servicio para admitir la recuperación rápida para ayudar a desarrollar el plan de recuperación ante desastres.

El equipo de Microsoft Community Training gestiona todo el procedimiento de recuperación ante desastres para Community Training. La recuperación ante desastres no es activa-activa o pasiva activa, pero se basa en la recuperación de la copia de seguridad disponible más reciente de los servicios de Azure. El equipo de Community Training crea manualmente todos los recursos en la región emparejada a partir de la copia de seguridad de datos.

Nota:

La recuperación ante desastres de Community Training solo es compatible en regiones emparejadas.

Recuperación ante desastres en la geografía de varias regiones

  • En un desastre regional, el plano de control se conmuta manualmente por error a la región emparejada. Debe esperar alguna degradación del servicio en el tiempo antes de que se complete la conmutación por error. Después de la conmutación por error, solo se admiten las operaciones de solo lectura hasta que la región de desastre vuelva a estar en línea. El servicio se conmuta manualmente por recuperación a la región original una vez que vuelve a estar en línea y se reanudan todas las operaciones. Se espera que el objetivo de punto de recuperación (RPO) sea de 10 minutos; Objetivo de tiempo de recuperación (RTO), 24 horas.

  • Para el plano de datos, Community Training ofrece recuperación ante desastres administrada por Microsoft. Para usar la recuperación ante desastres administrada, debe habilitar la recuperación ante desastres durante la creación de la instancia de Community Training en Azure. Una vez que habilite la recuperación ante desastres, Microsoft mantiene la copia de seguridad del almacenamiento y la base de datos en la región emparejada. Se espera que el objetivo de punto de recuperación (RPO) sea de 12 horas; Objetivo de tiempo de recuperación (RTO), 48 horas.

Nota:

RTO depende del tamaño de la base de datos y del almacenamiento, la latencia entre la región emparejada. Capacidad de la máquina virtual de almacenamiento o base de datos (SKU). El RPO depende de los recursos subyacentes de Azure, como Azure SQL y Azure Storage. Para obtener más información sobre RTO y RPO, consulte Introducción a la recuperación ante desastres.

Detección, notificación y administración de interrupciones

Cuando una verificación de estado de Community Training detecta una interrupción de cualquier servicio y en cualquier región, Microsoft solicita su consentimiento para la conmutación por error a la región emparejada. Microsoft le informa de qué características están disponibles durante el procedimiento de recuperación ante desastres. Una vez que Microsoft reciba su consentimiento, el equipo de Community Training podrá iniciar el procedimiento de recuperación ante desastres.

Importante

Los alumnos no podrán consumir características de audio/vídeo hasta que la región primaria esté operativa. Se recomienda evitar operaciones de carga de medios hasta que el sitio primario esté operativo.

Capacidad y resistencia proactiva de la recuperación ante desastres

Microsoft y sus clientes operan bajo el modelo de responsabilidad compartida. Una vez que cualquier región está inactiva, no solo es la instancia de Community Training migrada a la región emparejada, sino también todas las cargas de trabajo de productos y clientes también se migran a la región emparejada. Este procedimiento puede provocar una escasez de recursos en la región emparejada o el centro de datos. Como resultado, la disponibilidad de la recuperación ante desastres depende de la capacidad disponible de los recursos subyacentes de Azure.

Pasos siguientes