Compartir por


Confiabilidad en Microsoft Fabric

En este artículo se describe la compatibilidad con la confiabilidad en Microsoft Fabric y la resistencia regional con zonas de disponibilidad y recuperación entre regiones y continuidad empresarial. Para obtener información general más detallada sobre la confiabilidad de Azure, consulte Confiabilidad de Azure.

Compatibilidad de zonas de disponibilidad

Las zonas de disponibilidad de Azure son al menos tres grupos de centros de datos físicamente independientes dentro de cada región de Azure. Los centros de datos de cada zona están equipados con infraestructura de alimentación, refrigeración y red independientes. En el caso de un error en la zona local, las zonas de disponibilidad están diseñadas de manera que, si se ve afectada una zona, los servicios, la capacidad y la alta disponibilidad regionales serán proporcionadas por las dos zonas restantes.

Estos errores pueden abarcar desde errores de software y hardware hasta eventos como terremotos, inundaciones e incendios. La tolerancia a los errores se logra con la redundancia y el aislamiento lógico de los servicios de Azure. Para más información sobre las zonas de disponibilidad en Azure, consulte Regiones y zonas de disponibilidad.

Los servicios habilitados para zonas de disponibilidad de Azure están diseñados para proporcionar el nivel adecuado de confiabilidad y flexibilidad. Se pueden configurar de dos maneras. Pueden tener redundancia de zona, con una replicación automática entre zonas o ser zonales, con instancias ancladas a una zona específica. También puede combinar ambos enfoques. Para más información sobre la arquitectura zonal frente a la arquitectura con redundancia de zona, consulte Recomendaciones para el uso de zonas de disponibilidad y regiones.

Fabric realiza esfuerzos comerciales razonables para admitir zonas de disponibilidad con redundancia de zona, donde los recursos se replican automáticamente entre zonas, sin necesidad de instalarlos o configurarlos.

Requisitos previos

  • Actualmente, Fabric proporciona compatibilidad parcial con zonas de disponibilidad en un número limitado de regiones. Esta compatibilidad parcial con zonas de disponibilidad abarca experiencias (o ciertas funcionalidades dentro de una experiencia).
  • Las experiencias como Los flujos de eventos no admiten zonas de disponibilidad.
  • La ingeniería de datos admite zonas de disponibilidad si usa OneLake. Si usa otros orígenes de datos como ADLS Gen2, debe asegurarse de que el almacenamiento con redundancia de zona (ZRS) esté habilitado.
  • La disponibilidad de zona puede estar disponible o no para las experiencias y/o características o funcionalidades de Fabric que se encuentran en versión preliminar.
  • Las puertas de enlace locales y los modelos semánticos grandes en Power BI no admiten zonas de disponibilidad.
  • Data Factory (canalizaciones) admite zonas de disponibilidad en el Oeste de Europa, pero las ejecuciones de canalizaciones nuevas o de entrada pueden producir un error en caso de interrupción de zona.

Regiones admitidas

Fabric realiza esfuerzos comercialmente razonables para proporcionar compatibilidad con zonas de disponibilidad en varias regiones de la siguiente manera:

América Power BI Datamarts Almacenamientos de datos Análisis en tiempo real Data Factory (canalizaciones) Ingeniería de datos
Sur de Brasil
Centro de Canadá
Centro de EE. UU.
Este de EE. UU.
Este de EE. UU. 2
Centro-sur de EE. UU.
Oeste de EE. UU. 2
Oeste de EE. UU. 3
Europa
Centro de Francia
Centro-oeste de Alemania
Norte de Italia
Norte de Europa
Este de Noruega
Centro de Polonia
Sur de Reino Unido 2
Oeste de Europa
Oriente Medio
Centro de Catar
Centro de Israel
África
Norte de Sudáfrica
Asia-Pacífico
Este de Australia
Japón Oriental
Sudeste de Asia

Experiencia a nivel de zona

Durante una interrupción de toda la zona, no se requiere ninguna acción con fines de recuperación de zona. Las funcionalidades de Fabric en las regiones enumeradas en regiones admitidas se recuperan y reequilibran automáticamente para aprovechar las ventajas de la zona correcta. La ejecución de trabajos de Spark puede producir un error si el nodo maestro está en la zona con errores. En tal caso, los trabajos deberán volver a enviarse.

Importante

Aunque Microsoft se esfuerza por proporcionar compatibilidad uniforme y coherente con las zonas de disponibilidad, en algunos casos de error de zona de disponibilidad, las capacidades de Fabric ubicadas en regiones de Azure con mayores fluctuaciones de la demanda de los clientes podrían experimentar una latencia superior a la normal.

Recuperación ante desastres entre regiones y continuidad empresarial

La recuperación ante desastres (DR) consiste en recuperarse de eventos de alto impacto, como desastres naturales o implementaciones con errores, lo que produce tiempo de inactividad y pérdida de datos. Independientemente de la causa, el mejor remedio para un desastre es un plan de recuperación ante desastres bien definido y probado y un diseño de aplicaciones que apoye activamente la recuperación ante desastres. Antes de empezar a pensar en la creación del plan de recuperación ante desastres, vea Recomendaciones para diseñar una estrategia de recuperación ante desastres.

En lo que respecta a la recuperación ante desastres, Microsoft usa el modelo de responsabilidad compartida. En un modelo de responsabilidad compartida, Microsoft garantiza que la infraestructura de línea base y los servicios de plataforma estén disponibles. Al mismo tiempo, muchos servicios de Azure no replican automáticamente datos ni se revierten desde una región con errores para realizar la replicación cruzada en otra región habilitada. Para esos servicios, usted es el responsable de configurar un plan de recuperación ante desastres que funcione para la carga de trabajo. La mayoría de los servicios que se ejecutan en ofertas de plataforma como servicio (PaaS) de Azure proporcionan características e instrucciones para admitir la recuperación ante desastres y puede usar características específicas del servicio para admitir la recuperación rápida para ayudar a desarrollar el plan de recuperación ante desastres.

En esta sección se describe un plan de recuperación ante desastres para Fabric diseñado para ayudar a su organización a mantener sus datos seguros y accesibles cuando se produce un desastre regional no planeado. El plan trata los temas siguientes:

  • Replicación entre regiones: Fabric ofrece replicación entre regiones para los datos almacenados en OneLake. Puede participar o no en esta característica en función de sus requisitos.

  • Acceso a los datos después del desastre: en un escenario de desastre regional, Fabric garantiza el acceso a los datos, con ciertas limitaciones. Aunque la creación o modificación de nuevos elementos está restringida después de la conmutación por error, el enfoque principal sigue siendo asegurarse de que los datos existentes permanecen accesibles e intactos.

  • Guía para la recuperación: Fabric proporciona un conjunto estructurado de instrucciones para guiarle a través del proceso de recuperación. La guía estructurada facilita la transición a las operaciones normales.

Power BI, ahora una parte de Fabric, tiene un sistema de recuperación ante desastres sólido y ofrece las siguientes características:

  • BCDR de forma predeterminada: Power BI incluye automáticamente funcionalidades de recuperación ante desastres en su oferta predeterminada. No es necesario participar ni activar esta característica por separado.

  • Replicación entre regiones: Power BI utiliza la replicación con redundancia geográfica del almacenamiento de Azure y la replicación con redundancia geográfica de Azure SQL para garantizar que existen instancias de copia de seguridad en otras regiones y que se pueden utilizar. Esto significa que los datos se duplican en distintas regiones, lo que mejora su disponibilidad y reduce los riesgos asociados a las interrupciones regionales.

  • Servicios continuos y acceso después del desastre: incluso durante eventos disruptivos, los elementos de Power BI permanecen accesibles en modo de solo lectura. Los elementos incluyen modelos semánticos, informes y paneles de información, garantizando que las empresas puedan continuar sus procesos de análisis y toma de decisiones sin obstáculos significativos.

Para más información, consulte las Preguntas más frecuentes sobre alta disponibilidad, conmutación por error y recuperación ante desastres de Power BI

Importante

En el caso de los clientes cuyas regiones principales no tienen una región de par de Azure y se ven afectadas por un desastre, la capacidad de usar las capacidades de Fabric puede estar en peligro, incluso si los datos de esas capacidades se replican. Esta limitación está vinculada a la infraestructura de la región principal, esencial para el funcionamiento de las capacidades.

Región principal y funcionalidad de capacidad

Para un planeamiento eficaz de la recuperación ante desastres, es fundamental que comprenda la relación entre la región principal y las ubicaciones de capacidad. Comprender la región principal y las ubicaciones de capacidad le ayuda a realizar selecciones estratégicas de regiones de capacidad, así como los procesos de replicación y recuperación correspondientes.

La región principal para el espacio empresarial y el almacenamiento de datos de su organización se establece en la ubicación de la dirección de facturación del primer usuario que se registra. Para más información sobre la configuración del inquilino, vaya a Planeamiento de implementación de Power BI: Configuración de inquilino. Al crear nuevas capacidades, el almacenamiento de datos se establece en la región principal de forma predeterminada. Si desea cambiar la región de almacenamiento de datos a otra región, deberá habilitar Multi-Geo, una característica de Fabric Premium.

Importante

Elegir una región diferente para la capacidad no reubica completamente todos los datos en esa región. Algunos elementos de datos siguen estando almacenados en la región principal. Para ver qué datos permanecen en la región principal y qué datos se almacenan en la región habilitada para Multi-Geo, consulte Configuración de la compatibilidad de Multi-Geo con Fabric Premium.

En el caso de una región principal que no tiene una región emparejada, las capacidades de cualquier región habilitada para Multi-Geo pueden enfrentar problemas operativos si la región principal encuentra un desastre, ya que la funcionalidad de servicio principal está anclada a la región principal.

Si selecciona una región habilitada para Multi-Geo dentro de la UE, se garantiza que los datos se almacenan dentro del límite de datos de la UE.

Para obtener información sobre cómo identificar la región principal, consulte Búsqueda de la región principal de Fabric.

Configuración de la capacidad de recuperación ante desastres

Fabric proporciona un conmutador de recuperación ante desastres en la página de configuración de capacidad. Está disponible donde los emparejamientos regionales de Azure coinciden con la presencia de servicios de Fabric. Estos son los detalles de este cambio:

  • Acceso a rol: Solo los usuarios con el rol de administrador de capacidad o superior pueden utilizar este conmutador.

  • Granularidad: La granularidad del conmutador es el nivel de capacidad. Está disponible para las capacidades Premium y Fabric.

  • Ámbito de datos: El conmutador de recuperación de desastres se refiere específicamente a los datos de OneLake, que incluye los datos de Lakehouse y Warehouse. El cambio no afecta a sus datos almacenados fuera de OneLake.

  • Continuidad de BCDR para Power BI: Mientras que la recuperación ante desastres para los datos de OneLake se puede activar y desactivar, BCDR para Power BI siempre es compatible, independientemente de si el interruptor está activado o desactivado.

  • Frecuencia: una vez que cambie la configuración de capacidad de recuperación ante desastres, debe esperar 30 días antes de poder modificarla de nuevo. El período de espera se establece para mantener la estabilidad y evitar la alternancia constante,

Captura de pantalla de la configuración del inquilino de recuperación ante desastres.

Nota:

Después de activar la configuración de capacidad de recuperación ante desastres, los datos pueden tardar hasta una semana en iniciar la replicación.

Replicación de datos

Cuando active la configuración de capacidad de recuperación ante desastres, se habilita la replicación entre regiones como capacidad de recuperación ante desastres para los datos de OneLake. La plataforma Fabric se alinea con las regiones Azure para aprovisionar los pares de redundancia geográfica. Sin embargo, algunas regiones no tienen una región de par de Azure, o la región de par no admite Fabric. Para estas regiones, la replicación de datos no está disponible. Para obtener más información, consulte Regiones con zonas de disponibilidad y ningún par de regiones y Disponibilidad de regiones de Fabric.

Nota:

Aunque Fabric ofrece una solución de replicación de datos en OneLake para admitir la recuperación ante desastres, existen notables limitaciones. Por ejemplo, los datos de las bases de datos KQL y los conjuntos de consultas se almacenan externamente a OneLake, lo que significa que es necesario un enfoque separado de recuperación de desastres. Consulte el resto de este documento para obtener más información sobre el enfoque de recuperación ante desastres para cada elemento de Fabric.

Facturación

La función de recuperación ante desastres de Fabric permite la replicación geográfica de sus datos para mejorar la seguridad y la fiabilidad. Esta característica consume más almacenamiento y transacciones, que se facturan como almacenamiento BCDR y operaciones BCDR, respectivamente. Puede supervisar y administrar estos costes en la aplicación Microsoft Fabric Capacity Metrics, donde aparecen como partidas independientes.

Para obtener un desglose exhaustivo de todos los costos de recuperación ante desastres asociados para ayudarle a planear y presupuestar en consecuencia, consulte Consumo de almacenamiento y proceso de OneLake.

Configuración de la recuperación ante desastres

Aunque Fabric proporciona características de recuperación ante desastres para admitir la resistencia de los datos, debe seguir ciertos pasos manuales para restaurar el servicio durante las interrupciones. En esta sección se detallan las acciones que debe realizar para prepararse para posibles interrupciones.

Fase 1: Preparación

  • Active la configuración de la capacidad de recuperación ante desastres: Revise y configure periódicamente los configuración de capacidad de recuperación ante desastres para asegurarse de que satisfacen sus necesidades de protección y rendimiento.

  • Cree copias de seguridad de los datos: Copie los datos críticos almacenados fuera de OneLake a otra región de forma que se ajuste a su plan de recuperación ante desastres.

Fase 2: Recuperación en caso de desastre

Cuando un desastre importante hace irrecuperable la región primaria, Microsoft Fabric inicia una recuperación regional. El acceso al portal de Fabric no está disponible hasta que se complete la conmutación por error y se publique una notificación en la página de soporte técnico de Microsoft Fabric.

El tiempo que tarda en completarse la recuperación puede variar, aunque normalmente tarda menos de una hora. Una vez completada la recuperación, esto es lo que puede esperar:

  • Portal de Fabric: puede acceder al portal y las operaciones de lectura, como la navegación por las áreas de trabajo y los elementos existentes, seguirán funcionando. Todas las operaciones de escritura, como la creación o modificación de un área de trabajo, se ponen en pausa.

  • Power BI: Puede realizar operaciones de lectura, como la visualización de cuadros de mando e informes. No se admiten actualizaciones, operaciones de publicación de informes, modificaciones de cuadros de mando e informes ni otras operaciones que requieran cambios en los metadatos.

  • Almacén de lago/Almacén: No se pueden abrir estos elementos, pero se puede acceder a los archivos a través de las API o herramientas de OneLake.

  • Definición de trabajo Spark: No se pueden abrir las definiciones de trabajo de Spark, pero se puede acceder a los archivos de código a través de las API o herramientas de OneLake. Cualquier metadato o configuración se guardará después de la recuperación.

  • Bloc de notas: No se pueden abrir los blocs de notas, y el contenido del código no se guardará después del desastre.

  • Modelo/Experimento ML: No se pueden abrir modelos o experimentos ML. El contenido del código y los metadatos, como las métricas de ejecución y las configuraciones, no se guardarán tras el desastre.

  • Flujo de datos Gen2/Canalización/Eventstream: No puede abrir estos elementos, pero puede utilizar los destinos de recuperación de desastres compatibles (almacenes de lago o almacenes) para proteger los datos.

  • Base de datos KQL/Conjunto de consultas: no podrá acceder a bases de datos KQL y conjuntos de consultas después de la conmutación por error. Se requieren más pasos de requisitos previos para proteger los datos en bases de datos de KQL y conjuntos de consultas.

En un escenario de desastre, el portal de Fabric y Power BI están en modo de solo lectura y otros elementos de Fabric no están disponibles. Puede acceder a sus datos almacenados en OneLake mediante API o herramientas de terceros. Tanto el portal como Power BI conservan la capacidad de realizar operaciones de lectura y escritura en esos datos. Esta capacidad garantiza que los datos críticos sigan siendo accesibles y modificables, y mitiga la posible interrupción de las operaciones de su empresa.

Los datos de OneLake siguen siendo accesibles a través de múltiples canales:

Fase 3: Plan de recuperación

Aunque Fabric garantiza que los datos permanecen accesibles después de un desastre, también puede actuar para restaurar completamente sus servicios al estado antes del incidente. En esta sección se proporciona una guía paso a paso para ayudarle a través del proceso de recuperación.

Pasos de la recuperación

  1. Cree una nueva capacidad de Fabric en cualquier región después de un desastre. Dada la alta demanda durante estos eventos, se recomienda seleccionar una región fuera de la ubicación geográfica principal para aumentar la probabilidad de disponibilidad del servicio de proceso. Para obtener información sobre cómo crear una capacidad, consulte Comprar una suscripción de Microsoft Fabric.

  2. Cree áreas de trabajo en la capacidad recién creada. Si es necesario, use los mismos nombres que las áreas de trabajo antiguas.

  3. Cree elementos con los mismos nombres que los que desea recuperar. Este paso es importante si usa el script personalizado para recuperar almacenes y almacenes de lagos.

  4. Restauración de los elementos. Para cada elemento, siga la sección correspondiente de la guía de recuperación de desastres específica de la experiencia para restaurar el elemento.

Pasos siguientes