Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
La creación de reflejo en Microsoft Fabric proporciona una experiencia sin problemas sin ETL para integrar los datos existentes de Azure Cosmos DB con el resto de los datos en Microsoft Fabric. Los datos de Azure Cosmos DB se replican continuamente directamente en Fabric OneLake casi en tiempo real, sin ningún impacto en el rendimiento en las cargas de trabajo transaccionales ni en unidades de solicitud (RU).
Los datos de OneLake se almacenan en el formato delta de código abierto y se pone automáticamente a disposición de todos los motores analíticos de Fabric.
Puede usar funcionalidades integradas de Power BI para acceder a los datos en OneLake en modo DirectLake. Con Copilot las mejoras de Fabric, puede usar la eficacia de la inteligencia artificial generativa para obtener información clave sobre los datos empresariales. Además de Power BI, puede usar T-SQL para ejecutar consultas de agregado complejas o usar Spark para la exploración de datos. Puede acceder sin problemas a los datos en cuadernos y usar la ciencia de datos para crear modelos de aprendizaje automático.
Importante
La creación de reflejo de Azure Cosmos DB está actualmente en versión preliminar. Las cargas de trabajo de producción no se admiten durante la versión preliminar. Actualmente, solo se admiten las cuentas de Azure Cosmos DB para NoSQL.
¿Por qué usar la creación de reflejos en Fabric?
Con la creación de reflejos en Fabric, no es necesario unir diferentes servicios de varios proveedores. En su lugar, puede disfrutar de un producto altamente integrado, de un extremo a otro y fácil de usar diseñado para simplificar sus necesidades de análisis y creado para la apertura.
Si busca informes o análisis de BI en los datos operativos de Azure Cosmos DB, la creación de reflejo proporciona:
- Sin ETL, el acceso casi en tiempo real rentable a los datos de Azure Cosmos DB sin afectar al consumo de unidades de solicitud
- Facilidad para incorporar datos entre varios orígenes a Fabric OneLake
- Optimizaciones de tablas delta con orden v para lecturas rápidas
- Integración con un solo clic con Power BI con Direct Lake y Copilot
- Conclusiones empresariales enriquecidas mediante la unión de datos entre varios orígenes
- Integración de aplicaciones más completa para acceder a consultas y vistas
Los datos de OneLake se almacenan en el formato delta Lake de código abierto, lo que le permite usarlo con varias soluciones dentro y fuera de Microsoft. Este formato de datos ayuda a facilitar la creación de un único patrimonio de datos para sus necesidades analíticas.
¿Qué experiencias de análisis se crean?
Las bases de datos reflejadas son un elemento de Fabric Data Warehouseing distinto del punto de conexión de Sql Analytics y Warehouse.
Cada elemento de Azure Cosmos DB reflejado crea estos elementos con los que puede interactuar en el área de trabajo de Fabric:
- Elemento de base de datos reflejado. La creación de reflejo administra la replicación de datos en OneLake y la conversión a Parquet, en un formato listo para análisis. Esto permite escenarios de bajada, como la ingeniería de datos, la ciencia de datos, etc.
- Punto de conexión de SQL Analytics, que se genera automáticamente
Base de datos reflejada
La base de datos reflejada muestra el estado de replicación y los controles para detener o iniciar la replicación en Fabric OneLake. También puede ver la base de datos de origen, en modo de solo lectura, mediante el Explorador de datos de Azure Cosmos DB. Con el explorador de datos, puede ver los contenedores en la base de datos de Azure Cosmos DB de origen y consultarlos. Estas operaciones consumen unidades de solicitud (RU) de la cuenta de Azure Cosmos DB. Los cambios realizados en la base de datos de origen se reflejan inmediatamente en la vista de base de datos de origen de Fabric. No se permite escribir en la base de datos de origen desde Fabric, ya que solo puede ver los datos.
Punto de conexión de análisis SQL
Cada base de datos reflejada tiene un punto de conexión de SQL Analytics generado automáticamente que proporciona una experiencia analítica enriquecida sobre las tablas Delta de OneLake creadas por el proceso de creación de reflejo. Tiene acceso a comandos de T-SQL conocidos que pueden definir y consultar objetos de datos, pero no manipular los datos del punto de conexión de SQL Analytics, ya que es una copia de solo lectura.
Puede realizar las siguientes acciones en el punto de conexión de SQL Analytics:
- Explore las tablas de Delta Lake mediante T-SQL. Cada tabla se asigna a un contenedor de la base de datos de Azure Cosmos DB.
- Cree consultas y vistas sin código y explorelas visualmente sin escribir una línea de código.
- Combinar y consultar datos en otras bases de datos reflejadas, almacenes y lakehouses en la misma área de trabajo.
- Puede visualizar y compilar fácilmente informes de BI basados en consultas o vistas SQL.
Además del editor de consultas SQL, hay un amplio ecosistema de herramientas. Estas herramientas incluyen la extensión mssql con Visual Studio Code, SQL Server Management Studio (SSMS) e incluso GitHub Copilot. Puede supercargar el análisis y la generación de conclusiones de la herramienta que prefiera.
Modelo semántico
Puede crear un modelo semántico de Power BI en la base de datos para permitir que las métricas empresariales se creen, compartan y reutilicen. Para más información, consulte Creación de un modelo semántico de Power BI.
¿Cómo funciona la replicación casi en tiempo real?
Al habilitar la creación de reflejo en la base de datos de Azure Cosmos DB, inserta, actualiza y elimina operaciones en los datos de procesamiento de transacciones en línea (OLTP) se replica continuamente en Fabric OneLake para el consumo de análisis.
La característica de copia de seguridad continua es un requisito previo para la creación de reflejo. Puede habilitar la copia de seguridad continua de 7 o 30 días en la cuenta de Azure Cosmos DB. Si va a habilitar la copia de seguridad continua específicamente para la creación de reflejo, se recomienda realizar una copia de seguridad continua de 7 días, ya que es gratis.
Nota:
La creación de reflejos no usa el almacén analítico ni la fuente de cambios de Azure Cosmos DB como origen de captura de datos modificados. Puede seguir usando estas funcionalidades de forma independiente, junto con la creación de reflejo.
Los datos de Azure Cosmos DB pueden tardar unos minutos en replicar los datos de Azure Cosmos DB en Fabric OneLake. En función de la instantánea inicial de los datos o de la frecuencia de actualizaciones o eliminaciones, la replicación también podría tardar más tiempo en algunos casos. La replicación no afecta a las unidades de solicitud (RU) asignadas para las cargas de trabajo transaccionales.
Qué esperar de la creación de reflejo
Hay algunas consideraciones y escenarios admitidos que debe tener en cuenta antes de la creación de reflejo.
Consideraciones sobre la configuración
Para reflejar una base de datos, ya debe aprovisionarse en Azure. Debe habilitar la copia de seguridad continua en la cuenta como requisito previo.
- Solo puede reflejar cada base de datos individualmente a la vez. Puede elegir qué base de datos se va a reflejar.
- Puede reflejar la misma base de datos varias veces dentro del mismo área de trabajo. Como procedimiento recomendado, se puede reutilizar una sola copia de la base de datos en almacenes, almacenes u otras bases de datos reflejadas. No debe tener que configurar varios reflejos en la misma base de datos.
- También puede reflejar la misma base de datos en diferentes áreas de trabajo o inquilinos de Fabric.
- Puede seleccionar qué contenedores se van a reflejar en la base de datos.
- Los cambios en los contenedores de Azure Cosmos DB, como agregar nuevos contenedores y eliminar los existentes, se replican sin problemas en Fabric. Puede iniciar la creación de reflejo de una base de datos vacía sin contenedores, por ejemplo, y la creación de reflejo recoge sin problemas los contenedores agregados en un momento posterior.
Compatibilidad con datos anidados
Los datos anidados se muestran como una cadena JSON en las tablas de puntos de conexión de SQL Analytics. Puede usar OPENJSON, CROSS APPLYy OUTER APPLY en consultas o vistas de T-SQL para expandir estos datos de forma selectiva. Si usa Power Query, también puede aplicar la ToJson función para expandir estos datos.
Mediante la inferencia de esquema automático, los datos anidados se pueden aplanar OPENJSON sin tener que definir explícitamente el esquema anidado. Esto resulta especialmente útil para cargas de trabajo con esquemas anidados dinámicos o imprevisibles. Para obtener más información, consulte cómo consultar datos anidados.
Nota:
Fabric tiene una limitación para las columnas de cadena de 8 KB de tamaño. Para obtener más información y nuestra solución alternativa actual, consulte Limitaciones del almacenamiento de datos.
Control de los cambios de esquema
La creación de reflejo replica automáticamente las propiedades en los elementos de Azure Cosmos DB, con cambios de esquema. Las nuevas propiedades detectadas en un elemento se muestran como columnas nuevas y las propiedades que faltan, si las hay, se representan como null en Fabric.
Si cambia el nombre de una propiedad de un elemento, las tablas de Fabric conservan las columnas antiguas y nuevas. La columna anterior mostrará null y la nueva mostrará el valor más reciente, para los elementos que se replican después de la operación de cambio de nombre.
Si cambia el tipo de datos de una propiedad en los elementos de Azure Cosmos DB, los cambios se admiten para los tipos de datos compatibles que se pueden convertir. Si los tipos de datos no son compatibles con la conversión en Delta, se representan como valores NULL.
Las tablas de puntos de conexión de SQL Analytics convierten los tipos de datos Delta en tipos de datos T-SQL.
Nombres de columna duplicados
Azure Cosmos DB admite nombres de columna que no distinguen mayúsculas de minúsculas, en función del estándar JSON. La creación de reflejo admite estos nombres de columna duplicados agregando _n al nombre de columna, donde n sería un valor numérico.
Por ejemplo, si el elemento de Azure Cosmos DB tiene addressName y AddressName como propiedades únicas, las tablas de Fabric tienen columnas y AddressName_1 correspondientesaddressName. Para más información, consulte Limitaciones de replicación.
Compatibilidad con cargas de trabajo de IA
La creación de reflejo de Azure Cosmos DB admite cuentas que usan la búsqueda de vectores y la indexación, lo que permite que las cargas de trabajo de inteligencia artificial y aprendizaje automático aprovechen todas las ventajas del análisis eficaz de Microsoft Fabric, al tiempo que siguen aprovechando las funcionalidades de vectores de alto rendimiento de Azure Cosmos DB.
Para obtener más información, explore la documentación sobre búsqueda de vectores e indexación para Cosmos DB y Fabric Data Science and AI Experiences.
Security
Puede conectarse a un acocunt de origen mediante el identificador de Microsoft Entra y el control de acceso basado en rol o las claves de nivel de cuenta.
Si usa claves y rota o regenera las claves, debe actualizar las conexiones para asegurarse de que la replicación funciona. Para obtener más información, consulte Conexiones. Las claves de cuenta no son visibles directamente para otros usuarios de Fabric una vez configurada la conexión. Puede limitar quién tiene acceso a las conexiones creadas en Fabric. Las escrituras no se permiten en la base de datos de Azure Cosmos DB desde el explorador de datos o el punto de conexión de análisis de la base de datos reflejada. La creación de reflejo no admite actualmente la autenticación mediante claves de cuenta de solo lectura.
Para la autenticación de Id. de Microsoft Entra, se requieren los siguientes permisos de RBAC: Microsoft.DocumentDB/databaseAccounts/readMetadata & Microsoft.DocumentDB/databaseAccounts/readAnalytics. Para obtener más información, consulte la documentación del control de acceso basado en rol del plano de datos.
Sugerencia
Una vez que los datos se replican en Fabric OneLake, también debe proteger el acceso a estos datos.
Características de protección de datos
La seguridad granular se puede configurar en la base de datos reflejada en Microsoft Fabric. Para obtener más información, consulte permisos pormenorizados en Microsoft Fabric.
Puede proteger los filtros de columna y los filtros de fila basados en predicados en tablas en roles y usuarios de Microsoft Fabric:
- Seguridad de nivel de fila en el almacenamiento de datos de Fabric
- Seguridad de nivel de columna en el almacenamiento de datos de Fabric
También puede enmascarar datos confidenciales de usuarios que no son administradores mediante enmascaramiento dinámico de datos:
Seguridad de red
Actualmente, la creación de reflejo no admite puntos de conexión privados ni claves administradas por el cliente (CMK) en OneLake. La creación de reflejo no se admite para las cuentas de Azure Cosmos DB con configuraciones de seguridad de red menos permisivas que todas las redes, el uso de puntos de conexión de servicio, el uso de puntos de conexión privados, el uso de direcciones IP o cualquier otra configuración que pueda limitar el acceso de red pública a la cuenta. Las cuentas de Azure Cosmos DB deben estar abiertas a todas las redes para que funcionen con la creación de reflejo.
Latencia de replicación y recuperación ante desastres
En Fabric, puede implementar contenido en centros de datos en regiones distintas de la región principal del inquilino de Fabric. Para obtener más información, consulte Compatibilidad con varias regiones geográficas.
Para una cuenta de Azure Cosmos DB con una región de escritura primaria y varias regiones de lectura, la creación de reflejo elige la región de lectura de Azure Cosmos DB más cercana a la región donde está configurada la capacidad de Fabric. Esta selección ayuda a proporcionar replicación de baja latencia para la creación de reflejo.
Al cambiar la cuenta de Azure Cosmos DB a una región de recuperación, la creación de reflejo selecciona automáticamente la región de Azure Cosmos DB más cercana de nuevo.
Nota:
La creación de reflejo no admite cuentas con varias regiones de escritura.
Los datos de Cosmos DB replicados en OneLake deben configurarse para controlar las interrupciones en toda la región. Para obtener más información, consulte Recuperación ante desastres en OneLake.
Exploración de los datos con creación de reflejo
Puede ver y acceder directamente a los datos reflejados en OneLake. También puede acceder sin problemas a los datos reflejados sin necesidad de mover más datos.
Obtenga más información sobre cómo acceder a OneLake mediante las API o el SDK de ADLS Gen2, el explorador de archivos oneLake y el explorador de Azure Storage.
Puede conectarse al punto de conexión de SQL Analytics desde herramientas como SQL Server Management Studio (SSMS) o mediante controladores como Conectividad abierta de bases de datos (ODBC) y Conectividad de bases de datos Java (JDBC). Para más información, consulte Conectividad de punto de conexión de SQL Analytics.
También puede acceder a los datos reflejados con servicios como:
- Servicios de Azure como Azure Databricks, Azure HDInsight o Azure Synapse Analytics
- Fabric Lakehouse mediante accesos directos para escenarios de ingeniería de datos y ciencia de datos
- Otras bases de datos o almacenes reflejados en el área de trabajo de Fabric
También puede crear soluciones de arquitectura de medallion, limpiar y transformar los datos que se van a colocar en la base de datos reflejada como capa de bronce. Para obtener más información, consulte compatibilidad con la arquitectura medallion en Fabric.
Pricing
El proceso de Fabric que se usa para replicar los datos de Cosmos DB en Fabric OneLake es gratuito. El almacenamiento en OneLake está libre de costos según el tamaño de la capacidad. Para obtener más información, consulte Precios de OneLake para la creación de reflejo. El uso de proceso para consultar datos a través de SQL, Power BI o Spark se sigue cobrando en función de la capacidad de tejido.
Si usa el explorador de datos en la creación de reflejo de Fabric, acumulará costos típicos en función del uso de la unidad de solicitud (RU) para explorar los contenedores y consultar los elementos de la base de datos de Azure Cosmos DB de origen. La característica de copia de seguridad continua de Azure Cosmos DB es un requisito previo para la creación de reflejo: se aplican cargos estándar para la copia de seguridad continua. No hay cargos adicionales por la creación de reflejo en la facturación continua de copia de seguridad. Para más información, consulte Precios de Azure Cosmos DB.