¿Qué es la creación de reflejos en Fabric?
Como solución de replicación de datos, la creación de reflejo en Fabric es una solución de bajo costo y baja latencia para reunir datos de varios sistemas en una única plataforma de análisis. Puede replicar continuamente el patrimonio de datos existente directamente en OneLake de Fabric, incluidos los datos de Azure SQL Database, Azure Cosmos DB, Azure Databricks y Snowflake.
Con los datos completamente actualizados en un formato consultable en OneLake, ahora puedes usar todos los servicios de Fabric, como la ejecución de análisis con Spark, la ejecución de cuadernos, la ingeniería de datos, la visualización a través de informes de Power BI, etc.
La creación de reflejo en Fabric permite a los usuarios disfrutar de un producto muy integrado, de un extremo a otro y fácil de usar diseñado para simplificar las necesidades de análisis. Creado para la apertura y la colaboración entre Microsoft y las soluciones tecnológicas que pueden leer el formato de tabla Delta Lake de código abierto, la creación de reflejo es una solución llave en mano de bajo costo y baja latencia que le permite crear una réplica de los datos en OneLake que se puede usar para todas sus necesidades analíticas.
Después, las tablas Delta se pueden usar en cualquier parte de Fabric, lo que permite a los usuarios acelerar su recorrido a Fabric.
¿Por qué conviene usar la creación de reflejos en Fabric?
En la actualidad, muchas organizaciones tienen datos operativos o analíticos críticos que se encuentran en silos.
Actualmente, el acceso y el trabajo con estos datos requieren canalizaciones ETL (extracción transformación carga) complejas, procesos empresariales y silos de decisión, lo que crea lo siguiente:
- Acceso restringido y limitado a datos importantes, siempre cambiantes.
- Fricción entre personas, procesos y tecnología.
- Tiempos de espera largos a fin de crear canalizaciones de datos y procesos para datos de importancia crítica.
- No hay libertad a fin de usar las herramientas que necesita para analizar y compartir información cómodamente.
- Falta de una base adecuada para que los usuarios compartan los datos y colaboren.
- No hay formatos de datos comunes y abiertos para todos los escenarios analíticos: BI, IA, integración, ingeniería e incluso aplicaciones.
La creación de reflejos en Fabric proporciona una experiencia sencilla para acelerar el plazo de amortización de información y decisiones, y para desglosar los silos de datos entre soluciones tecnológicas.
Replicación casi en tiempo real de datos en un lago de datos de SaaS, con análisis integrado para BI e IA
La plataforma Microsoft Fabric se basa en SaaS (Software como servicio), que lleva la simplicidad y la integración a un nuevo nivel. Para obtener más información acerca de Microsoft Fabric, vea ¿Qué es Microsoft Fabric?
La creación de reflejo crea tres elementos en el área de trabajo de Fabric:
- La creación de reflejo administra la replicación de datos en OneLake y la conversión a Parquet, en un formato listo para el análisis. Esto permite escenarios de bajada, como la ingeniería de datos, la ciencia de datos, etc.
- Un punto de conexión de análisis SQL
- Un modelo semántico predeterminado
Además del Editor de consultas SQL de Microsoft Fabric, hay un amplio ecosistema de herramientas, incluido SQL Server Management Studio, Azure Data Studio e incluso GitHub Copilot.
El uso compartido permite facilitar el control de acceso y la administración, para asegurarse de que puede controlar el acceso a información confidencial. El uso compartido también permite tomar decisiones seguras y democratizadas en toda la organización.
Actualmente, están disponibles las siguientes bases de datos externas:
¿Cómo funciona la replicación casi en tiempo real de la creación de reflejo?
La creación de reflejo está habilitada creando una conexión segura al origen de datos operativos. Elija si quiere replicar una base de datos completa o tablas individuales y la creación de reflejo mantendrá automáticamente los datos sincronizados. Una vez configurada, los datos se replicarán continuamente en OneLake para el consumo de análisis.
A continuación se muestran los principios básicos de la creación de reflejo:
Habilitar la creación de reflejos en Fabric es sencillo e intuitivo, sin necesidad de crear canalizaciones ETL más complejas, asignar otros recursos de proceso ni administrar el movimiento de datos.
La creación de reflejos en Fabric es un servicio totalmente administrado, por lo que no tiene que preocuparse por hospedar, mantener ni administrar la replicación de la conexión reflejada.
Uso compartido
El uso compartido permite facilitar el control de acceso y la administración, mientras que los controles de seguridad, como la seguridad de nivel de fila (RLS) y la seguridad de nivel de objeto (OLS), entre otros, se aseguran de que puede controlar el acceso a la información confidencial. El uso compartido también permite tomar decisiones seguras y democratizadas en toda la organización.
Al compartir, los usuarios conceden a otros usuarios o a un grupo de usuarios acceso a una base de datos reflejada sin dar acceso al área de trabajo y al resto de sus elementos. Cuando alguien comparte una base de datos reflejada, también concede acceso al punto de conexión de análisis SQL y al modelo semántico predeterminado asociado.
Acceda al cuadro de diálogo Compartir con el botón Compartir situado junto al nombre de la base de datos reflejada en la vista Área de trabajo. Las bases de datos reflejadas se pueden encontrar mediante el centro de datos e OneLake o la sección Compartidos conmigo en Microsoft Fabric.
Para obtener más información, vea Uso compartido del almacén y administración de permisos.
Consultas entre bases de datos
Con los datos de la base de datos reflejada almacenada en OneLake, puede escribir consultas entre bases de datos, combinar datos de bases de datos reflejadas, almacenes y los puntos de conexión de análisis SQL de instancias de Lakehouse en una sola consulta de T-SQL. Para obtener más información, vea Escritura de una consulta entre bases de datos.
Por ejemplo, puede hacer referencia a la tabla desde bases de datos reflejadas y almacenes mediante nombres de tres partes. En el ejemplo siguiente, use el nombre de tres partes para hacer referencia a ContosoSalesTable
en el almacén ContosoWarehouse
. Desde otras bases de datos o almacenes, la primera parte de la convención de nomenclatura de tres partes de SQL estándar es el nombre de la base de datos reflejada.
SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;
Ingeniería de datos con los datos de la base de datos reflejada
Microsoft Fabric proporciona diversas capacidades de ingeniería de datos para asegurarse de que los datos sean fácilmente accesibles, de alta calidad y estén bien organizados. Desde la Ingeniería de datos de Fabric, puedes hacer lo siguiente:
- Crear y administrar los datos como Spark mediante un lago de datos
- Diseñar canalizaciones para copiar datos en el almacén de lago
- Usar definiciones de trabajos de Spark para enviar un trabajo por lotes o streaming a un clúster de Spark
- Usar cuadernos para escribir código para la ingesta, preparación y transformación de datos
Ciencia de datos con los datos de la base de datos reflejada
Microsoft Fabric ofrece Ciencia de datos de Synapse para permitir a los usuarios completar flujos de trabajo de un extremo a otro para el enriquecimiento de datos y la información empresarial. Puede completar una amplia gama de actividades en todo el proceso de ciencia de datos: exploración, preparación y limpieza de los datos, experimentación, modelado, puntuación del modelo y transmisión de información predictiva a los informes de BI.
Los usuarios de Microsoft Fabric pueden acceder a las cargas de trabajo de ciencia de datos. Desde allí, pueden detectar varios recursos relevantes y acceder a ellos. Por ejemplo, pueden crear experimentos de aprendizaje automático, modelos y cuadernos. También pueden importar cuadernos existentes en la página principal de ciencia de datos.