¿Qué son los flujos de datos?

Sugerencia

Pruebe Dataflow Gen2 en Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. Obtenga información sobre cómo iniciar una nueva evaluación gratuita.

Los flujos de datos son una tecnología de preparación de datos basada en la nube y de autoservicio. Los flujos de datos permiten a los clientes ingerir, transformar y cargar datos en entornos de Microsoft Dataverse, en áreas de trabajo de Power BI o en la cuenta de Azure Data Lake Storage de la organización. Los flujos de datos se crean mediante Power Query, una experiencia unificada de preparación y conectividad de datos que ya se incluye en muchos productos de Microsoft, incluidos Excel y Power BI. Los clientes pueden desencadenar flujos de datos para que se ejecuten a petición o de forma automática de acuerdo con una programación; los datos siempre se mantienen actualizados.

Los flujos de datos se pueden crear en varios productos de Microsoft

Los flujos de datos se incluyen en varios productos de Microsoft y no requieren que se cree o ejecute una licencia específica del flujo de datos. Los flujos de datos están disponibles en Power Apps, Power BI y Dynamics 365 Customer Insights. La capacidad de crear y ejecutar flujos de datos se incluye en las licencias de dichos productos. Las características del flujo de datos suelen ser, por lo general, comunes en todos los productos en los que se incluyen, pero algunas características específicas de un producto pueden existir en flujos de datos creados en algunos productos y en otros no.

¿Cómo funciona el flujo de datos?

Image of how dataflows function, from the source data, to the transformation process, and then to storage.

La imagen anterior muestra una vista general de cómo se define un flujo de datos. Un flujo de datos obtiene datos de orígenes de datos diferentes (ya se admiten más de 80 orígenes de datos). A continuación, en función de las transformaciones configuradas con la experiencia de creación de Power Query, el flujo de datos transforma los datos mediante el motor de flujo de datos. Por último, los datos se cargan en el destino de salida, que puede ser un entorno de Microsoft Power Platform, un área de trabajo de Power BI o la cuenta de Azure Data Lake Storage de la organización.

Los flujos de datos se ejecutan en la nube

Los flujos de datos se basan en la nube. Cuando se crea y guarda un flujo de datos, su definición se almacena en la nube. Un flujo de datos también se ejecuta en la nube. No obstante, si un origen de datos es local, se puede utilizar una puerta de enlace de datos local para extraer los datos en la nube. Cuando se desencadena una ejecución de flujo de datos, la transformación y el cálculo de datos se producen en la nube, y el destino siempre está en la nube.

Image of how dataflows run in the cloud, from the data source, to the dataflow running in the cloud, and then to storage.

Los flujos de datos utilizan un motor de transformación eficaz

Power Query es el motor de transformación de datos que se utiliza en flujos de datos. Este motor es lo suficientemente eficaz como para ser compatible con muchas transformaciones avanzadas. También utiliza una interfaz gráfica de usuario sencilla, pero eficaz, denominada Editor de Power Query. Puede utilizar flujos de datos con este editor para desarrollar soluciones de integración de datos de forma más rápida y sencilla.

Screenshot showing an example of Power Query transformations.

Integración del flujo de datos con Microsoft Power Platform y Dynamics 365

Dado que los flujos de datos almacenan las tablas resultantes en la nube, otros servicios pueden interactuar con los datos que estos generan.

Image of how a dataflow integrates with Microsoft Power Platform and Dynamics 365.

Por ejemplo, las aplicaciones de Power BI, Power Apps, Power Automate, Power Virtual Agents y Dynamics 365 pueden obtener los datos que genere el flujo de datos mediante la conexión a Dataverse, un conector de flujo de datos de Power Platform o directamente a través del lago, en función del destino configurado en el momento de la creación del flujo de datos.

Ventajas de los flujos de datos

En la lista siguiente se resaltan algunas de las ventajas de usar flujos de datos:

  • Desacoplan la capa de transformación de datos de la capa de modelado y visualización en las soluciones de Power BI.

  • El código de transformación de datos puede residir en una ubicación central (flujo de datos), en lugar de distribuirse entre varios artefactos.

  • El creador de flujos de datos solo necesita conocimientos de Power Query. En un entorno con varios creadores, el creador del flujo de datos puede formar parte de un equipo que compile toda la solución de BI o la aplicación operativa.

  • Los flujos de datos son independientes del producto. No son solo un componente de Power BI; usted puede obtener sus datos con otras herramientas y servicios.

  • Los flujos de datos aprovechan Power Query, una experiencia de transformación de datos eficaz, gráfica y de autoservicio.

  • Los flujos de datos se ejecutan completamente en la nube. No se necesita ninguna inversión adicional en infraestructura.

  • Hay varias opciones para empezar a trabajar con flujos de datos: mediante licencias para Power Apps, Power BI y Customer Insights.

  • Aunque los flujos de datos admiten las transformaciones avanzadas, están diseñados para escenarios de autoservicio y no requieren experiencia en TI o como desarrollador.

Escenarios de casos de uso para flujos de datos

Puede utilizar flujos de datos para muchos fines. En los siguientes escenarios se proporcionan algunos ejemplos de casos de uso comunes para los flujos de datos.

Migración de datos desde sistemas heredados

En este escenario, una organización ha tomado la decisión de utilizar Power Apps para la nueva experiencia de interfaz de usuario en lugar del sistema local heredado. Power Apps, Power Automate y AI Builder utilizan Dataverse como sistema de almacenamiento de datos principal. Los datos actuales del sistema local existente se pueden migrar a Dataverse mediante un flujo de datos y, a continuación, estos productos pueden usar los datos.

Uso de flujos de datos para crear un almacenamiento de datos

Puede utilizar flujos de datos como sustitutos de otras herramientas de extracción, transformación y carga (ETL) para crear un almacenamiento de datos. En este escenario, los ingenieros de datos de una empresa deciden utilizar flujos de datos para crear su almacenamiento de datos diseñado con esquema de estrella, entre los que se incluyen tablas de hechos y dimensiones en Data Lake Storage. Después, Power BI se utiliza para generar informes y paneles mediante la obtención de datos desde los flujos de datos.

Image of how to build a data warehouse using dataflows.

Uso de flujos de datos para crear un modelo dimensional

Puede utilizar flujos de datos como sustitutos de otras herramientas de ETL para crear un modelo dimensional. Por ejemplo, los ingenieros de datos de una empresa deciden utilizar flujos de datos para crear el modelo dimensional diseñado con esquema de estrella, incluidas las tablas de hechos y dimensiones de Azure Data Lake Storage Gen2. Después, Power BI se utiliza para generar informes y paneles mediante la obtención de datos desde los flujos de datos.

Image of how to build a dimensional model using dataflows.

Centralización de la preparación de datos y reutilización de modelos semánticcos en varias soluciones de Power BI

Si varias soluciones de Power BI utilizan la misma versión transformada de una tabla, el proceso para crear la tabla se repetirá varias veces. Esto aumenta la carga en el sistema de origen, consume más recursos y crea datos duplicados con varios puntos de error. En su lugar, se puede crear un único flujo de datos para calcular los datos de todas las soluciones. Después, Power BI puede reutilizar el resultado de la transformación en todas las soluciones. El flujo de datos, si se utiliza de tal manera, puede formar parte de una arquitectura de implementación sólida de Power BI que evite los duplicados de código de Power Query y reduzca los costes de mantenimiento de la capa de integración de datos.

Image of how tables can be reused across multiple solutions.

Pasos siguientes

En los artículos siguientes se proporcionan materiales de estudio adicionales para los flujos de datos.