Creación y uso de flujos de datos en Microsoft Power Platform

El uso de flujos de datos con Microsoft Power Platform facilita la preparación de datos y le permite reutilizar el trabajo de preparación de datos en informes, aplicaciones y modelos posteriores.

En un mundo de datos en constante expansión, la preparación de los mismos puede resultar difícil y costosa. Puede consumir entre el 60 y el 80 por ciento del tiempo y el coste de un proyecto típico de análisis. Estos proyectos pueden requerir la limpieza y transformación de datos fragmentados e incompletos, la integración de sistemas complejos, datos con incoherencias estructurales y una gran barrera de conocimientos.

Para facilitar la preparación de datos y ayudarle a obtener más valor de sus datos, se crearon los flujos de datos Power Query y Power Platform.

Screenshot showing how to select the Power Platform Dataflows connector.

Con los flujos de datos, Microsoft lleva las capacidades de preparación de datos de autoservicio de Power Query a los servicios en línea Power BI y Power Apps, y amplía las capacidades existentes de las siguientes maneras:

  • Preparación de datos de autoservicio para macrodatos con flujos de datos: los flujos de datos se pueden usar para ingerir, limpiar, transformar, integrar, enriquecer y esquematizar datos de una matriz grande y cada vez mayor de orígenes transaccionales y de observación, que abarcan toda la lógica de preparación de datos. Anteriormente, la lógica de extracción, transformación y carga (ETL) solo se podía incluir dentro de los modelos semánticos de Power BI, copiados entre modelos semánticos y enlazados a la configuración de administración de modelos semánticos.

    Con los flujos de datos, la lógica ETL se eleva a un artefacto de primera clase dentro de los servicios de Microsoft Power Platform e incluye experiencias dedicadas de creación y gestión. Los analistas de negocio, los profesionales de BI y los científicos de datos pueden utilizar los flujos de datos para gestionar los retos más complejos de preparación de datos y basarse en el trabajo de los demás, gracias a un revolucionario motor de cálculo basado en modelos. Este motor se encarga de toda la lógica de transformación y dependencia, reduciendo el tiempo, el coste y la experiencia a una fracción de lo que tradicionalmente se requería para esas tareas. Puede crear flujos de datos mediante la experiencia conocida de preparación de datos de autoservicio de Power Query. Los flujos de datos se crean y administran fácilmente en áreas de trabajo o entornos de aplicaciones, en Power BI o Power Apps, respectivamente, disfrutando de todas las funcionalidades que estos servicios tienen que ofrecer, como la administración de permisos y las actualizaciones programadas.

  • Carga de datos en Dataverse o Azure Data Lake Storage: en función de su caso de uso, puede almacenar los datos preparados por flujos de datos de Power Platform en la cuenta de Azure Data Lake Storage de la organización:

    • Dataverse le permite almacenar y administrar de manera segura los datos que las aplicaciones empresariales usan. Los datos de Dataverse se almacenan en un conjunto de tablas. Una tabla es un conjunto de filas (antes denominadas registros) y columnas (antes denominadas campos / atributos). Cada columna de la tabla está diseñada para almacenar un cierto tipo de datos, por ejemplo, nombre, edad, salario, etc. Dataverse incluye un conjunto básico de tablas estándar que engloba los escenarios típicos, aunque también puede crear tablas personalizadas específicas de su organización y rellenarlas con datos utilizando flujos de datos. Después, los creadores de aplicaciones pueden usar Power Apps y Power Automate para crear aplicaciones que empleen estos datos.

    • Azure Data Lake Storage le permite colaborar con personas de su organización mediante Power BI, Azure Data y servicios de IA, o mediante el uso de aplicaciones de línea de negocios personalizadas que leen datos del lago. Los flujos de datos que cargan datos en una cuenta de Azure Data Lake Storage almacenan datos en carpetas de Common Data Model. Las carpetas de Common Data Service contienen datos y metadatos esquematizados en un formato estandarizado para facilitar el intercambio de datos y permitir una interoperabilidad completa entre los servicios que producen o consumen datos almacenados en la cuenta de Azure Data Lake Storage de una organización como capa de almacenamiento compartido.

  • Análisis avanzado e IA con Azure: los flujos de datos de Power Platform almacenan datos en Dataverse o Azure Data Lake Storage, lo que significa que los datos ingeridos a través de flujos de datos ahora están disponibles para ingenieros de datos y científicos de datos para aplicar toda la eficacia de Azure Data Services, como Azure Machine Learning, Azure Databricks y Azure Synapse Analytics para análisis avanzados e IA. Esto permite a analistas de negocio, ingenieros de datos y científicos de datos colaborar en los mismos datos dentro de su organización.

  • Compatibilidad con Common Data Model: Common Data Model es un conjunto de esquemas de datos estandarizados y un sistema de metadatos para permitir la coherencia de los datos y su significado en aplicaciones y procesos empresariales. Los flujos de datos admiten Common Data Model porque ofrecen una asignación sencilla de los datos de cualquier forma en las tablas estándar de Common Data Model, como Account y Contact. Los flujos de datos también llegan a los datos, tanto las tablas estándar como las personalizadas, en el formulario Common Data Model esquematizado. Los analistas de negocio pueden aprovechar el esquema estándar y su coherencia semántica o personalizar sus tablas en función de sus necesidades únicas. Common Data Model sigue evolucionando como parte de la Open Data Initiative.

Capacidades de flujo de datos en los servicios de Microsoft Power Platform

La mayoría de las capacidades de flujo de datos están disponibles en Power Apps y Power BI. Los flujos de datos están disponibles como parte de los planes de estos servicios. Algunas características de los flujos de datos son específicas del producto o están disponibles en diferentes planes de producto. En la tabla siguiente se describen las características de los flujos de datos y su disponibilidad.

Capacidad del flujo de datos Power Apps Power BI
Actualización programada Hasta 48 al día Hasta 48 al día
Tiempo máximo de actualización por tabla Hasta 2 horas Hasta 2 horas
Creación de flujos de datos con Power Query Online
Administración de flujos de datos En el portal de administración de Power Apps En el portal de administración de Power BI
Nuevos conectores
Esquema estandarizado, compatibilidad integrada para Common Data Model
Conector de datos de flujos de datos en Power BI Desktop Para flujos de datos con Azure Data Lake Storage como destino
Integración con Azure Data Lake Storage de la organización
Integración con Dataverse No
Tablas vinculadas de flujo de datos Para flujos de datos con Azure Data Lake Storage como destino
Tablas calculadas (transformaciones en el almacenamiento mediante M) Para flujos de datos con Azure Data Lake Storage como destino Power BI Premium solo
Actualización incremental de flujos de datos Para los flujos de datos con Azure Data Lake Storage como destino, requiere Power Apps Plan2 Power BI Premium solo
Ejecución en la capacidad de Power BI Premium/ejecución paralela de transformaciones No

Limitaciones conocidas

Pasos siguientes

Más información sobre los flujos de datos en Power Apps:

Más información sobre los flujos de datos en Power BI:

En los siguientes artículos se ofrecen más detalles sobre escenarios de uso común de los flujos de datos.

Para obtener más información sobre Common Data Model y el estándar de carpetas de Common Data Model, lea los artículos siguientes: