Compartir a través de


Transición de la Generación 1 del Flujo de Datos a la Generación 2

Dataflow Gen2 es la nueva generación de flujos de datos. La nueva generación de flujos de datos reside junto con el flujo de datos de Power BI (Gen1) y aporta nuevas características y experiencias mejoradas. En la sección siguiente se proporciona una comparación entre Dataflow Gen1 y Dataflow Gen2.

Introducción a las características

Característica Flujo de datos Gen2 Flujo de datos Gen1
Creación de flujos de datos con Power Query
Flujo de creación más corto
Guardado automático y publicación en segundo plano
Destinos de datos
Supervisión y historial de actualizaciones mejorados
Integración con canalizaciones de datos
Computación a gran escala
Obtención de datos mediante el conector de flujos de datos
Consulta Directa a través del conector de flujos de datos
Actualización incremental
Compatibilidad con AI Insights

Una experiencia de redacción más corta

Trabajar con Dataflow Gen2 se siente como volver a casa. Hemos mantenido la experiencia completa de Power Query a la que estás acostumbrado en los flujos de datos de Power BI. Cuando ingresas a la experiencia, se te guiará paso a paso para introducir los datos en tu flujo de datos. También acortamos la experiencia de creación para reducir el número de pasos necesarios para crear flujos de datos y agregamos algunas características nuevas para mejorar aún más la experiencia.

Captura de pantalla de la experiencia general de creación en flujos de datos.

Nueva experiencia de guardado de flujo de datos

Con Dataflow Gen2, hemos cambiado cómo funciona el guardado de un flujo de datos. Los cambios realizados en un flujo de datos se guardan automáticamente en la nube. Por lo tanto, puede salir de la experiencia de creación en cualquier momento y continuar desde donde la dejó en un momento posterior. Una vez que haya terminado de crear el flujo de datos, publique los cambios y esos cambios se usen cuando se actualice el flujo de datos. Además, la publicación del flujo de datos guarda los cambios y ejecuta validaciones que se deben realizar en segundo plano. Esta característica le permite guardar el flujo de datos sin tener que esperar a que finalice la validación.

Para más información sobre la nueva experiencia de guardado, vaya a Guardar un borrador del flujo de datos.

Destinos de datos

De forma similar a Dataflow Gen1, Dataflow Gen2 permite transformar los datos en el almacenamiento interno o provisional de Dataflow, donde se puede acceder a los datos mediante el conector de Dataflow. Dataflow Gen2 también permite especificar un destino de datos para los datos. Con esta característica, ahora puede separar la lógica ETL y el almacenamiento de destino. Esta característica le beneficia de muchas maneras. Por ejemplo, ahora puede usar un flujo de datos para cargar datos en un almacén de datos en el lago y luego usar un cuaderno para analizar los datos. También puede usar un flujo de datos para cargar datos en una base de datos de Azure SQL y, a continuación, usar una canalización de datos para cargar los datos en un almacenamiento de datos.

En Dataflow Gen2, hemos agregado compatibilidad con los siguientes destinos y muchas más próximamente:

  • Fabric Lakehouse
  • Azure Data Explorer (Kusto)
  • Azure Synapse Analytics (SQL DW)
  • Azure SQL Database

Nota:

Para cargar tus datos en Fabric Warehouse, puedes usar el conector de Azure Synapse Analytics (SQL DW) obteniendo la cadena de conexión SQL. Más información: Conectividad con el almacenamiento de datos en Microsoft Fabric

Captura de pantalla con los destinos de datos admitidos que se muestran.

Nuevo historial de actualización y supervisión

Con Dataflow Gen2, presentamos una nueva manera de supervisar las actualizaciones del flujo de datos. Integramos la compatibilidad con el Centro de supervisión y proporcionamos a nuestra experiencia de historial de actualizaciones una actualización importante.

Captura de pantalla que muestra los detalles de un estado de actualización.

Integración con canalizaciones de datos

Las canalizaciones de datos permiten agrupar actividades que realizan una tarea. Una actividad es una unidad de trabajo que se puede ejecutar. Por ejemplo, una actividad puede copiar datos de una ubicación a otra, ejecutar una consulta SQL, ejecutar un procedimiento almacenado o ejecutar un cuaderno de Python.

Una canalización puede contener una o varias actividades conectadas por dependencias. Por ejemplo, puede usar una canalización para ingerir y limpiar datos de un blob de Azure y, a continuación, iniciar un flujo de datos Gen2 para analizar los datos de registro. También puede usar una canalización para copiar datos de un blob de Azure en una base de datos de Azure SQL y, a continuación, ejecutar un procedimiento almacenado en la base de datos.

Captura de pantalla que muestra la integración con canalizaciones de datos.

Guardar como borrador

Con Dataflow Gen2, presentamos una experiencia sin preocupaciones eliminando la necesidad de publicar para guardar los cambios. Con guardar como funcionalidad de borrador, almacenamos una versión de borrador del flujo de datos cada vez que realice un cambio. ¿Perdiste la conectividad a Internet? ¿Has cerrado accidentalmente tu navegador? No te preocupes; te respaldamos. Una vez que regrese a su flujo de datos, los cambios recientes seguirán ahí y puede continuar donde lo dejó. Este proceso es una experiencia sin problemas y no requiere ninguna entrada de usted. Esta característica le permite trabajar en el flujo de datos sin tener que preocuparse de perder los cambios o tener que corregir todos los errores de consulta antes de poder guardar los cambios. Para más información sobre esta característica, vaya a Guardar un borrador del flujo de datos.

Computación a gran escala

De forma similar a Dataflow Gen1, Dataflow Gen2 también incluye un motor de proceso mejorado para mejorar el rendimiento de ambas transformaciones de consultas a las que se hace referencia y obtener escenarios de datos. Para ello, Dataflow Gen2 crea elementos de Lakehouse y Warehouse en el área de trabajo y los usa para almacenar y acceder a los datos para mejorar el rendimiento de todos los flujos de datos.

Licenciamiento de Dataflow Gen1 frente a Gen2

Dataflow Gen2 es la nueva generación de flujos de datos que residen junto con el flujo de datos de Power BI (Gen1) y aporta nuevas características y experiencias mejoradas. Requiere una capacidad de Fabric o una capacidad de prueba de Fabric. Para comprender mejor cómo funcionan las licencias para flujos de datos, puede leer el siguiente artículo: Conceptos y licencias de Microsoft Fabric

Pruebe Dataflow Gen2 mediante la reutilización de las consultas de Dataflow Gen1

Probablemente tenga muchas consultas de Dataflow Gen1 y se pregunte cómo puede probarlas en Dataflow Gen2. Tenemos algunas opciones para volver a crear los flujos de datos de Gen1 como Dataflow Gen2.

  • Exportar las consultas de Dataflow Gen1 e importarlas en Dataflow Gen2

    Ahora puede exportar consultas en las experiencias de creación de Dataflow Gen1 y Gen2 y guardarlas en un archivo PQT que puede importar a Dataflow Gen2. Para obtener más información, vaya a Usar la característica de plantilla de exportación.

  • Copiar y pegar en Power Query

    Si tienes un flujo de datos en Power BI o Power Apps, puedes copiar las consultas y pegarlas en el editor de tu flujo de datos Gen2. Esta funcionalidad le permite migrar el flujo de datos a Gen2 sin tener que volver a escribir las consultas. Para obtener más información, vaya a Copiar y pegar consultas existentes de Dataflow Gen1.

  • Migración a Dataflow Gen2 (CI/CD) mediante Guardar como

    Si ya tiene Dataflow Gen1, Dataflow Gen2 o Dataflow Gen2 (CI/CD), Data Factory en Microsoft Fabric ahora incluye una nueva función "Guardar como". Esta característica le permite realizar un solo gesto para guardar cualquiera de estos tipos de flujos de datos existentes como un nuevo elemento de Flujo de datos Gen2 (CI/CD). Para obtener más información, vaya a Migrar a Dataflow Gen2 (CI/CD) mediante Guardar como.