Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Dataflow Gen2 es la nueva generación de flujos de datos. La nueva generación de flujos de datos reside junto con el flujo de datos de Power BI (Gen1) y aporta nuevas características y experiencias mejoradas. En la sección siguiente se proporciona una comparación entre Dataflow Gen1 y Dataflow Gen2.
Introducción a las características
Característica | Flujo de datos Gen2 | Flujo de datos Gen1 |
---|---|---|
Creación de flujos de datos con Power Query | ✓ | ✓ |
Flujo de creación más corto | ✓ | |
Guardado automático y publicación en segundo plano | ✓ | |
Destinos de datos | ✓ | |
Supervisión y historial de actualizaciones mejorados | ✓ | |
Integración con canalizaciones de datos | ✓ | |
Computación a gran escala | ✓ | |
Obtención de datos mediante el conector de flujos de datos | ✓ | ✓ |
Consulta Directa a través del conector de flujos de datos | ✓ | |
Actualización incremental | ✓ | ✓ |
Compatibilidad con AI Insights | ✓ |
Una experiencia de redacción más corta
Trabajar con Dataflow Gen2 se siente como volver a casa. Hemos mantenido la experiencia completa de Power Query a la que estás acostumbrado en los flujos de datos de Power BI. Cuando ingresas a la experiencia, se te guiará paso a paso para introducir los datos en tu flujo de datos. También acortamos la experiencia de creación para reducir el número de pasos necesarios para crear flujos de datos y agregamos algunas características nuevas para mejorar aún más la experiencia.
Nueva experiencia de guardado de flujo de datos
Con Dataflow Gen2, hemos cambiado cómo funciona el guardado de un flujo de datos. Los cambios realizados en un flujo de datos se guardan automáticamente en la nube. Por lo tanto, puede salir de la experiencia de creación en cualquier momento y continuar desde donde la dejó en un momento posterior. Una vez que haya terminado de crear el flujo de datos, publique los cambios y esos cambios se usen cuando se actualice el flujo de datos. Además, la publicación del flujo de datos guarda los cambios y ejecuta validaciones que se deben realizar en segundo plano. Esta característica le permite guardar el flujo de datos sin tener que esperar a que finalice la validación.
Para más información sobre la nueva experiencia de guardado, vaya a Guardar un borrador del flujo de datos.
Destinos de datos
De forma similar a Dataflow Gen1, Dataflow Gen2 permite transformar los datos en el almacenamiento interno o provisional de Dataflow, donde se puede acceder a los datos mediante el conector de Dataflow. Dataflow Gen2 también permite especificar un destino de datos para los datos. Con esta característica, ahora puede separar la lógica ETL y el almacenamiento de destino. Esta característica le beneficia de muchas maneras. Por ejemplo, ahora puede usar un flujo de datos para cargar datos en un almacén de datos en el lago y luego usar un cuaderno para analizar los datos. También puede usar un flujo de datos para cargar datos en una base de datos de Azure SQL y, a continuación, usar una canalización de datos para cargar los datos en un almacenamiento de datos.
En Dataflow Gen2, hemos agregado compatibilidad con los siguientes destinos y muchas más próximamente:
- Fabric Lakehouse
- Azure Data Explorer (Kusto)
- Azure Synapse Analytics (SQL DW)
- Azure SQL Database
Nota:
Para cargar tus datos en Fabric Warehouse, puedes usar el conector de Azure Synapse Analytics (SQL DW) obteniendo la cadena de conexión SQL. Más información: Conectividad con el almacenamiento de datos en Microsoft Fabric
Nuevo historial de actualización y supervisión
Con Dataflow Gen2, presentamos una nueva manera de supervisar las actualizaciones del flujo de datos. Integramos la compatibilidad con el Centro de supervisión y proporcionamos a nuestra experiencia de historial de actualizaciones una actualización importante.
Integración con canalizaciones de datos
Las canalizaciones de datos permiten agrupar actividades que realizan una tarea. Una actividad es una unidad de trabajo que se puede ejecutar. Por ejemplo, una actividad puede copiar datos de una ubicación a otra, ejecutar una consulta SQL, ejecutar un procedimiento almacenado o ejecutar un cuaderno de Python.
Una canalización puede contener una o varias actividades conectadas por dependencias. Por ejemplo, puede usar una canalización para ingerir y limpiar datos de un blob de Azure y, a continuación, iniciar un flujo de datos Gen2 para analizar los datos de registro. También puede usar una canalización para copiar datos de un blob de Azure en una base de datos de Azure SQL y, a continuación, ejecutar un procedimiento almacenado en la base de datos.
Guardar como borrador
Con Dataflow Gen2, presentamos una experiencia sin preocupaciones eliminando la necesidad de publicar para guardar los cambios. Con guardar como funcionalidad de borrador, almacenamos una versión de borrador del flujo de datos cada vez que realice un cambio. ¿Perdiste la conectividad a Internet? ¿Has cerrado accidentalmente tu navegador? No te preocupes; te respaldamos. Una vez que regrese a su flujo de datos, los cambios recientes seguirán ahí y puede continuar donde lo dejó. Este proceso es una experiencia sin problemas y no requiere ninguna entrada de usted. Esta característica le permite trabajar en el flujo de datos sin tener que preocuparse de perder los cambios o tener que corregir todos los errores de consulta antes de poder guardar los cambios. Para más información sobre esta característica, vaya a Guardar un borrador del flujo de datos.
Computación a gran escala
De forma similar a Dataflow Gen1, Dataflow Gen2 también incluye un motor de proceso mejorado para mejorar el rendimiento de ambas transformaciones de consultas a las que se hace referencia y obtener escenarios de datos. Para ello, Dataflow Gen2 crea elementos de Lakehouse y Warehouse en el área de trabajo y los usa para almacenar y acceder a los datos para mejorar el rendimiento de todos los flujos de datos.
Licenciamiento de Dataflow Gen1 frente a Gen2
Dataflow Gen2 es la nueva generación de flujos de datos que residen junto con el flujo de datos de Power BI (Gen1) y aporta nuevas características y experiencias mejoradas. Requiere una capacidad de Fabric o una capacidad de prueba de Fabric. Para comprender mejor cómo funcionan las licencias para flujos de datos, puede leer el siguiente artículo: Conceptos y licencias de Microsoft Fabric
Pruebe Dataflow Gen2 mediante la reutilización de las consultas de Dataflow Gen1
Probablemente tenga muchas consultas de Dataflow Gen1 y se pregunte cómo puede probarlas en Dataflow Gen2. Tenemos algunas opciones para volver a crear los flujos de datos de Gen1 como Dataflow Gen2.
Exportar las consultas de Dataflow Gen1 e importarlas en Dataflow Gen2
Ahora puede exportar consultas en las experiencias de creación de Dataflow Gen1 y Gen2 y guardarlas en un archivo PQT que puede importar a Dataflow Gen2. Para obtener más información, vaya a Usar la característica de plantilla de exportación.
Copiar y pegar en Power Query
Si tienes un flujo de datos en Power BI o Power Apps, puedes copiar las consultas y pegarlas en el editor de tu flujo de datos Gen2. Esta funcionalidad le permite migrar el flujo de datos a Gen2 sin tener que volver a escribir las consultas. Para obtener más información, vaya a Copiar y pegar consultas existentes de Dataflow Gen1.
Migración a Dataflow Gen2 (CI/CD) mediante Guardar como
Si ya tiene Dataflow Gen1, Dataflow Gen2 o Dataflow Gen2 (CI/CD), Data Factory en Microsoft Fabric ahora incluye una nueva función "Guardar como". Esta característica le permite realizar un solo gesto para guardar cualquiera de estos tipos de flujos de datos existentes como un nuevo elemento de Flujo de datos Gen2 (CI/CD). Para obtener más información, vaya a Migrar a Dataflow Gen2 (CI/CD) mediante Guardar como.