Nota
L'accés a aquesta pàgina requereix autorització. Pots provar d'iniciar sessió o canviar de directori.
L'accés a aquesta pàgina requereix autorització. Pots provar de canviar directoris.
Los flujos de datos son una herramienta basada en la nube que le ayuda a preparar y transformar datos sin escribir código. Proporcionan una interfaz de bajo código para incorporar datos de cientos de fuentes de datos, transformar tus datos mediante más de 300 transformaciones, y cargar los datos resultantes en múltiples destinos. Piense en ellos como su asistente de datos personales que puede conectarse a cientos de orígenes de datos diferentes, limpiar datos desordenados y entregarlos exactamente donde lo necesite. Tanto si es un desarrollador ciudadano como profesional, los flujos de datos le permiten disfrutar de una experiencia de integración de datos moderna para ingerir, preparar y transformar datos de un amplio conjunto de orígenes de datos, como bases de datos, almacenamiento de datos, Lakehouse, datos en tiempo real, etc.
Dataflow Gen2 es la versión más reciente y eficaz que funciona junto con el flujo de datos de Power BI original (ahora denominado Gen1). Creado con la conocida experiencia de Power Query que está disponible en varios productos y servicios de Microsoft, como Excel, Power BI, Power Platform y Dynamics 365, Dataflow Gen2 proporciona características mejoradas, un mejor rendimiento y funcionalidades de copia rápidas para ingerir y transformar datos rápidamente. Si está comenzando desde cero, te recomendamos Dataflow Gen2 por sus características avanzadas y un mejor rendimiento.
¿Qué puede hacer con los flujos de datos?
Con flujos de datos, puede hacer lo siguiente:
- Conectarse a los datos: extraiga información de bases de datos, archivos, servicios web, etc.
- Transformar los datos: limpie, filtre, combine y vuelva a dar forma a los datos mediante una interfaz visual.
- Cargar datos en cualquier lugar: envíe los datos transformados a bases de datos, almacenes de datos o almacenamiento en la nube.
- Automatice el proceso: configure programaciones para que los datos permanezcan actualizados y up-to-date.
Características de flujo de datos
Estas son las características disponibles entre Dataflow Gen2 y Gen1:
| Característica | Flujo de datos Gen2 | Flujo de datos Gen1 |
|---|---|---|
| Creación de flujos de datos con Power Query | ✓ | ✓ |
| Proceso de creación más sencillo | ✓ | |
| Guardado automático y publicación en segundo plano | ✓ | |
| Varios destinos de salida | ✓ | |
| Mejor supervisión y seguimiento de actualizaciones | ✓ | |
| Trabaja con tuberías | ✓ | |
| Informática de alto rendimiento | ✓ | |
| Conexión mediante el conector de flujo de datos | ✓ | ✓ |
| Direct Query a través del conector de flujo de datos | ✓ | |
| Actualizar solo los datos modificados | ✓ | ✓ |
| Información basada en inteligencia artificial | ✓ | ✓ |
Actualizaciones a Dataflow Gen2
En las secciones siguientes se muestran algunas de las mejoras clave de Dataflow Gen2 en comparación con Gen1 para facilitar y mejorar la eficacia de las tareas de preparación de datos.
Gen2 es más fácil de crear y usar
Dataflow Gen2 se siente familiar si ha usado Power Query antes. Hemos simplificado el proceso para que pueda ponerse en marcha más rápido. Se le guiará paso a paso al obtener datos en el flujo de datos y hemos reducido el número de pasos necesarios para crear los flujos de datos.
Auto Guardado mantiene tu trabajo seguro
Dataflow Gen2 guarda automáticamente los cambios mientras trabaja. Puede alejarse del equipo, cerrar el navegador o perder la conexión a Internet sin preocuparse por perder el progreso. Cuando vuelves, todo está justo donde lo dejaste.
Una vez que haya terminado de compilar el flujo de datos, puede publicar los cambios. La publicación guarda su trabajo y realiza validaciones en segundo plano, por lo que usted no tiene que esperar a que todo se verifique antes de pasar a la siguiente tarea.
Para más información sobre cómo funciona el proceso de guardado, consulte Guardar un borrador del dataflow.
Envío de datos donde quiera que lo necesite
Aunque Dataflow Gen1 almacena datos transformados en su propio almacenamiento interno (al que puede acceder a través del conector de flujo de datos), Dataflow Gen2 le ofrece la flexibilidad de usar ese almacenamiento o enviar los datos a diferentes destinos.
Esta flexibilidad abre nuevas posibilidades. Por ejemplo, puede hacer lo siguiente:
- Uso de un flujo de datos para cargar datos en una instancia de LakeHouse y, a continuación, analizarlos con un cuaderno
- Cargar datos en una base de datos de Azure SQL y, a continuación, usar una canalización para moverlos a un almacenamiento de datos
Dataflow Gen2 admite actualmente estos destinos:
- Bases de datos de Azure SQL
- Azure Data Explorer (Kusto)
- Azure Datalake Gen2 (versión preliminar)
- Tablas de Fabric Lakehouse
- Fabric Lakehouse Files (versión preliminar)
- Fabric Warehouse
- Base de datos de KQL en Fabric
- Base de datos SQL en Fabric
- Archivos de SharePoint
Para obtener más información sobre los destinos de datos disponibles, consulte Destinos de datos de Dataflow Gen2 y configuración administrada.
Mejor supervisión y seguimiento de actualizaciones
Dataflow Gen2 proporciona una imagen más clara de lo que sucede con las actualizaciones de datos. Hemos integrado con el Centro de supervisión y mejorado la experiencia del historial de actualizaciones , por lo que puede realizar un seguimiento del estado y el rendimiento de los flujos de datos.
Funciona perfectamente con canalizaciones
Las canalizaciones permiten agrupar las actividades para completar tareas más grandes. Piense en ellos como flujos de trabajo que pueden copiar datos, ejecutar consultas SQL, ejecutar procedimientos almacenados o ejecutar cuadernos de Python.
Puede conectar varias actividades en una canalización y establecerla para que se ejecute según una programación. Por ejemplo, cada lunes podría usar una canalización para extraer datos de un blob de Azure y limpiarlos y, a continuación, desencadenar un flujo de datos Gen2 para analizar los datos de registro. O bien, al final del mes, podría copiar datos de un blob de Azure en una base de datos de Azure SQL y, a continuación, ejecutar un procedimiento almacenado en esa base de datos.
Para más información sobre cómo conectar flujos de datos con canalizaciones, consulte actividades de flujo de datos.
Informática de alto rendimiento
Dataflow Gen2 usa motores de proceso avanzados de SQL Compute Fabric para controlar grandes cantidades de datos de forma eficaz. Para que esto funcione, Dataflow Gen2 crea elementos de Lakehouse y Warehouse en el área de trabajo y los usa para almacenar y acceder a los datos, lo que mejora el rendimiento de todos los flujos de datos.
Copilot para Dataflow Gen2
Dataflow Gen2 se integra con Microsoft Copilot en Fabric para proporcionar asistencia con tecnología de inteligencia artificial para crear soluciones de integración de datos mediante avisos de lenguaje natural. Copilot le ayuda a simplificar el proceso de desarrollo del flujo de datos al permitirle usar el lenguaje conversacional para realizar transformaciones y operaciones de datos.
- Obtener datos de fuentes: Usa la instrucción inicial "Obtener datos de" para conectarte a diversas fuentes de datos, como OData, bases de datos y archivos.
-
Transformación de datos con lenguaje natural: aplique transformaciones mediante avisos conversacionales como:
- "Solo mantener a los clientes europeos"
- "Contar el número total de empleados por ciudad"
- "Mantener solo pedidos cuyas cantidades están por encima del valor medio"
- Creación de datos de ejemplo: uso de Azure OpenAI para generar datos de ejemplo para pruebas y desarrollo
- Operaciones de deshacer: escriba o seleccione "Deshacer" para eliminar el último paso aplicado.
- Validar y revisar: cada acción de Copilot aparece como una tarjeta de respuesta con los pasos correspondientes en la lista Pasos aplicados
Para obtener más información, consulte Copilot para Dataflow Gen2.
¿Qué necesita para usar flujos de datos?
Dataflow Gen2 requiere una capacidad de Fabric, una capacidad de prueba de Fabric o una capacidad de Power BI Premium. Para comprender cómo funcionan las licencias para flujos de datos, consulte conceptos y licencias de Microsoft Fabric.
Traslado de Dataflow Gen1 a Gen2
Si ya tiene flujos de datos creados con Gen1, no se preocupe: puede migrarlos fácilmente a Gen2. Tenemos varias opciones para ayudarle a realizar el cambio:
- Exportación e importación de las consultas
- Copiar y pegar en Power Query
- Uso de la característica Guardar como
Exportación e importación de las consultas
Puede exportar las consultas de Dataflow Gen1 y guardarlas en un archivo PQT y, a continuación, importarlas en Dataflow Gen2. Para obtener instrucciones paso a paso, consulte Uso de la característica de plantilla de exportación.
Copiar y pegar en Power Query
Si tiene un flujo de datos en Power BI o Power Apps, puede copiar las consultas y pegarlas en el editor de Dataflow Gen2. Este enfoque le permite migrar sin tener que recompilar las consultas desde cero. Más información: Copie y pegue las consultas existentes de Dataflow Gen1.
Uso de la característica Guardar como
Si ya tiene algún tipo de flujo de datos (Gen1, Gen2 o Gen2 CI/CD), Data Factory ahora incluye una característica Guardar como. Esto le permite guardar cualquier flujo de datos existente como un nuevo elemento de Flujo de datos Gen2 (CI/CD) con una sola acción. Más detalles: Migración a Dataflow Gen2 (CI/CD) mediante Guardar como.
Contenido relacionado
¿Quiere aprender algo nuevo? Consulte estos recursos útiles:
- Supervisión de los flujos de datos : seguimiento del historial y el rendimiento de las actualizaciones
- Guardar borradores mientras trabaja : obtenga información sobre la característica de autoguardado.
- Migración de Gen1 a Gen2 : guía de migración paso a paso