Uso de Copilot con Dataflow Gen2 de Microsoft Fabric

Completado

La integración de datos es fundamental para Contoso Health para consolidar la información de varios orígenes. Dataflow Gen2 en Data Factory de Microsoft Fabric ofrece una interfaz visual para crear flujos de datos, lo que permite a los usuarios ingerir y transformar datos sin problemas. Con la integración de Copilot, los usuarios pueden emplear lenguaje natural para definir pasos de transformación de datos, lo que hace que el proceso ETL sea más intuitivo.

Imaginemos cómo Contoso Health combina datos estructurados, como encuestas de satisfacción de pacientes en un flujo de trabajo unificado, lo que permite un análisis y conclusiones más enriquecidos. Dataflow Gen2 de Microsoft Fabric, mejorado por Copilot, simplifica este proceso al permitir a los usuarios describir las transformaciones en lenguaje natural.

En lugar de centrarse en cada clic de botón, esta unidad explora cómo se desarrolla conceptualmente el proceso y por qué cada paso es importante para crear aptitudes en la transformación de datos.

Cómo funciona

Piense en el proceso como un ciclo de solicitud → salida → validación → refinamiento. Cada fase se basa en el último y los diferentes tipos de transformaciones ilustran este ciclo:

La ingesta de datos es el punto de partida. Sin datos, no hay nada que transformar. Es posible que empiece por generar registros de ejemplo para experimentar con transformaciones. Copilot puede generar tablas de ejemplo directamente y, como funcionalidad de vista previa, Copilot en el Asistente para obtener datos ahora también admite la ingesta de tablas usadas recientemente mediante lenguaje natural; puede describir filtros y transformaciones antes de cargar los datos. Este es un ejemplo de solicitud para generar datos de ejemplo:

Create a new query with 50 patient records including patient-id, age, gender, and satisfaction-score.

Este es un ejemplo de lo que Copilot podría generar:

A continuación, asegúrese de que los datos se almacenan en los formatos correctos. Los tipos de datos correctos impiden errores en los cálculos y hacen que los pasos posteriores sean más confiables. Si lo desea, puede combinar varias transformaciones de tipo de datos a la vez, como en el ejemplo de indicación siguiente:

Change Age and SatisfactionScore to numbers; set Department as text.

Dar forma a los datos a menudo significa agregar nuevos campos que facilitan la interpretación del conjunto de datos. Los valores derivados, como grupos de edad o categorías, pueden admitir el análisis centrado en el negocio. Estos son dos mensajes de ejemplo que agregan una nueva columna, en función de alguna regla de clasificación que defina en lenguaje natural:

Add a new column AgeRange that groups patients into categories: 18–24 as Young Adults, 25–34 as Early Career, etc.
Create a flag column that marks patients with SatisfactionScore below 4 as AtRisk.

El filtrado limita el conjunto de datos a lo que más importa. La eliminación de registros ruidosos o irrelevantes mejora la calidad de los datos. Estos son dos avisos de ejemplo que filtran los datos según alguna regla que defina en lenguaje natural:

Remove rows where SatisfactionScore is less than 3.
Exclude records where Department is ENT.

A veces, los campos deben combinarse para simplificar el análisis. Por ejemplo, combinar un campo de fecha con un campo de hora evita la necesidad de combinaciones o búsquedas adicionales.

Merge DateOfVisit and HourOfVisit into a new column called VisitDateTime of type DateTime.

Por último, la iteración es clave. Después de cada transformación, revise los resultados y refine sus indicaciones si algo parece incorrecto. Este bucle ayuda a crear habilidades para articular instrucciones precisas y comprender cómo copilot las interpreta. A veces, puede ser tan fácil como indicar a Copilot qué hacer, como en el siguiente mensaje de ejemplo. También puede quitar un paso de transformación creado por Copilot y volver a enviar su indicación refinada.

The VisitDateTime field didn’t parse correctly—recreate it using the format yyyy-MM-dd HH:mm.

Explicación del código M

Copilot no solo ejecuta transformaciones; también explica el código mashup subyacente (M). Esta transparencia fomenta la confianza mostrando lo que sucede en segundo plano, ofrece una ruta gradual para aprender la sintaxis de consulta mientras se sigue trabajando en lenguaje natural, y promueve la reflexión a medida que se compara la intención con la lógica que genera.

Hay dos niveles de explicación disponibles:

  • Explicar esta consulta: obtenga una descripción de lenguaje simple de la consulta completa, incluidos todos los pasos aplicados. Desencadene esto desde el panel Copilot o haga clic con el botón derecho en una consulta en el panel Consultas y seleccione Describir.

    Describe this query
    
  • Explicar este paso: Obtenga una explicación de un solo paso de transformación. Haga clic con el botón derecho en cualquier paso de la lista Pasos aplicados y seleccione Explicar. Esto es especialmente útil cuando se quiere comprender una transformación de forma aislada en lugar de analizar toda la expresión M a la vez.

Procedimientos recomendados para trabajar con Copilot para Dataflow Gen2

  • Copilot está mejor equipado para controlar temas de integración de datos, por lo que es mejor limitar sus preguntas a esta área.
  • Comience sencillo. Pruebe una transformación cada vez antes de encadenar varios pasos.
  • Si incluye descripciones como nombres de consulta, nombres de columna y valores en la entrada, es más probable que Copilot genere salidas útiles.
  • Intente dividir entradas complejas en tareas más granulares. Esto ayuda a Copilot a comprender mejor sus requisitos y a generar una salida más precisa.
  • Valide después de cada paso revisando la tabla de salida.
  • Itere incrementalmente: trate a Copilot como un socio con el que mejora continuamente, no como un generador para un solo uso.
  • El marco solicita resultados claros (por ejemplo, "agregar una columna que agrupa edades") en lugar de comandos imprecisos.
  • Use las explicaciones de código para reforzar el aprendizaje y profundizar las aptitudes técnicas.
  • Compruebe periódicamente cómo Copilot interpreta las indicaciones para mejorar las expresiones y la claridad a lo largo del tiempo.