Compartir vía


Introducción a Copilot para ciencia de datos e ingeniería de datos (versión preliminar)

Importante

Esta característica se encuentra en versión preliminar.

Copilot para ciencia de datos e ingeniería de datos es un asistente de inteligencia artificial que facilita el análisis y la visualización de datos. Funciona con tablas y archivos de almacén de lago, conjuntos de datos de Power BI y dataframes de Pandas, Spark y Fabric, y proporciona respuestas y fragmentos de código directamente en el cuaderno. La forma más eficaz de usar Copilot es agregar los datos como dataframe. Puede formular sus preguntas en el panel de chat y la inteligencia artificial le proporciona respuestas o código para que lo copie en el cuaderno. Comprende el esquema y los metadatos de sus datos y, si los datos se han cargado en un dataframe, también tiene conocimiento de los datos que contiene el dataframe. Puede pedirle a Copilot que proporcione conclusiones sobre los datos, cree código para visualizaciones o proporcione código para transformaciones de datos, y él reconoce los nombres de archivo para facilitar la consulta. Copilot simplifica el análisis de datos porque elimina la programación compleja..

Nota:

Introducción a Copilot para ciencia de datos e ingeniería de datos para ciencia de datos en Fabric

Con Copilot para ciencia de datos e ingeniería de datos, puede chatear con un asistente de inteligencia artificial que le ayude con las tareas de análisis y visualización de datos. Puede hacerle preguntas a Copilot sobre tablas de almacén de lago, conjuntos de datos de Power BI o elementos dataframe de Pandas y Spark en cuadernos. Copilot responde en lenguaje natural o con fragmentos de código. Copilot también puede generar código específico de los datos, en función de la tarea. Por ejemplo, Copilot para ciencia de datos e ingeniería de datos puede generar código para lo siguiente:

  • Creación de gráficos
  • Filtrado de datos
  • Aplicación de transformaciones
  • Modelos de Machine Learning

En primer lugar, seleccione el icono de Copilot en la cinta del cuaderno. Se abre el panel de chat de CoCopilot pilot y aparece una nueva celda al principio del cuaderno. Esta celda debe ejecutarse cada vez que se carga una sesión de Spark en un cuaderno de Fabric. De lo contrario, la experiencia con Copilot no funcionará correctamente. Estamos en proceso de evaluar otros mecanismos para controlar esta inicialización necesaria en futuras versiones.

Captura de pantalla en la que se muestra la cinta de Copilot.

Ejecute la celda al principio del cuaderno. Una vez que se ha ejecutado correctamente la celda, puede usar Copilot. Debe volver a ejecutar la celda al principio del cuaderno cada vez que cierre sesión en él.

Captura de pantalla en la que se muestra la ejecución correcta de la celda.

Para maximizar la eficacia de Copilot , cargue una tabla o un conjunto de datos como un dataframe en el cuaderno. De este modo, la inteligencia artificial puede acceder a los datos y comprender su estructura y contenido. A continuación, empiece a chatear con la inteligencia artificial. Seleccione el icono de chat en la barra de herramientas del cuaderno y escriba una pregunta o solicitud en el panel de chat. Por ejemplo, puede preguntar lo siguiente:

  • "¿Cuál es la edad media de los clientes de este conjunto de datos?"
  • "Muéstrame un gráfico de barras de las ventas por región"

Y muchos más. Copilot devuelve la respuesta o el código, que puede copiar y pegar en el cuaderno. Copilot para ciencia de datos e ingeniería de datos es una manera cómoda e interactiva de explorar y analizar datos.

Mientras utiliza Copilot, puede invocar también comandos magic dentro de una celda del cuaderno para obtener la salida directamente en el cuaderno. Por ejemplo, para obtener respuestas en lenguaje natural, puede formular preguntas con el comando "%%chat", por ejemplo:

%%chat
What are some machine learning models that may fit this dataset?

Captura de pantalla en la que se muestra la generación de código.

o

%%code
Can you generate code for a logistic regression that fits this data?

Captura de pantalla en la que se muestra la generación de código de regresión logística.

Copilot para ciencia de datos e ingeniería de datos también tiene conocimiento del esquema y los metadatos de las tablas del almacén de lago. Copilot puede proporcionar información pertinente en el contexto de los datos de un almacén de lago conectado. Por ejemplo, puede preguntar lo siguiente:

  • "¿Cuántas tablas hay en el almacén de lago?"
  • "¿Qué columnas tiene la tabla Clientes?"

Copilot responde con la información pertinente si ha agregado el almacén de lago al cuaderno. Copilot también tiene conocimiento de los nombres de los archivos agregados a cualquier almacén de lago conectado al cuaderno. En el chat, puede referirse a esos archivos por su nombre. Por ejemplo, si tiene un archivo denominado sales.csv en el almacén de lago, puede pedirle "Crea un dataframe a partir de sales.csv". Copilot genera el código y lo muestra en el panel de chat. Con Copilot para cuadernos, puede acceder a los datos de diferentes orígenes y consultarlos fácilmente. No necesita la sintaxis exacta del comando para hacerlo.

Sugerencias

  • "Borre" la conversación en el panel de chat de Copilot con la escoba de la parte superior del panel. Copilot retiene el conocimiento de las entradas o salidas que se producen durante la sesión, lo que resulta muy útil si el contenido actual le distrae.
  • Use la biblioteca de comandos magic del chat para configurar las opciones de Copilot, incluida la configuración de la privacidad. El modo de uso compartido predeterminado está diseñado para maximizar el uso compartido de contexto al que Copilot tiene acceso, por lo que limitar la información proporcionada a Copilot puede afectar directamente y de forma considerable a la relevancia de sus respuestas.
  • Cuando Copilot se inicia por primera vez, muestra un conjunto de preguntas útiles que pueden ayudarle a empezar. Pueden ayudar a iniciar la conversación con Copilot. Si desea consultar esas solicitudes más adelante, use el botón de destello de la parte inferior del panel de chat.
  • Puede "arrastrar" la barra lateral del chat de Copilot para expandir el panel de chat y ver el código con más claridad o mejorar la legibilidad de las salidas en la pantalla.

Limitaciones

Las características de Copilot en la experiencia de ciencia de datos están actualmente limitadas a cuadernos. Estas características incluyen el panel de chat de Copilot, los comandos magic de IPython que se pueden usar dentro de una celda de código y las sugerencias automáticas de código mientras escribe en una celda de código. Copilot también puede leer modelos semánticos de Power BI mediante una integración del vínculo semántico.

Copilot tiene dos usos previstos clave:

  • Uno, puede pedir a Copilot que examine y analice datos en el cuaderno (por ejemplo, si carga primero un elemento DataFrame y, después, pregunta a Copilot sobre los datos dentro del elemento DataFrame).
  • Dos, puede pedir a Copilot que genere una serie de sugerencias sobre el proceso de análisis de datos, como qué modelos predictivos podrían ser relevantes, código para realizar diferentes tipos de análisis de datos y documentación para un cuaderno completado.

Tenga en cuenta que la generación de código con bibliotecas rápidas o publicadas recientemente puede incluir inexactitudes o errores.