Introducción a Copilot para ciencia de datos e ingeniería de datos (versión preliminar)
Importante
Esta característica se encuentra en versión preliminar.
Copilot para ciencia de datos e ingeniería de datos es un asistente de inteligencia artificial que facilita el análisis y la visualización de datos. Funciona con tablas y archivos de almacén de lago, conjuntos de datos de Power BI y dataframes de Pandas, Spark y Fabric, y proporciona respuestas y fragmentos de código directamente en el cuaderno. La forma más eficaz de usar Copilot es agregar los datos como dataframe. Puede formular sus preguntas en el panel de chat y la inteligencia artificial le proporciona respuestas o código para que lo copie en el cuaderno. Comprende el esquema y los metadatos de sus datos y, si los datos se han cargado en un dataframe, también tiene conocimiento de los datos que contiene el dataframe. Puede pedirle a Copilot que proporcione conclusiones sobre los datos, cree código para visualizaciones o proporcione código para transformaciones de datos, y él reconoce los nombres de archivo para facilitar la consulta. Copilot simplifica el análisis de datos porque elimina la programación compleja..
Nota:
- El administrador debe habilitar el modificador de inquilino antes de empezar a usar Copilot. Para más información, vea el artículo Configuración de inquilinos de Copilot.
- La capacidad F64 o P1 debe estar en una de las regiones enumeradas en este artículo, disponibilidad regional de Fabric.
- Si el inquilino o la capacidad están fuera de EE. UU. o Francia, Copilot está deshabilitado de manera predeterminada, a menos que el administrador de inquilinos de Fabric habilite la configuración de inquilino Los datos enviados a Azure OpenAI se puedan procesar fuera de la región geográfica del inquilino, los límites de cumplimiento o la instancia de nube nacional en el portal de administración de Fabric.
- Copilot en Microsoft Fabric no se admite en las SKU de prueba. Solo se admiten SKU de pago (F64 o superior, o P1 o superior).
- Actualmente, Copilot en Fabric se va a implementar en versión preliminar pública y se espera que esté disponible para todos los clientes a finales de marzo de 2024.
- Vea el artículo Información general de Copiloten Fabric y Power BI para más información.
Introducción a Copilot para ciencia de datos e ingeniería de datos para ciencia de datos en Fabric
Con Copilot para ciencia de datos e ingeniería de datos, puede chatear con un asistente de inteligencia artificial que le ayude con las tareas de análisis y visualización de datos. Puede hacerle preguntas a Copilot sobre tablas de almacén de lago, conjuntos de datos de Power BI o elementos dataframe de Pandas y Spark en cuadernos. Copilot responde en lenguaje natural o con fragmentos de código. Copilot también puede generar código específico de los datos, en función de la tarea. Por ejemplo, Copilot para ciencia de datos e ingeniería de datos puede generar código para lo siguiente:
- Creación de gráficos
- Filtrado de datos
- Aplicación de transformaciones
- Modelos de Machine Learning
En primer lugar, seleccione el icono de Copilot en la cinta del cuaderno. Se abre el panel de chat de CoCopilot pilot y aparece una nueva celda al principio del cuaderno. Esta celda debe ejecutarse cada vez que se carga una sesión de Spark en un cuaderno de Fabric. De lo contrario, la experiencia con Copilot no funcionará correctamente. Estamos en proceso de evaluar otros mecanismos para controlar esta inicialización necesaria en futuras versiones.
Ejecute la celda al principio del cuaderno. Una vez que se ha ejecutado correctamente la celda, puede usar Copilot. Debe volver a ejecutar la celda al principio del cuaderno cada vez que cierre sesión en él.
Para maximizar la eficacia de Copilot , cargue una tabla o un conjunto de datos como un dataframe en el cuaderno. De este modo, la inteligencia artificial puede acceder a los datos y comprender su estructura y contenido. A continuación, empiece a chatear con la inteligencia artificial. Seleccione el icono de chat en la barra de herramientas del cuaderno y escriba una pregunta o solicitud en el panel de chat. Por ejemplo, puede preguntar lo siguiente:
- "¿Cuál es la edad media de los clientes de este conjunto de datos?"
- "Muéstrame un gráfico de barras de las ventas por región"
Y muchos más. Copilot devuelve la respuesta o el código, que puede copiar y pegar en el cuaderno. Copilot para ciencia de datos e ingeniería de datos es una manera cómoda e interactiva de explorar y analizar datos.
Mientras utiliza Copilot, puede invocar también comandos magic dentro de una celda del cuaderno para obtener la salida directamente en el cuaderno. Por ejemplo, para obtener respuestas en lenguaje natural, puede formular preguntas con el comando "%%chat", por ejemplo:
%%chat
What are some machine learning models that may fit this dataset?
o
%%code
Can you generate code for a logistic regression that fits this data?
Copilot para ciencia de datos e ingeniería de datos también tiene conocimiento del esquema y los metadatos de las tablas del almacén de lago. Copilot puede proporcionar información pertinente en el contexto de los datos de un almacén de lago conectado. Por ejemplo, puede preguntar lo siguiente:
- "¿Cuántas tablas hay en el almacén de lago?"
- "¿Qué columnas tiene la tabla Clientes?"
Copilot responde con la información pertinente si ha agregado el almacén de lago al cuaderno. Copilot también tiene conocimiento de los nombres de los archivos agregados a cualquier almacén de lago conectado al cuaderno. En el chat, puede referirse a esos archivos por su nombre. Por ejemplo, si tiene un archivo denominado sales.csv en el almacén de lago, puede pedirle "Crea un dataframe a partir de sales.csv". Copilot genera el código y lo muestra en el panel de chat. Con Copilot para cuadernos, puede acceder a los datos de diferentes orígenes y consultarlos fácilmente. No necesita la sintaxis exacta del comando para hacerlo.
Sugerencias
- "Borre" la conversación en el panel de chat de Copilot con la escoba de la parte superior del panel. Copilot retiene el conocimiento de las entradas o salidas que se producen durante la sesión, lo que resulta muy útil si el contenido actual le distrae.
- Use la biblioteca de comandos magic del chat para configurar las opciones de Copilot, incluida la configuración de la privacidad. El modo de uso compartido predeterminado está diseñado para maximizar el uso compartido de contexto al que Copilot tiene acceso, por lo que limitar la información proporcionada a Copilot puede afectar directamente y de forma considerable a la relevancia de sus respuestas.
- Cuando Copilot se inicia por primera vez, muestra un conjunto de preguntas útiles que pueden ayudarle a empezar. Pueden ayudar a iniciar la conversación con Copilot. Si desea consultar esas solicitudes más adelante, use el botón de destello de la parte inferior del panel de chat.
- Puede "arrastrar" la barra lateral del chat de Copilot para expandir el panel de chat y ver el código con más claridad o mejorar la legibilidad de las salidas en la pantalla.
Limitaciones
Las características de Copilot en la experiencia de ciencia de datos están actualmente limitadas a cuadernos. Estas características incluyen el panel de chat de Copilot, los comandos magic de IPython que se pueden usar dentro de una celda de código y las sugerencias automáticas de código mientras escribe en una celda de código. Copilot también puede leer modelos semánticos de Power BI mediante una integración del vínculo semántico.
Copilot tiene dos usos previstos clave:
- Uno, puede pedir a Copilot que examine y analice datos en el cuaderno (por ejemplo, si carga primero un elemento DataFrame y, después, pregunta a Copilot sobre los datos dentro del elemento DataFrame).
- Dos, puede pedir a Copilot que genere una serie de sugerencias sobre el proceso de análisis de datos, como qué modelos predictivos podrían ser relevantes, código para realizar diferentes tipos de análisis de datos y documentación para un cuaderno completado.
Tenga en cuenta que la generación de código con bibliotecas rápidas o publicadas recientemente puede incluir inexactitudes o errores.