Partilhar via


Visão geral do Copilot para Ciência de Dados e Engenharia de Dados (previsão)

Importante

Este recurso está em pré-visualização.

Copilot for Data Science and Data Engineering é um assistente de IA que ajuda a analisar e visualizar dados. Ele funciona com tabelas e arquivos do Lakehouse, conjuntos de dados do Power BI e dataframes pandas/spark/fabric para fornecer respostas e trechos de código diretamente em um notebook. As conexões com o OneLake e os Lakehouses anexados por defeito permitem que Copilot forneça sugestões de código contextualizadas e respostas em linguagem natural adaptadas aos seus dados.

Copilot pode ajudá-lo a compreender melhor os seus dados e oferecer sugestões para começar o seu bloco de notas, incluindo a geração de código para as células iniciais. Depois de identificar e adicionar fontes de dados por meio do explorador de objetos Fabric, Copilot o Chat sugere tipos de modelo a serem implementados. Você pode copiar essas recomendações diretamente para o seu bloco de anotações para iniciar o desenvolvimento. Se não tiver certeza das suas próximas etapas, pode invocar Copilot in-cell para obter orientação do modelo.

Quando encontras erros, Copilot fornece correções sugeridas. Para obter mais ajuda, pode conversar com Copilot para obter mais opções, evitando pesquisas online constantes.

Você também se beneficia da documentação automática com um recurso simples "Adicionar comentários" que resume as alterações de código e dados. Isto torna as células mais claras para você e para os outros. Ao longo do teu fluxo de trabalho, podes consultar Copilot em pontos específicos, recebendo suporte e orientação em tempo real para acelerar o teu processo de desenvolvimento.

Observação

Com o Spark 3.4 e versões posteriores no Microsoft Fabric, nenhuma célula de instalação é necessária para usar Copilot no seu notebook. As versões anteriores que exigiam uma célula de instalação (Spark 3.3 e anteriores) não são mais suportadas.

Observação

Introdução ao Copilot para Ciência de Dados e Engenharia de Dados no contexto do Fabric Data Science

Com Copilot para Ciência de Dados e Engenharia de Dados, pode conversar com um assistente de IA para gerir as suas tarefas de análise e visualização de dados. Você pode fazer Copilot perguntas sobre tabelas lakehouse, conjuntos de dados do Power BI ou dataframes Pandas/Spark dentro de blocos de anotações. Copilot responde em linguagem natural ou com trechos de código. Copilot também pode gerar código específico de dados para você, dependendo da tarefa. Por exemplo, Copilot para Ciência de Dados e Engenharia de Dados pode gerar código para:

  • Criação de gráficos
  • Filtragem de dados
  • Aplicação de transformações
  • Modelos de aprendizagem automática

Primeiro, selecione o ícone Copilot na barra de ferramentas dos blocos de notas. O painel de bate-papo Copilot é aberto e uma nova célula aparece na parte superior do seu bloco de anotações. Você também pode selecionar Copilot na parte superior da célula dos Notebooks do Fabric.

Para maximizar a eficácia de Copilot, carregue uma tabela ou conjunto de dados como um quadro de dados no seu caderno. A IA pode então aceder aos dados e compreender a sua estrutura e conteúdo. Em seguida, comece a conversar com a IA. Selecione o ícone de bate-papo na barra de ferramentas do bloco de anotações e digite sua pergunta ou solicitação no painel de bate-papo. Por exemplo, você pode perguntar:

  • "Qual é a idade média dos clientes neste conjunto de dados?"
  • "Mostre-me um gráfico de barras de vendas por região."

Copilot responde com a resposta ou o código, que pode copiar e colar no seu bloco de notas. Copilot para Ciência de Dados e Engenharia de Dados é uma maneira conveniente e interativa de explorar e analisar seus dados.

Usando o painel de bate-papo Copilot para interagir com seus dados

Para conversar com os dados e obter informações, selecione o ícone de conversar na barra de ferramentas do bloco de anotações para abrir o painel de chat Copilot. Digite suas perguntas ou solicitações no painel de bate-papo. Por exemplo, você pode perguntar:

  • "Qual é a idade média dos clientes neste conjunto de dados?"
  • "Mostre-me um gráfico de barras de vendas por região."

Copilot responde com a resposta ou o código, que pode copiar e colar no seu bloco de notas. Além disso, Copilot pode sugerir o que fazer a seguir com os seus dados. Copilot fornece sugestões e gera fragmentos de código relevantes para ajudá-lo a prosseguir com as suas tarefas de análise e visualização de dados.

Para interagir com o painel de bate-papo Copilot em notebooks do Microsoft Fabric, siga estas etapas:

  1. Abrir o Copilot Painel de Bate-Papo: selecione o ícone de bate-papo na barra de ferramentas do bloco de notas.

  2. Fazer perguntas ou fazer solicitações: digite suas perguntas ou solicitações no painel de bate-papo. Aqui estão alguns exemplos específicos para ciência de dados e engenharia de dados:

  • Exploração de Dados

    • "Qual é a distribuição da coluna 'idade' neste conjunto de dados?"
    • "Mostre-me um histograma da coluna 'renda'."
  • Limpeza de dados:

    • "Como posso lidar com valores ausentes neste conjunto de dados?"
    • Gere código para remover duplicatas deste dataframe.
  • Transformação de Dados:

    • "Como normalizar a coluna 'vendas'?"
    • Crie uma nova coluna 'lucro' subtraindo 'custo' de 'receita'.
  • Visualização:

    • Traçar um diagrama de dispersão de 'altura' vs 'peso'.
    • Gere um box plot para a coluna 'salário'.
  • Aprendizagem Automática:

    • "Treine um classificador de árvore de decisão neste conjunto de dados."
    • Gere código para um algoritmo de agrupamento k-means com 3 clusters.
  • Avaliação do modelo:

    • "Como avaliar a precisão de um modelo de regressão logística?"
    • "Gere uma matriz de confusão para as previsões."
  1. Receber Respostas: responde com explicações em linguagem natural ou trechos de código. Você pode copiar e colar o código em seu bloco de anotações para executá-lo.

  2. Obter sugestões: Se não souber como proceder, peça sugestões a .

  • "O que devo fazer a seguir com este conjunto de dados?"
  • Quais são algumas técnicas recomendadas de engenharia de características para esses dados?
  1. Usar código gerado: copie os trechos de código gerados do painel de bate-papo e cole-os nas células do notebook para executá-los.

Com estas etapas e os exemplos fornecidos, pode interagir efetivamente com o painel de chat Copilot para melhorar os seus fluxos de trabalho de ciência de dados e engenharia de dados nos notebooks do Microsoft Fabric.

Usando o Painel In-Cell e as Ações Rápidas Copilot

Você pode interagir com Copilot diretamente nas células do notebook para gerar código e executar ações rápidas nas células de código. Veja como usar o Copilot na célula:

  1. Gerar código: Para gerar código para tarefas específicas, podes usar o painel na célula. Por exemplo, você pode digitar sua solicitação no painel de texto acima da célula de código:
Can you generate code for a logistic regression that fits this data?

Copilot fornece o trecho de código necessário diretamente na célula abaixo.

  1. Fix Code: Você pode pedir Copilot para corrigir erros em seu código. Digite o seu pedido no painel de texto acima da célula de código, e Copilot sugere correções.

  2. Adicionar comentários: para documentar automaticamente seu código, use o recurso "Adicionar comentários". Copilot gera comentários que resumem o código e as alterações de dados, tornando o seu bloco de notas mais legível.

  3. Otimizar código: para melhorias de desempenho, você pode pedir Copilot para otimizar seu código. Copilot fornece sugestões para melhorar a eficiência do seu código.

  4. Explicar o código: Se precisar de esclarecimentos sobre um trecho de código, peça uma explicação. Copilot fornece uma explicação detalhada da funcionalidade do código.

Etapas para usar ações rápidas

  1. Iniciar a interação na célula: selecione o ícone na barra de ferramentas do caderno de notas para começar a interagir.

  2. Digite sua solicitação: insira sua solicitação ou pergunta no painel de texto acima da célula de código. Por exemplo:

Explain the following code snippet.
  1. Receba sugestões: Copilot responde com o código relevante, correções, comentários, otimizações ou explicações.

  2. Aplicar Sugestões: Copie o código gerado ou as sugestões do e cole-os nas células do notebook para executá-los.

Com o painel na célula Copilot, pode gerar código, corrigir erros, adicionar comentários, otimizar o desempenho e compreender melhor o seu código, tudo dentro dos seus notebooks do Microsoft Fabric.

Captura de tela mostrando a geração de código de regressão logística.

Copilot para Ciência de Dados e Engenharia de Dados também possui conhecimento sobre esquemas e metadados das tabelas tipo lakehouse. Copilot pode fornecer informações relevantes no contexto dos seus dados hospedados em um armazenamento em nuvem associado. Por exemplo, você pode perguntar:

  • Quantas mesas existem na casa à beira do lago?
  • Quais são as colunas da tabela de clientes?

Copilot responde com as informações relevantes se adicionares o lakehouse ao bloco de notas. Copilot também tem conhecimento dos nomes dos ficheiros adicionados a qualquer Lakehouse anexado ao notebook. Pode referir-se a esses ficheiros pelo nome no seu chat. Por exemplo, se você tiver um arquivo chamado sales.csv em sua casa do lago, poderá pedir Copilot para "Criar um dataframe a partir de sales.csv". Copilot gera o código e o exibe no painel de chat. Com o Copilot para blocos de notas, pode aceder e consultar facilmente os seus dados a partir de diferentes fontes. Você não precisa da sintaxe exata do comando para fazê-lo.

Copilot conclusão de código em linha (Prévia)

Copilot O completar de código em linha é uma funcionalidade impulsionada por IA que o ajuda a escrever código mais rapidamente e de forma mais eficiente nos Fabric Notebooks. Esse recurso fornece sugestões de código inteligentes e sensíveis ao contexto à medida que você digita código. Para saber mais, consulte completação de código em linhaCopilot

Dicas

  • "Limpe" sua conversa no painel de bate-papo Copilot com a vassoura localizada na parte superior do painel de bate-papo. Copilot mantém o conhecimento de quaisquer entradas ou saídas durante a sessão, mas isso pode ajudar se achar que o conteúdo atual é distrativo.
  • Use a biblioteca de magias de bate-papo para definir configurações sobre Copilot, incluindo configurações de privacidade. O modo de partilha padrão maximiza o compartilhamento de contexto que Copilot pode aceder. Por conseguinte, limitar a informação prestada a Copilot pode afetar direta e significativamente a relevância das suas respostas.
  • Quando Copilot é lançado pela primeira vez, ele oferece um conjunto de prompts úteis que podem ajudá-lo a começar. Eles podem ajudar a dar início à sua conversa com Copilot. Para consultar os prompts mais tarde, você pode usar o botão de brilho na parte inferior do painel de bate-papo.
  • Você pode "arrastar" a barra lateral do chat para expandir o painel de Copilot chat, para visualizar o código com mais clareza ou para melhorar a legibilidade das saídas na sua tela.

Limitações

Copilot funcionalidades na experiência de Ciência de Dados estão atualmente limitadas a notebooks. Esses recursos incluem o painel de bate-papo Copilot, comandos mágicos IPython que podem ser usados dentro de uma célula de código e sugestões automáticas de código à medida que você digita em uma célula de código. Copilot também pode ler modelos semânticos do Power BI usando uma integração de link semântico.

Copilot tem dois usos principais pretendidos:

  • Você pode pedir ao Copilot para examinar e analisar dados no seu notebook (por exemplo, primeiro carregando um DataFrame e, em seguida, perguntando ao Copilot sobre os dados no DataFrame).
  • Você pode pedir a Copilot para gerar uma série de sugestões sobre o seu processo de análise de dados - por exemplo, quais modelos preditivos podem ser relevantes, código para executar diferentes tipos de análise de dados e documentação para um notebook concluído.

A geração de código com bibliotecas rápidas ou lançadas recentemente pode incluir imprecisões ou fabricações.

Eliminação e Exportação de Dados

Copilot In Notebooks fornece aos usuários dois comandos essenciais para gerenciar o histórico de bate-papo dentro das células do bloco de anotações: show_chat_history e clear_chat_history. O comando show_chat_history exporta o histórico completo do bate-papo para fins de conformidade, para garantir que todas as interações necessárias sejam documentadas e acessíveis para revisão. Por exemplo, a execução de show_chat_history gera um registro abrangente do histórico de bate-papo, que pode ser revisado ou arquivado para fins de conformidade.

O comando clear_chat_history remove todas as conversas anteriores do bloco de anotações, para que o usuário possa começar do zero. Este comando limpa interações antigas para iniciar um novo tópico de conversa. Por exemplo, executar clear_chat_history exclui todo o histórico de bate-papo anterior, para deixar o bloco de anotações livre de conversas passadas. Esses recursos melhoram a funcionalidade geral e a experiência de utilização de Copilot em notebooks.