Usar o Assistente do Databricks

Importante

Este recurso está atualmente em Visualização Pública. O uso do recurso durante a versão prévia é gratuito. Os preços finais serão estabelecidos e comunicados antes da GA (disponibilidade geral).

O Assistente do Databricks é um assistente de IA baseado em contexto que está disponível em notebooks do Databricks, no editor SQL e no editor de arquivos. O Assistente do Databricks permite consultar dados usando uma interface conversacional, tornando-o mais produtivo dentro do Databricks. Você pode descrever sua tarefa em inglês e permitir que o assistente gere código Python ou consultas SQL, explique código complexo e corrija erros automaticamente. O assistente usa metadados do Catálogo do Unity para entender suas tabelas, colunas, descrições e ativos de dados populares em sua empresa para fornecer respostas personalizadas.

O Assistente do Databricks pode executar as seguintes tarefas:

  • Gerar o código.
  • Depurar código, incluindo identificação de erros e sugestão de correções.
  • Transformar e otimizar código.
  • Explicar o código.
  • Ajudar você a encontrar informações relevantes na documentação do Azure Databricks.

O Assistente do Databricks está habilitado por padrão. Um administrador pode desabilitar ou habilitar o Assistente do Databricks para todos os workspaces de uma conta. Se um administrador tiver permitido substituições de configuração do espaço de trabalho, os administradores do espaço de trabalho poderão habilitar ou desabilitar o Assistente do Databricks para espaços de trabalho específicos. Para obter mais detalhes, veja Habilitar ou desabilitar o Assistente do Databricks.

A habilitação do Assistente do Databricks para sua conta é capturada como um evento de conta em seus logs de auditoria; confira eventos de conta no nível da conta.

Informações adicionais

Os artigos a seguir contêm informações adicionais sobre como usar o Assistente do Databricks:

Como usar o Assistente do Databricks

O Assistente do Databricks está disponível em notebooks, editor SQL, editor de arquivos e painéis. Este documento se concentra em notebooks. O uso nos outros produtos é semelhante. Para obter informações sobre como usar o Assistente do Databricks para criar visualizações para painéis, confira Criar visualizações com o Assistente do Databricks.

Em um notebook, o Assistente do Databricks está disponível no painel do Assistente ou embutido em uma célula do código.

Usar o Assistente do Databricks em uma célula do notebook

Para usar o Assistente do Databricks diretamente em uma célula do código, pressione Cmd + i no MacOS ou Ctrl + i no Windows. Uma caixa de texto é exibida dentro da célula. Você pode digitar uma pergunta ou comentário em inglês e pressionar Enter (não Shift+Enter, como faria para executar uma célula) para que o assistente gere uma resposta.

captura de tela do assistente embutido em uso

Você também pode digitar / para exibir uma lista de comandos comuns, como /explain para explicar o código em uma célula, /fix para propor uma correção se o código apresentar um erro e /doc para sugerir comentários da documentação para seu código.

Quando você usa /fix ou /doc, o assistente exibe as alterações propostas em uma janela de comparação. Selecione Aceitar para aceitar as alterações propostas ou Rejeitar para manter o código original. Se você aceitar o código proposto, o código não será executado automaticamente. Você poderá revisar o código antes de executá-lo. Se o código gerado não for o que você queria, tente novamente adicionando mais detalhes ou informações ao seu comentário. Confira Dicas para usar o Assistente do Databricks.

Para o preenchimento automático do código, o desempenho pode ser melhor usando o painel do Assistente do que em uma célula do notebook.

Para sair do Assistente em uma célula do notebook, clique em fechar o assistente no canto superior direito da célula. O Assistente será fechado automaticamente se você Aceitar ou Rejeitar o código gerado.

Usar o painel do Assistente

Para abrir o painel do Assistente, clique em Ícone do assistente do Databricks na barra lateral esquerda.

captura de tela do painel do assistente em uso

Digite perguntas na caixa de texto na parte inferior do painel do Assistente e pressione Enter ou clique em inserir texto do assistente à direita da caixa de texto. O Assistente exibe sua resposta. A captura de tela a seguir mostra as ações que você pode executar depois que o Assistente tiver gerado o código no painel do Assistente.

ícones na parte superior da caixa de código no painel do assistente

Você pode executar a mesma consulta novamente para gerar outra resposta. Para fazer isso, passe o cursor sobre a resposta e clique em ícone de regeneração da consulta.

Para fechar o painel, clique no ícone novamente ou clique em fechar o assistente no canto superior direito da célula. Você pode expandir o painel para a largura total clicando em ícone de abertura da largura total; clique em ícone de fechamento da largura total para retornar o painel à largura padrão.

ícones na parte superior do painel do assistente

O painel do Assistente mantém o controle de suas conversas mesmo se você fechar o painel ou o notebook. Para limpar conversas anteriores, clique em clear-assistant no canto superior direito do painel do Assistente.

Preenchimento automático baseado em IA

Importante

Esse recurso está em uma versão prévia.

O preenchimento automático baseado em IA fornece sugestões de código embutido à medida que você digita em blocos de anotações do Databricks, no editor do SQL e no editor de arquivos. As sugestões de código embutido estão disponíveis para Python e SQL.

Habilitar e desabilitar sugestões de código embutido

O recurso deve ser habilitado para cada usuário da seguinte maneira:

  1. Clique no Ícone de Configurações do UsuárioConfigurações.
  2. Em recursos experimentais, alterne o preenchimento automático do Assistente do Databricks.

Observação

  • Para desabilitar esse recurso para seu workspace, entre em contato com o Databricks.
  • As sugestões de código embutido não estão disponíveis em regiões do Azure Governamental ou workspaces com conformidade com FedRAMP.

Usar sugestões de código embutido

Conforme você digita, as sugestões são exibidas automaticamente. Pressione Guia para aceitar uma sugestão. Para disparar manualmente uma sugestão, pressione Option + Shift + Space (no macOS) ou Control + Shift + Space (no Windows).

conclusão do código SQL

conclusão do código Python

O preenchimento automático baseado em IA também pode gerar código com base em comentários:

conclusão do código a partir de um comentário

Depurar o código

Para usar o Assistente do Databricks para corrigir o código, faça uma pergunta no painel do Assistente ou clique no botão Diagnosticar Erro que aparece nos resultados da célula quando ocorrer um erro. As guias abaixo mostram exemplos de código Python e SQL.

Python

exemplo de depuração do assistente

Sql

exemplo de depuração do assistente

Explicar o código

O Assistente do Databricks pode fornecer explicações detalhadas sobre snippets de código. No prompt fornecido, você pode incluir termos como “ser conciso” ou “explicar o código linha por linha” para solicitar o nível de detalhe da explicação fornecida. Você também pode pedir ao Assistente do Databricks para adicionar comentários ao código.

Encontrar informações relevantes na documentação do Azure Databricks

O Assistente do Databricks pode ajudar a responder perguntas com base na documentação do Databricks diretamente do editor do notebook.

responder pergunta com base na documentação do Databricks

Dicas para usar o Assistente do Databricks

Esta seção inclui algumas dicas gerais e as melhores práticas ao usar o Assistente do Databricks.

O Assistente do Databricks usa o contexto para fornecer melhores respostas

O Assistente do Databricks tem acessos a esquemas e metadados de tabela e coluna. Isso permite que você use a linguagem natural e gere consultas mais precisas. Por exemplo, se uma tabela tiver uma coluna Estado, você poderá pedir ao Assistente do Databricks para gerar uma lista de usuários que vivem no Michigan.

O Assistente do Databricks usa o seguinte contexto:

  • Código ou consultas na célula do notebook atual ou na guia editor do Databricks SQL.
  • Nomes e descrições de tabelas e colunas.
  • Perguntas de prompt anteriores.
  • Tabelas favoritas e ativas.
  • Para o recurso de diagnóstico de erro, o rastreamento de pilha da saída do erro.

Ao selecionar as colunas de um DataFrame, você poderá obter resultados mais precisos fornecendo uma consulta inicial. Por exemplo, forneça uma instrução como SELECT * FROM <table_name>. Isso permite que o Assistente do Databricks obtenha os nomes das colunas e não precise adivinhar.

Como o Assistente do Databricks utiliza o seu histórico de conversa para fornecer respostas melhores e mais precisas, pode pedir ao Databricks Assistant para alterar a saída de uma resposta anterior sem ter de reescrever todo o pedido. Você pode usar o histórico de chat do Assistente para limpar, explorar, filtrar e fatiar DataFrames de forma iterativa no painel do Assistente.

Ser específico

A estrutura e os detalhes que o Assistente do Databricks fornece variam de tempos em tempos, mesmo para o mesmo prompt. Tente fornecer ao assistente o máximo de orientação possível para ajudá-lo a retornar as informações desejadas no formato, nível de detalhe desejado e assim por diante. Por exemplo:

  • “Explique esse código em algumas frases” ou “Explique esse código linha por linha”.
  • “Criar uma visualização usando MatPlotLib” ou “Criar uma visualização usando Seaborn”.

Dê exemplos de valores de dados em nível de linha

Como o Assistente do Databricks não utiliza dados ao nível da linha, poderá ter de fornecer mais detalhes aos pedidos para obter a resposta mais precisa. Use comentários de tabela ou coluna no Catalog Explorer para adicionar uma linha de dados de amostra. Por exemplo, suponha que sua coluna de altura esteja no formato feet-inches. Para ajudar o assistente a interpretar os dados, adicione um comentário como “A coluna de altura está no formato de string e é separada por um hífen. Exemplo: ‘6-2’.” Para obter informações sobre comentários de tabelas e colunas, veja Dados do documento no Catalog Explorer usando comentários de remarcação.

Talvez você também precise fornecer detalhes se conversões de tipo de dados de coluna forem necessárias para executar uma operação. Por exemplo: “converta esse código de pandas para PySpark, incluindo o código necessário para converter o DataFrame do pandas em um DataFrame PySpark e alterando o tipo de dados de rotatividade de coluna de booleano para inteiro”.

Usar Shift+Enter para adicionar uma nova linha na caixa de texto do chat

Você pode usar Shift+Enter para adicionar uma nova linha na caixa de texto do chat assistente. Isso facilita a formatação e a organização de suas mensagens para o Assistente do Databricks.

Editar e executar o código no painel do chat do Assistente do Databricks

Você pode executar o código no painel do Assistente para validá-lo ou usá-lo como um bloco de rascunho. Para executar o código, clique em ícone de execução de código no canto superior esquerdo da caixa do código no painel do Assistente. As guias abaixo mostram exemplos de código Python e SQL.

Python

executar código no painel do assistente

Sql

executar código no painel do assistente

Quando você executa o código no painel do Assistente, a saída é exibida e as variáveis se tornam utilizáveis no notebook.

Você também pode editar o código que o Assistente do Databricks gera diretamente na caixa do chat do Assistente antes de mover o código para o notebook.