Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Depois de anexar um bloco de notas a um cluster e executar uma ou mais células, o bloco de notas adquire estado e exibe saídas. Esta secção descreve como gerir o estado e os resultados do caderno.
Limpar o estado e as saídas dos blocos de notas
Para limpar o estado e os resultados do notebook, selecione uma das opções de Limpar na parte inferior do menu Executar.
| Opção de menu | Descrição |
|---|---|
| Limpar todas as saídas de células | Limpa as saídas da célula. Isso é útil se você compartilhar o bloco de anotações e quiser evitar incluir quaisquer resultados. |
| Limpar o estado | Limpa o estado do bloco de anotações, incluindo definições de função e variáveis, dados e bibliotecas importadas. |
| Limpar estado e saídas | Limpa os outputs de célula e o estado do notebook. |
| Limpar estado e executar tudo | Limpa o estado do bloco de notas e inicia uma nova execução. |
Tabela de resultados
Quando uma célula é executada, os resultados são mostrados em uma tabela de resultados. Com a tabela de resultados, você pode fazer o seguinte:
- Copie uma coluna ou outro subconjunto dos dados de resultados tabulares para a área de transferência.
- Faça uma pesquisa de texto sobre a tabela de resultados.
- Ordenar e filtrar dados.
- Navegue entre as células da tabela usando as teclas de seta do teclado.
- Selecione parte do nome de uma coluna ou valor de célula clicando duas vezes e arrastando para selecionar o texto desejado.
- Use o explorador de colunas para pesquisar, mostrar ou ocultar, fixar e reorganizar colunas.
Para ver limites na tabela de resultados, consulte Limites da tabela de resultados do Bloco de Notas.
Selecionar dados
Para selecionar dados na tabela de resultados, siga um destes procedimentos.
- Copie os dados ou um subconjunto dos dados para a área de transferência.
- Clique no cabeçalho de uma coluna ou linha.
- Clique na célula superior esquerda da tabela para selecionar a tabela inteira.
- Arraste o cursor por qualquer conjunto de células para selecioná-las.
Para abrir um painel lateral exibindo informações de seleção, clique no ícone do painel
no canto superior direito, ao lado da caixa Pesquisar .
Copiar dados para a área de transferência
Para copiar a tabela de resultados em formato CSV para a área de transferência, clique na seta para baixo junto ao separador título da tabela e, em seguida, clique em Copiar resultados para a área de transferência.
Como alternativa, clique na caixa no canto superior esquerdo para selecionar toda a tabela e, em seguida, clique com o botão direito do mouse e selecione Copiar no menu pendente.
Há várias maneiras de copiar os dados selecionados:
- Pressione
Cmd + Cno MacOS ouCtrl + Cno Windows para copiar os resultados para a área de transferência em formato CSV. - Clique com o botão direito do rato e selecione Copiar para transferir os resultados para a área de transferência em formato CSV.
- Clique com o botão direito do mouse e selecione Copiar como para copiar os dados selecionados no formato CSV, TSV ou Markdown.
Ordenar os resultados
Para classificar a tabela de resultados pelos valores em uma coluna, passe o cursor sobre o nome da coluna. Um ícone contendo o nome da coluna aparece à direita da célula. Clique na seta para classificar a coluna.
Para ordenar por várias colunas, mantenha premida a tecla
A classificação segue a ordem de classificação natural por padrão. Para impor uma ordem de classificação lexicográfica, use ORDER BY em SQL ou as respetivas funções SORT disponíveis em seu ambiente.
Filtrar resultados
Use filtros em uma tabela de resultados para examinar mais de perto os dados. Os filtros aplicados às tabelas de resultados também afetam as visualizações, permitindo a exploração interativa sem modificar a consulta ou o conjunto de dados subjacentes. Consulte Filtrar uma visualização.
Há várias maneiras de criar um filtro:
Assistente Databricks
Usar prompts de linguagem natural com o Assistente
Crie filtros usando prompts de linguagem natural:
- Clique no
no canto superior direito dos resultados da célula.
- Na caixa de diálogo exibida, insira o texto que descreve o filtro desejado.
- Clique no
. O Assistente irá gerar e aplicar o filtro para você.
Se quiser criar filtros adicionais com o Assistente, clique no ao lado do(s) filtro(s) para inserir outro prompt.
Consulte Filtrar dados com prompts de linguagem natural.
Caixa de diálogo de filtro
Usar a caixa de diálogo de filtro incorporada
- Se você não tiver o Assistente Databricks habilitado, clique no
no canto superior direito dos resultados da célula para abrir a caixa de diálogo de filtros. Você também pode acessar essa caixa de diálogo clicando no
. - Selecione a coluna que deseja filtrar.
- Selecione a regra de filtro que deseja aplicar.
- Selecione o(s) valor(es) que deseja filtrar.
Por valor
Filtrar por um valor específico
- Na tabela de resultados, clique com o botão direito do mouse em uma célula com esse valor.
- Selecione Filtrar por este valor no menu suspenso.
Por coluna
Filtrar numa coluna específica
- Passe o cursor sobre a coluna na qual deseja filtrar.
- Clique no
.
- Clique em Filtrar.
- Selecione os valores pelos quais deseja filtrar.
Para ativar ou desativar temporariamente um filtro, alterne o botão Ativado/Desativado na caixa de diálogo.
Para excluir um filtro, clique no ao lado do nome do filtro,
.
Aplicar filtros ao conjunto de dados completo
Por padrão, os filtros são aplicados somente aos resultados mostrados na tabela de resultados. Se os dados retornados forem truncados (por exemplo, quando uma consulta retorna mais de 10.000 linhas ou o conjunto de dados é maior que 2MB), o filtro será aplicado somente às linhas retornadas. Uma observação no canto superior direito da tabela indica que o filtro foi aplicado a dados truncados.
Em vez disso, você pode optar por filtrar o conjunto de dados completo. Clique em Dados truncados e, em seguida, escolha Conjunto de dados completo . Dependendo do tamanho do conjunto de dados, pode levar muito tempo para que o filtro seja aplicado.
Criar uma consulta a partir de resultados filtrados
A partir de uma tabela de resultados filtrados ou visualização em um bloco de anotações com SQL como idioma padrão, você pode criar uma nova consulta com os filtros aplicados. No canto superior direito da tabela ou visualização, clique em Criar consulta. A consulta é adicionada como a próxima célula do bloco de anotações.
A consulta criada aplica seus filtros sobre a consulta original. Isso permite que você trabalhe com um conjunto de dados menor e mais relevante, permitindo uma exploração e análise de dados mais eficientes.
Explorar colunas
Para facilitar o trabalho com tabelas que têm muitas colunas, você pode usar o explorador de colunas. Para abrir o explorador de colunas, clique no ícone de coluna ( no canto superior direito de uma tabela de resultados.
O explorador de colunas permite-lhe:
- Pesquisar colunas: Escreva na barra de pesquisa para filtrar a lista de colunas. Clique em uma coluna no explorador para navegar até ela dentro da tabela de resultados.
- Mostrar ou ocultar colunas: use as caixas de seleção para controlar a visibilidade da coluna. A caixa de seleção na parte superior alterna a visibilidade de todas as colunas de uma só vez. Colunas individuais podem ser mostradas ou ocultadas usando as caixas de seleção ao lado de seus nomes.
- Fixar colunas: passe o cursor sobre o nome de uma coluna para revelar um ícone de fixação. Clique no ícone de alfinete para fixar a coluna. As colunas fixas permanecem visíveis à medida que você rola horizontalmente pela tabela de resultados.
-
Reorganizar colunas: clique e mantenha pressionado o ícone de arrastar (
) à direita do nome de uma coluna e, em seguida, arraste e solte a coluna para a nova posição desejada. Isso reordena as colunas na tabela de resultados.
Formatar colunas
Os cabeçalhos das colunas indicam o tipo de dados da coluna. Por exemplo,
indica tipo de dados inteiro. Passe o cursor sobre o indicador para ver o tipo de dados.
Você pode formatar colunas em tabelas de resultados em tipos como Moeda, Percentagem, URL e muito mais, controlando as casas decimais para obter tabelas mais claras.
Formate colunas a partir do menu kebab associado ao nome da coluna.
Descarregar resultados
Por padrão, o download de resultados está habilitado. Para alternar esta configuração, consulte Gerir a capacidade de descarregar resultados de cadernos.
Você pode baixar um resultado de célula que contém saída tabular para sua máquina local. Clique na seta para baixo ao lado do título da guia. As opções de menu dependem do número de linhas no resultado e da versão do Databricks Runtime. Os resultados baixados são salvos em sua máquina local como um arquivo CSV com um nome correspondente ao nome do seu bloco de anotações.
Para notebooks conectados a armazéns SQL ou computação sem servidor, também pode descarregar os resultados como um ficheiro Excel.
Explore os resultados da célula SQL
Em um bloco de anotações Databricks, os resultados de uma célula de linguagem SQL são automaticamente disponibilizados como um DataFrame atribuído à variável _sqldf. Você pode usar a _sqldf variável para fazer referência à saída SQL anterior em células Python e SQL subsequentes. Para obter detalhes, consulte Explorar resultados de células SQL.
Ver várias saídas por célula
Notebooks Python e %python células em notebooks não-Python suportam várias saídas por célula. Por exemplo, a saída do código a seguir inclui o gráfico e a tabela:
import pandas as pd
from sklearn.datasets import load_iris
data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)
Redimensionar saídas
Redimensione os resultados das células arrastando o canto inferior direito da tabela ou visualização.
Submeter resultados do notebook em pastas do Git no Databricks
Para saber mais sobre como confirmar saídas de notebook .ipynb, consulte Permitir a confirmação de saída de notebook .ipynb.
- O bloco de anotações deve ser um arquivo .ipynb
- As definições de administração do espaço de trabalho devem permitir que as saídas do caderno sejam confirmadas