Partilhar via


Saídas e resultados do bloco de notas

Depois de anexar um bloco de notas a um cluster e executar uma ou mais células, o bloco de notas tem estado e apresenta saídas. Esta seção descreve como gerenciar o estado e as saídas do bloco de anotações.

Limpar o estado e as saídas dos blocos de notas

Para limpar o estado e as saídas do bloco de anotações, selecione uma das opções Limpar na parte inferior do menu Executar.

Opção de menu Description
Limpar todas as saídas de células Limpa as saídas da célula. Isso é útil se você estiver compartilhando o bloco de anotações e não quiser incluir nenhum resultado.
Limpar estado Limpa o estado do bloco de anotações, incluindo definições de função e variáveis, dados e bibliotecas importadas.
Limpar estado e saídas Limpa as saídas da célula e o estado do bloco de notas.
Limpar estado e executar tudo Limpa o estado do bloco de notas e inicia uma nova execução.

Mostrar resultados

Quando uma célula é executada, os resultados da tabela retornam um máximo de 10.000 linhas ou 2 MB, o que for menor.

Por padrão, os resultados de texto retornam um máximo de 50.000 caracteres. Com o Databricks Runtime 12.2 LTS e superior, você pode aumentar esse limite definindo a propriedade spark.databricks.driver.maxReplOutputLengthde configuração do Spark.

Explore os resultados da célula SQL em blocos de anotações Python nativamente usando Python

Você pode carregar dados usando SQL e explorá-los usando Python. Em um bloco de anotações Databricks Python, os resultados da tabela de uma célula da linguagem SQL são automaticamente disponibilizados como um Python DataFrame. Para obter detalhes, consulte Explorar resultados de células SQL em blocos de anotações Python.

Nova tabela de resultados de célula

Importante

Esta funcionalidade está em Pré-visualização Pública.

Agora você pode selecionar uma nova renderização de tabela de resultados de célula. Com a nova tabela de resultados, você pode fazer o seguinte:

  • Copie uma coluna ou outro subconjunto de resultados tabulares para a área de transferência.
  • Faça uma pesquisa de texto sobre a tabela de resultados.
  • Ordenar e filtrar dados.
  • Navegue entre as células da tabela usando as teclas de seta do teclado.
  • Selecione parte do nome de uma coluna ou valor de célula clicando duas vezes e arrastando para selecionar o texto desejado.

Para habilitar a nova tabela de resultados, clique em Nova tabela de resultados no canto superior direito dos resultados da célula e altere o seletor de alternância de DESATIVADO para ATIVADO.

Novo seletor de exibição de resultados

Quando o recurso está ativado, você pode clicar em cabeçalhos de coluna ou linha para selecionar colunas ou linhas inteiras e pode clicar na célula superior esquerda da tabela para selecionar a tabela inteira. Você pode arrastar o cursor por qualquer conjunto retangular de células para selecioná-las.

Para copiar os dados selecionados para a área de transferência, pressione Cmd + c no MacOS ou Ctrl + c no Windows ou clique com o botão direito do mouse e selecione Copiar no menu suspenso.

Para procurar texto na tabela de resultados, introduza o texto na caixa Procurar . As células correspondentes são realçadas.

Para abrir um painel lateral que exibe informações sobre a seleção, clique no ícone do painel ícone do painel no canto superior direito, ao lado da caixa Pesquisar .

Localização do ícone do painel

Os cabeçalhos das colunas indicam o tipo de dados da coluna. Por exemplo, indicador para coluna de tipo inteiro indica o tipo de dados inteiro. Passe o cursor sobre o indicador para ver o tipo de dados.

Ordenar e filtrar resultados

Ao usar a renderização da nova tabela de resultados de célula, você pode classificar e filtrar os resultados.

Para classificar a tabela pelos valores em uma coluna, passe o cursor sobre o nome da coluna. À direita da célula que contém o nome da coluna, aparece um ícone. Clique na seta para classificar a coluna. Os cliques sucessivos alternam a classificação em ordem crescente, ordem decrescente ou não classificada.

Como classificar uma coluna

Para classificar por várias colunas, mantenha pressionada a tecla Shift enquanto clica na seta de classificação das colunas.

Para criar um filtro, clique no ícone de filtro canto superior direito dos resultados da célula. Na caixa de diálogo exibida, selecione a coluna a ser filtrada e a regra de filtro e o valor a serem aplicados. Por exemplo:

Exemplo de filtro

Para adicionar outro filtro, clique em botão adicionar filtro.

Para ativar ou desativar temporariamente um filtro, alterne o botão Ativado/Desativado na caixa de diálogo. Para excluir um filtro, clique no X ao lado do nome excluir filtro Xdo filtro .

Para filtrar por um valor específico, clique com o botão direito do mouse em uma célula com esse valor e selecione Filtrar por esse valor no menu suspenso.

Valor específico

Você também pode criar um filtro a partir do menu kebab no nome da coluna:

filtro kebab menu

Os filtros são aplicados apenas aos resultados mostrados na tabela de resultados. Se os dados retornados estiverem truncados (por exemplo, quando uma consulta retorna mais de 64.000 linhas), o filtro será aplicado somente às linhas retornadas.

Resultados de transferência

Por padrão, o download de resultados está habilitado. Para alternar essa configuração, consulte Gerenciar a capacidade de baixar resultados de blocos de anotações.

Você pode baixar um resultado de célula que contém saída tabular para sua máquina local. Clique na seta para baixo ao lado do título da guia. As opções de menu dependem do número de linhas no resultado e da versão do Databricks Runtime. Os resultados baixados são salvos em sua máquina local como um arquivo CSV chamado export.csv.

Download dos resultados da célula

Ver várias saídas por célula

Blocos de anotações Python e %python células em notebooks não-Python suportam várias saídas por célula. Por exemplo, a saída do código a seguir inclui o gráfico e a tabela:

import pandas as pd
from sklearn.datasets import load_iris

data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)

Confirmar saídas de bloco de anotações em pastas do Databricks Git

Para saber mais sobre como confirmar saídas de notebook .ipynb, consulte Permitir confirmação de saída de notebook .ipynb.

  • O bloco de anotações deve ser um arquivo .ipynb
  • As configurações de administração do espaço de trabalho devem permitir que as saídas do bloco de anotações sejam confirmadas.