Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Este artigo aborda as opções para recursos de computação do bloco de anotações. Você pode executar um bloco de anotações em um recurso de computação multiuso, computação sem servidor ou, para comandos SQL, pode usar um SQL warehouse, um tipo de computação otimizada para análise SQL. Para obter mais informações sobre tipos de computação, consulte Compute.
Computação sem servidor para notebooks
A computação sem servidor permite que você conecte rapidamente seu notebook a recursos de computação sob demanda.
Para ligar à computação sem servidor, clique no menu suspenso Conectar no bloco de notas e selecione Serveless.
Consulte Computação sem servidor para blocos de anotações para obter mais informações.
Restauração de sessão automatizada para notebooks sem servidor
O término ocioso da computação sem servidor pode fazer com que você perca o trabalho em andamento, como valores de variáveis Python, em seus notebooks. Para evitar isso, ative a restauração automatizada de sessões para notebooks serverless.
- Clique no seu nome de utilizador no canto superior direito da sua área de trabalho e, em seguida, clique em Definições na lista pendente.
- Na barra lateral Configurações, selecione Desenvolvedor.
- Em Recursos experimentais, ative a configuração Restauração de sessão automatizada para cadernos sem servidor.
Habilitar esta configuração permite que o Databricks capture um snapshot do estado da memória do notebook serverless antes da terminação por inatividade. Quando tu retornas a um caderno após uma desconexão por inatividade, um banner aparece na parte superior da página. Clique em Reconectar para restaurar seu estado de trabalho.
Quando você se reconecta, o Databricks restabelece todo o seu ambiente de trabalho, incluindo:
- Variáveis, funções e definições de classe do Python: O lado Python do seu bloco de anotações é preservado para que você não precise reimportar ou reestruturar.
- Spark dataframes, cached e temp views: os dados que você carregou, transformou ou armazenou em cache (incluindo exibições temporárias) são preservados, evitando recarregamentos ou recálculos dispendiosos.
- Estado da sessão do Spark: todas as suas definições de configuração no nível do Spark, exibições temporárias, modificações de catálogo e funções definidas pelo usuário (UDFs) são salvas, para que você não precise redefini-las.
Esta funcionalidade tem limitações e não suporta a restauração do seguinte:
- Estados do Spark com mais de 4 dias
- Estados do Spark maiores que 50 MB
- Dados relacionados a scripts SQL
- Identificadores de arquivo
- Bloqueios e outras primitivas de simultaneidade
- Ligações de rede
Anexar um bloco de notas a um recurso de computação polivalente
Para anexar um caderno a um recurso de computação para todos os fins, necessita-se da permissão PODE ANEXAR A no recurso de computação.
Importante
Enquanto um caderno estiver conectado a um recurso de computação, qualquer usuário com a permissão CAN RUN no caderno tem permissão implícita para acessar o recurso de computação.
Para anexar um notebook a um recurso de computação, clique no seletor de computação na barra de ferramentas do notebook e selecione o recurso no menu suspenso.
O menu mostra uma seleção de armazéns SQL e de computação para todos os fins que você usou recentemente ou está executando no momento.
Para selecionar entre todos os cálculos disponíveis, clique em Mais.... Selecione entre os armazéns de computação geral ou SQL disponíveis.
Você também pode criar um novo recurso computacional de uso geral selecionando Criar novo recurso... no menu suspenso.
Importante
Um bloco de anotações anexado tem as seguintes variáveis do Apache Spark definidas.
| Classe | Nome da variável |
|---|---|
SparkContext |
sc |
SQLContext/HiveContext |
sqlContext |
SparkSession (Faísca 2.x) |
spark |
Não crie um SparkSession, SparkContextou SQLContext. Fazer isso levará a um comportamento inconsistente.
Usar um bloco de anotações com um SQL warehouse
Quando um bloco de anotações é anexado a um armazém SQL, você pode executar células SQL e Markdown. Executar uma célula em qualquer outra linguagem (como Python ou R) gera um erro. As células SQL executadas em um SQL warehouse aparecem no histórico de consultas do SQL warehouse. O usuário que executou uma consulta pode visualizar o perfil de consulta do bloco de anotações clicando no tempo decorrido na parte inferior da saída.
Os blocos de anotações anexados aos armazéns SQL oferecem suporte a sessões do SQL warehouse, que permitem definir variáveis, criar exibições temporárias e persistir o estado em várias execuções de consulta. Isso permite que você crie a lógica SQL iterativamente sem a necessidade de executar todas as instruções de uma só vez. Consulte O que são sessões do SQL warehouse?.
A execução de um bloco de anotações requer um SQL warehouse profissional ou sem servidor. Você deve ter acesso ao espaço de trabalho e ao SQL warehouse.
Para anexar um bloco de anotações a um armazém SQL, faça o seguinte:
Clique no seletor de computação na barra de ferramentas do bloco de anotações. O menu suspenso mostra os recursos de computação que estão em execução no momento ou que você usou recentemente. Os armazéns SQL são marcados com
.No menu, selecione um SQL warehouse.
Para ver todos os armazéns SQL disponíveis, selecione Mais... no menu suspenso. É exibida uma caixa de diálogo mostrando os recursos de computação disponíveis para o bloco de anotações. Selecione SQL Warehouse, escolha o armazém que deseja usar e clique em Anexar.
Você também pode selecionar um SQL warehouse como o recurso de computação para um bloco de anotações SQL ao criar um fluxo de trabalho ou um trabalho agendado.
Limitações do SQL warehouse
Consulte Limitações conhecidas Blocos de anotações Databricks para obter mais informações.