Partilhar via


Gerir o formato do bloco de notas

Este artigo descreve o formato de bloco de notas predefinido no Azure Databricks, como alterar o formato do bloco de notas e como gerir confirmações de saída se o seu bloco de notas estiver numa pasta controlada pelo código-fonte.

Por padrão, os blocos de anotações no Databricks são criados no formato .ipynb (IPython ou Jupyter). Você também pode optar por usar o formato de origem.

Você ainda pode importar e exportar blocos de anotações em vários formatos. Consulte Importar e exportar blocos de anotações Databricks.

Formatos de portátil

O Databricks suporta a criação e edição de blocos de anotações em dois formatos: IPYNB (padrão) e source.

Você pode gerir arquivos de origem, incluindo blocos de notas, usando pastas Git. Apenas determinados tipos de ativos Databricks são suportados nas pastas Git. O formato afeta como os notebooks são submetidos a repositórios remotos, conforme descrito na tabela abaixo.

Formato de origem do bloco de notas Descrição
origem Um formato básico que captura apenas o código-fonte, com um sufixo que sinaliza a linguagem de código, como .py, .scala, .r e .sql.
IPYNB (Júpiter) Um formato avançado que captura código-fonte, ambiente de bloco de anotações, definições de visualização, widgets de bloco de anotações e saídas opcionais. Um notebook IPYNB pode conter código em qualquer idioma suportado pelos notebooks Databricks (apesar da parte py do .ipynb). Usando o formato IPYNB, você pode, opcionalmente, controlar a versão da saída de um notebook junto com o notebook.

O formato IPYNB também suporta uma melhor experiência de visualização para notebooks Databricks em repositórios Git remotos. Se você usa o GitHub ou o GitLab, pode habilitar recursos que oferecem diffs aprimorados de seus blocos de anotações em solicitações pull, facilitando a visualização e a revisão de código de alterações em um bloco de anotações.

Para saber mais sobre o suporte do GitHub para diffs avançados de notebooks IPYNB, consulte Visualização de recursos: diffs de notebook Jupyter avançados. Para saber mais sobre o suporte do GitLab para diffs de notebook IPYNB, consulte Arquivos do Jupyter Notebook.

Para distinguir blocos de anotações de formato de origem de arquivos Python, Scala e SQL comuns, o Azure Databricks adiciona o comentário "Databricks notebook source" à parte superior dos blocos de anotações Python, Scala e SQL. Esse comentário garante que o Azure Databricks analise corretamente o arquivo como um bloco de anotações, em vez de um arquivo de script.

Alterar a configuração padrão de formato do bloco de anotações

Os blocos de anotações IPYNB são o formato padrão ao criar um novo bloco de anotações no Azure Databricks.

Para alterar o formato padrão para Azure Databricks, inicie sessão no seu espaço de trabalho do Azure Databricks, clique no seu perfil no canto superior direito da página, clique em Configurações e navegue até Programador. Altere o formato padrão do notebook nas definições de Editor sob o cabeçalho .

Alterar o formato padrão do bloco de anotações nas configurações do desenvolvedor do seu perfil

Converter formato de bloco de notas

Você pode converter um bloco de anotações existente em outro formato por meio da interface do usuário do Azure Databricks.

Para converter um bloco de notas existente para outro formato:

  1. Abra o bloco de notas na sua área de trabalho.

  2. Selecione Arquivo no menu do espaço de trabalho, selecione Formato do bloco de anotações e escolha o formato desejado. Você pode escolher Jupyter (.ipynb) (Recomendado) ou Source (.scala, .py, .sql, .r). O formato atual do bloco de notas está a cinzento e tem uma marca de verificação ao lado.

    O menu do ficheiro do espaço de trabalho, expandido, mostrando a opção de formato do notebook.

Para obter mais informações sobre os tipos de blocos de anotações suportados no Azure Databricks, consulte Importar e exportar blocos de anotações Databricks.

Gerenciar confirmações de saída de notebook IPYNB

As saídas são os resultados da execução de um bloco de anotações na plataforma Databricks, incluindo exibições de tabelas e visualizações. Para notebooks IPYNB em pastas controladas por controlo de versão, pode gerir como os resultados do notebook são enviados para o repositório remoto.

Permitir a confirmação da saída do .ipynb notebook

As saídas só podem ser confirmadas se um administrador de espaço de trabalho tiver ativado esse recurso. Por padrão, a configuração administrativa para pastas Git não permite que .ipynb saída do bloco de anotações seja confirmada. Se você tiver privilégios de administrador para o espaço de trabalho, poderá alterar esta configuração:

  1. Vá para Definições de administrador>Definições de espaço de trabalho na consola do administrador do Azure Databricks.

  2. Em pastas Git, escolha Permitir que pastas Git exportem saídas IPYNB e, em seguida, selecione Permitir: as saídas IPYNB podem ser ativadas.

    Admin Console: permita que as pastas Git exportem saídas IPYNB.

Importante

Quando as saídas são incluídas, as configurações de visualização e do painel são incorporadas nos cadernos.ipynb que criar.

Gerir os artefatos gerados de saída dos commits do notebook IPYNB

Quando você confirma um arquivo .ipynb, o Databricks cria um arquivo de configuração que permite controlar como você confirma saídas: .databricks/commit_outputs.

  1. Se tiveres um arquivo de notebook .ipynb, mas nenhum arquivo de configuração no teu repositório remoto, vai para a caixa de diálogo Git Status.

  2. Na caixa de diálogo de notificação, selecione Criar arquivo de configuração commit_outputs.

    interface do usuário de confirmação do Bloco de Anotações: botão Criar arquivo commit_outputs.

Você também pode gerar arquivos de configuração a partir do menu File. O menu File tem um controle para atualizar automaticamente o arquivo de configuração, onde você pode especificar a inclusão ou exclusão de saídas para um notebook IPYNB específico.

  1. No menu Arquivo, selecione Confirmar resultados dos blocos de notas.

    Editor de blocos de anotações: confirme o status e o controle das saídas dos blocos de anotações.

  2. Na caixa de diálogo, confirme a sua escolha para submeter as saídas do notebook.

    caixa de diálogo de registo das saídas dos cadernos.