Compartilhar via


Gerenciar o formato do bloco de anotações

Esta página descreve o formato de bloco de anotações padrão em Azure Databricks, como alterar o formato do bloco de anotações e como gerenciar confirmações de saída se o bloco de anotações estiver em uma pasta controlada pela origem.

Por padrão, os notebooks no Databricks são criados no .ipynb formato (IPython ou Jupyter). Você também pode optar por usar o formato original.

Você ainda pode importar e exportar notebooks em vários formatos. Consulte Como importar e exportar notebooks no Databricks.

Formatos de notebook

O Databricks suporta a criação e edição de notebooks em dois formatos: IPYNB (padrão) e código-fonte.

Você pode gerenciar arquivos-fonte, incluindo notebooks, usando repositórios Git. Somente determinados tipos de ativos do Databricks têm suporte em pastas Git. O formato afeta como os notebooks são commitados em repositórios remotos, conforme descrito na tabela abaixo.

Formato de origem do notebook Descrição
fonte Um formato básico que captura apenas o código-fonte, com um sufixo que sinaliza a linguagem de código, como .py, .scala.r e .sql.
IPYNB (Jupyter) Um formato avançado que captura código-fonte, ambiente de notebook, definições de visualização, widgets de notebook e saídas opcionais. Um notebook IPYNB pode conter código em qualquer idioma compatível com notebooks do Databricks (apesar da parte py de .ipynb). Ao usar o formato IPYNB, opcionalmente, você pode controlar a saída de um notebook junto com o notebook.

O formato IPYNB também dá suporte a uma melhor experiência de exibição para blocos de anotações do Databricks em repositórios Git remotos. Se você usar GitHub ou GitLab, poderá habilitar recursos que oferecem diffs aprimorados de seus notebooks em pull requests, facilitando a visualização e a revisão de código de modificações em um notebook.

Para saber mais sobre GitHub suporte para diferenciações avançadas de notebooks IPYNB, consulte Feature Preview: Rich Jupyter Notebook Diffs. Para saber mais sobre o suporte do GitLab para versões de notebook IPYNB, consulte Jupyter Notebook arquivos.

Para distinguir blocos de anotações de formato de origem de arquivos regulares Python, Scala e SQL, Azure Databricks adiciona o comentário "Databricks notebook source" à parte superior dos blocos de anotações Python, Scala e SQL. Esse comentário garante que Azure Databricks analisa corretamente o arquivo como um notebook em vez de um arquivo de script.

Alterar a configuração de formato padrão do notebook

Os notebooks IPYNB são o formato padrão ao criar um novo notebook no Azure Databricks.

Para alterar o padrão para o formato de origem do Azure Databricks, faça login na página inicial do Azure Databricks, clique no seu perfil no canto superior direito da página, clique em Settings e navegue até Developer. Altere o formato padrão do notebook nas configurações do Editor.

Alterar o formato de bloco de anotações padrão nas configurações do desenvolvedor do seu perfil

Converter o formato do notebook

Você pode converter um notebook existente em outro formato por meio da interface do usuário do Azure Databricks.

Para converter um notebook existente em outro formato:

  1. Abra o bloco de anotações em sua área de trabalho.

  2. Selecione Arquivo no menu do workspace, selecione o formato do Notebook e escolha o formato desejado. Você pode escolher Jupyter (.ipynb) (Recomendado) ou Origem (.scala, .py, .sql, .r). O formato atual do notebook está acinzentado e tem uma marca de seleção ao lado dele.

    O menu de arquivo da área de trabalho, expandido, mostrando a opção de formato de notebook.

Para obter mais informações sobre os tipos de notebooks com suporte no Azure Databricks, consulte Importar e exportar notebooks do Databricks.

Gerenciar confirmações de saída do notebook IPYNB

As saídas são os resultados da execução de um notebook na plataforma Databricks, incluindo exibições de tabela e visualizações. Quanto aos notebooks IPYNB nas pastas controladas pelo código-fonte, você pode gerenciar como as saídas do notebook são confirmadas no repositório remoto.

Permitir a confirmação da saída do notebook .ipynb

As saídas só poderão ser confirmadas se um administrador de workspace tiver habilitado esse recurso. Por padrão, a configuração administrativa das pastas Git não permite que a saída do notebook .ipynb seja confirmada. Se você tiver privilégios de administrador para o workspace, poderá alterar essa configuração:

  1. Acesse as configurações Admin>Workspace no console do administrador Azure Databricks.

  2. Em pastas git, escolha Permitir que as pastas Git exportem as saídas IPYNB e selecione Permitir: saídas IPYNB podem ser alternadas em.

    Console de administração: permitir que pastas Git exportem saídas IPYNB.

Importante

Quando as saídas são incluídas, as configurações de visualização e painel são incluídas nos notebooks.ipynb que você cria.

Confirmações do artefato de saída do notebook IPYNB de controle

Quando você confirma um .ipynb arquivo, o Databricks cria um arquivo de configuração que permite controlar como você confirma saídas: .databricks/commit_outputs.

  1. Se você tiver um arquivo de notebook .ipynb, mas nenhum arquivo de configuração no seu repositório remoto, acesse a caixa de diálogo Status do Git.

  2. Na caixa de diálogo de notificação, selecione Criar arquivo de configuração commit_outputs.

    Interface do usuário de confirmação do notebook: criar o botão do arquivo commit_outputs.

Você também pode gerar arquivos de configuração no menu Arquivo . O menu Arquivo possui um controle para atualizar automaticamente o arquivo de configuração, no qual você pode especificar a inclusão ou exclusão de saídas de um caderno IPYNB específico.

  1. No menu Arquivo, selecione Confirmar as saídas dos notebooks.

    Editor do notebook: confirmar status e controle das saídas dos notebooks.

  2. Na caixa de diálogo, confirme sua escolha para confirmar as saídas do notebook.

    Caixa de diálogo Confirmar saídas dos notebooks.