Compartilhar via


Como usar notebooks do Microsoft Fabric

O notebook do Microsoft Fabric é o item de código principal para o desenvolvimento de trabalhos do Apache Spark e para experimentos de aprendizado de máquina. É uma superfície interativa baseada na Web utilizada por cientistas de dados e engenheiros de dados para escrever códigos que se beneficiam de visualizações avançadas e texto Markdown. Os engenheiros de dados gravam código para ingestão de dados, preparação de dados e transformação de dados. Os cientistas de dados também usam notebooks para criar soluções de aprendizado de máquina, incluindo a criação de experimentos e modelos, acompanhamento de modelos e implantação.

Com um notebook do Fabric, você pode:

  • Começar a trabalhar com um mínimo de configuração.
  • Explorar e processar facilmente dados com uma experiência intuitiva de baixo código.
  • Manter os dados protegidos com recursos internos de segurança corporativa.
  • Analisar dados em formatos brutos (CSV, txt, JSON etc.), formatos de arquivo processados (parquet, Delta Lake, etc.), usando as funcionalidades avançadas do Spark.
  • Seja produtivo com recursos de criação aprimorados e visualização de dados interna.

Este artigo descreve como usar notebooks em experiências de ciência de dados e engenharia de dados.

Contexto de segurança do notebook em execução

A execução de um notebook pode ser acionada de três maneiras diferentes no Fabric, com total flexibilidade para atender a diferentes cenários:

  • Execução interativa: o usuário aciona manualmente a execução por meio das diferentes entradas de UX ou chamando a API REST. A execução será executada no contexto de segurança do usuário atual.
  • Executar como atividade de pipeline: a execução é acionada do pipeline Data Factory do Fabric. Você pode encontrar as etapas detalhadas na Atividade do Notebook. A execução será executada no contexto de segurança do proprietário do pipeline.
  • Agendador: a execução é acionada de um plano do agendador. A execução será executada no contexto de segurança do usuário que configurou/atualizou o plano do agendador.

A flexibilidade dessas opções de execução com diferentes contextos de segurança permite que você atenda a diferentes cenários e requisitos, mas também exige que você esteja ciente do contexto de segurança ao projetar e desenvolver seu notebook. Do contrário, poderá causar um comportamento inesperado e até mesmo alguns problemas de segurança.

Na primeira vez que um notebook for criado, uma mensagem de aviso será mostrada para lembrar você do risco de executar o código sem revisá-lo.

Captura de tela mostrando o aviso de notebook em execução.

Aqui estão algumas melhores práticas para ajudar você a evitar problemas de segurança:

  • Antes de executar manualmente o notebook, abra a configuração dele e verifique a seção Detalhes no painel Sobre quanto à atualização de modificação. Verifique se está tudo de acordo com a alteração mais recente.
  • Antes de adicionar uma atividade de notebook a um pipeline, abra a configuração Notebook e verifique a seção Detalhes no painel Sobre quanto à atualização de modificação. Verifique se está tudo de acordo com a alteração mais recente. Se você não tiver certeza sobre a alteração mais recente, é melhor abrir o Notebook para revisar a alteração antes de adicioná-la ao pipeline.
  • Antes de atualizar o plano do agendador, abra a configuração Notebook e verifique a seção Detalhes no painel Sobre quanto à atualização de modificação. Verifique se está tudo de acordo com a alteração mais recente. Se você não tiver certeza sobre a alteração mais recente, é melhor abrir o Notebook para revisar a alteração antes de atualizar o plano do agendador.
  • Separe o espaço de trabalho em diferentes estágios (dev, test, prod) e controle o acesso de diferentes estágios para evitar o problema de segurança. Adicione apenas o usuário em quem você confia ao estágio de produção.

Criar notebooks

Você pode criar um notebook ou importar um notebook existente.

Criar um novo notebook

Semelhante a outros processos de criação de item padrão do Fabric, você pode criar facilmente um notebook na página inicial de Engenharia de Dados do Fabric, na opção Novo do workspace ou em Criar Hub.

Importar notebooks existentes

Você pode importar um ou mais notebooks existentes do computador local para um workspace do Fabric da página inicial de Engenharia de Dados ou Ciência de Dados. Os notebooks do Fabric reconhecem os arquivos .ipynb padrão Jupyter Notebook e arquivos de origem, como .py, .scala e .sql, e criam itens de notebook adequadamente.

Captura de tela mostrando onde localizar as opções de notebook no menu Novo.

Exportar um notebook

Você pode exportar seu notebook para outros formatos padrão. O notebook do Synapse pode ser exportado para:

  • O arquivo padrão de notebook (.ipynb) usado nos notebooks Jupyter.
  • Um arquivo HTML (.html) que pode ser aberto diretamente no navegador.
  • Um arquivo Python (.py).
  • Um arquivo Latex (.tex).

Captura de tela mostrando onde exportar um notebook.

Salvar um notebook

No Fabric, por padrão, um notebook será salvo automaticamente depois de aberto e editado. Você não precisa se preocupar com a perda de alterações de código. Você também pode usar Salvar uma cópia para clonar outra cópia no workspace atual ou em outro workspace.

Captura de tela mostrando onde salvar uma cópia.

Se preferir salvar o notebook manualmente, mude para a opção de salvamento Manual para ter um branch local do seu item de notebook e use a opção Salvar ou CTRL+s para salvar suas alterações.

Captura de tela mostrando onde alternar para o salvamento manual.

Você também pode alternar para o modo de salvamento manual selecionando Editar – >Opções de salvamento – >Manual. Para ativar um branch local do notebook e salvá-lo manualmente selecione Salvar ou use o atalho de teclado Ctrl+s.

Conectar lakehouses e notebooks

Os notebooks do Fabric agora dão suporte à interação com lakehouses. Você pode adicionar facilmente um lakehouse novo ou existente pelo Lakehouse Explorer.

Você pode acessar diversos lakehouses no Lakehouse Explorer e definir um deles como padrão fixando-o. Seu padrão será montado no diretório de trabalho de runtime e você poderá ler ou gravar no lakehouse padrão usando um caminho local.

Captura de tela mostrando onde fixar o lakehouse padrão.

Observação

Você precisa reiniciar a sessão depois de fixar um novo lakehouse ou de renomear o lakehouse padrão.

Adicionar ou remover um lakehouse

Selecionar o ícone X ao lado de um nome de lakehouse o remove da guia do notebook, mas o item lakehouse ainda existe no workspace.

Selecione Adicionar lakehouse para adicionar mais lakehouses ao notebook, adicionando um existente ou criando um lakehouse.

Explorar um arquivo lakehouse

A subpasta e os arquivos na seção Tabelas e Arquivos do modo de exibição Lake aparecem em uma área de conteúdo entre a lista lakehouse e o conteúdo do notebook. Selecione pastas diferentes na seção Tabelas e Arquivos para atualizar a área de conteúdo.

Operações de pasta e arquivo

Se você selecionar um arquivo (.csv, .parquet, .txt, .jpg, .png etc.) clicando com o botão direito do mouse, poderá usar a API do Spark ou do Pandas para carregar os dados. Uma nova célula de código será gerada e inserida abaixo da célula de foco.

Você pode copiar facilmente o caminho com um formato diferente do arquivo ou pasta selecionado e usar o caminho correspondente no seu código.

Captura de tela mostrando o menu de contexto de arquivos no lakehouse.

Recursos do Notebook

O gerenciador de recursos do notebook fornece um sistema de arquivos semelhante ao Unix para ajudá-lo a gerenciar suas pastas e arquivos. Ele oferece um espaço gravável do sistema de arquivos em que você pode armazenar arquivos de tamanho pequeno, como módulos de código, modelos semânticos e imagens. Você pode acessá-los facilmente com código no notebook como se estivesse trabalhando com seu sistema de arquivos local.

GIF animado dos recursos do notebook.

Essa pasta interna é uma pasta predefinida do sistema para cada instância do notebook. Ela preserva até 500 MB de armazenamento para armazenar as dependências do notebook atual. Estes são os principais recursos do notebook:

  • Você pode usar operações comuns, como criar/excluir, carregar/baixar, arrastar/soltar, renomear, duplicar e pesquisar pela interface do usuário.
  • Você pode usar caminhos relativos como builtin/YourData.txt para uma exploração rápida. O método mssparkutils.nbResPath ajuda você a compor o caminho completo.
  • Você pode mover facilmente seus dados validados para um lakehouse por meio da opção Gravar no lakehouse. O Fabric tem snippets de código avançados incorporados dos tipos de arquivo comuns para ajudar você a começar a usar rapidamente.
  • Esses recursos também estão disponíveis para uso no caso de Execução do notebook de referência por meio do mssparkutils.notebook.run().

Observação

  • Atualmente, o Fabric dá suporte ao carregamento de determinados tipos de arquivo por meio da interface do usuário, incluindo arquivos .py, .whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg e .xlsx. Você pode gravar na pasta interna com tipos de arquivo que não estão na lista por meio de código. Contudo, os notebooks do Fabric não dão suporte à geração de snippet de código em tipos de arquivo sem suporte.
  • Cada arquivo precisa ter até 50 MB de tamanho e a pasta interna permite até 100 instâncias de arquivo/pasta no total.
  • Ao usar mssparkutils.notebook.run(), utilize o comando mssparkutils.nbResPath para acessar o recurso do notebook de destino. O caminho relativo “builtin/” sempre apontará para a pasta interna do notebook raiz.

Colaborar em um notebook

O notebook do Fabric é um item colaborativo que dá suporte à edição de vários usuários no mesmo notebook.

Ao abrir um notebook, você entra no modo de coedição por padrão e cada edição do notebook é salva automaticamente. Se os seus colegas abrirem o mesmo notebook simultaneamente, você verá o perfil, a saída da execução, o indicador de cursor, o indicador de seleção e o rastreamento da edição. Ao usar os recursos de colaboração, você pode facilmente realizar programação em par, depuração remota e cenários de explicações.

Captura de tela mostrando uma célula de código com outro usuário editando.

Compartilhar um notebook

Compartilhar um notebook é uma maneira conveniente de colaborar com os membros da equipe. Por padrão, as funções autorizadas do espaço de trabalho podem exibir ou editar/executar notebooks. Você pode compartilhar um notebook com a concessão de permissões específicas.

  1. Selecione Compartilhar na barra de ferramentas do notebook.

    Captura de tela que mostra onde selecionar Compartilhar.

  2. Selecione a categoria correspondente de pessoas que podem exibir este notebook. Você pode escolher Compartilhar, Editar ou Executar permissões para os destinatários.

    Captura de tela que mostra onde selecionar permissões.

  3. Depois de selecionar Aplicar, você pode enviar o notebook diretamente ou copiar o link para outras pessoas. Em seguida, os destinatários podem abrir o notebook com a exibição correspondente concedida pelo nível de permissão.

    Captura de tela que mostra onde criar e enviar um link.

  4. Para gerenciar ainda mais as permissões do notebook, selecione Lista de itens do Workspace>Mais opções e selecione Gerenciar permissões. Nessa tela, você pode atualizar o acesso e as permissões existentes do notebook.

    Captura de tela que mostra onde gerenciar permissões no espaço de trabalho.

Comentar uma célula de código

O comentário é outro recurso útil em cenários colaborativos. Atualmente, o Fabric dá suporte à adição de comentários no nível da célula.

  1. Selecione o botão Comentários na barra de ferramentas do notebook ou no indicador de comentário da célula para abrir o painel Comentários.

    Captura de tela mostrando onde selecionar Comentário.

  2. Selecione o código na célula de código, selecione Novo no painel Comentários, adicione comentários e selecione Postar comentário para salvar.

    Captura de tela mostrando onde selecionar Novo.

  3. Se precisar deles, localize as opções Editar comentário, Resolver thread e Excluir thread, selecionando a opção Mais ao lado do comentário.

Marcando outras pessoas em um comentário

"Marcação" refere-se a mencionar e notificar um usuário em um tópico de comentários, melhorando a colaboração de forma eficiente nas especificações.

  1. Selecione uma seção de código em uma célula e crie um thread de comentários.

  2. Insira o nome de usuário e escolha o correto na lista de sugestões se desejar mencionar alguém para discussão sobre uma determinada seção.

  3. Compartilhe seus insights e publique-os.

  4. Uma notificação por e-mail será acionada e o usuário clicará no link Abrir comentários para localizar rapidamente essa célula.

  5. Além disso, autorize e configure as permissões para usuários ao marcar alguém que não tem acesso, garantindo que seus ativos de código sejam bem gerenciados.

GIF animado da marcação de outras pessoas em um comentário.

Observação

Para um item de comentário, o usuário marcado não receberá mais uma notificação por e-mail se você atualizar o comentário em até uma hora. Mas ele enviará a notificação por e-mail para o novo usuário marcado.

Alternar modo do notebook

O notebook do Fabric dá suporte a dois modos que você escolhe facilmente: modo de Edição e modo de Exibição.

Captura de tela mostrando onde alternar os modos.

  • Modo de edição: você pode editar e executar as células e colaborar com outras pessoas no notebook.
  • Modo de exibição: você só pode exibir o conteúdo da célula, a saída e os comentários do notebook. Todas as operações que fazem alterações no notebook estão desabilitadas.