Ler em inglês

Partilhar via


Criar um bloco de anotações parametrizado usando o Papermill

Importante

O Azure Data Studio será desativado em 28 de fevereiro de 2026. Recomendamos que você use Visual Studio Code. Para obter mais informações sobre como migrar para o Visual Studio Code, visite O que está acontecendo com o Azure Data Studio?

A parametrização no Azure Data Studio está executando o mesmo bloco de anotações com um conjunto diferente de parâmetros.

Este artigo mostra como criar e executar um bloco de anotações parametrizado no Azure Data Studio usando o kernel do Python.

Nota

Atualmente, você pode usar a parametrização com kernels Python, PySpark, PowerShell e .NET Interactive.

Pré-requisitos

Instalar e configurar o Papermill no Azure Data Studio

Todas as etapas nesta seção são executadas dentro de um bloco de anotações do Azure Data Studio.

  1. Crie um novo bloco de notas. Altere o kernel para Python 3:

    Captura de tela que mostra a opção de menu Novo bloco de anotações e a configuração do valor do Kernel como Python 3.

  2. Se você for solicitado a atualizar seus pacotes Python quando os pacotes precisarem de atualização, selecione Sim:

    Captura de tela que mostra o prompt de diálogo para atualizar pacotes Python.

  3. Instale o Moinho de Papel:

    Python
    import sys
    !{sys.executable} -m pip install papermill --no-cache-dir --upgrade
    

    Verifique se o Papermill está instalado:

    Python
    import sys
    !{sys.executable} -m pip list
    

    Captura de tela que mostra a seleção de Papermill em uma lista de nomes de aplicativos.

  4. Para verificar se o Papermill foi instalado corretamente, verifique a versão do Papermill:

    Python
    import papermill
    papermill
    

    Captura de tela que mostra a validação da instalação do Papermill.

Exemplo de parametrização

Você pode usar um arquivo de bloco de anotações de exemplo para percorrer as etapas neste artigo:

  1. Vá para o arquivo do bloco de anotações no GitHub. Selecione Raw.
  2. Selecione Ctrl+S ou clique com o botão direito do mouse e salve o arquivo com a extensão .ipynb.
  3. Abra o arquivo no Azure Data Studio.

Configurar um bloco de notas parametrizado

Você pode começar com o bloco de anotações de exemplo aberto no Azure Data Studio ou concluir as etapas a seguir para criar um bloco de anotações. Em seguida, tente usar parâmetros diferentes. Todas as etapas são executadas dentro de um bloco de anotações do Azure Data Studio.

  1. Verifique se o Kernel está definido como Python 3:

    Captura de tela que mostra o valor do kernel para Python 3.

  2. Crie uma nova célula de código. Selecione Parâmetros para marcar a célula como uma célula de parâmetros.

    Python
    x = 2.0
    y = 5.0
    

    Captura de tela que mostra a criação de uma nova célula de parâmetros com Parâmetros selecionados.

  3. Adicione outras células para testar parâmetros diferentes:

    Python
    addition = x + y
    multiply = x * y
    
    Python
    print("Addition: " + str(addition))
    print("Multiplication: " + str(multiply))
    

    Depois que todas as células forem executadas, a saída será semelhante a este exemplo:

    Captura de tela que mostra a saída de células adicionadas para testar novos parâmetros.

  4. Salve o bloco de anotações como Input.ipynb:

    Captura de ecrã que mostra a gravação do ficheiro do bloco de notas.

Executar um caderno Papermill

Você pode executar o Papermill de duas maneiras:

  • Interface de Linha de Comandos (CLI)
  • API Python

Execução parametrizada da CLI

Para executar um bloco de anotações usando a CLI, no terminal, digite o papermill comando com o bloco de anotações de entrada, o local do bloco de anotações de saída e as opções.

Nota

Para saber mais, consulte a documentação da CLI da Papermill.

  1. Execute o bloco de notas de entrada com novos parâmetros:

    shell
    papermill Input.ipynb Output.ipynb -p x 10 -p y 20
    

    Este comando executa o bloco de notas de entrada com novos valores para os parâmetros x e y.

  2. Uma nova célula rotulada # Injected-Parameters contém os novos valores de parâmetro que foram passados através da CLI. Os novos # Injected-Parameters valores são usados para a nova saída mostrada na última célula:

    Captura de tela que mostra a saída para novos parâmetros.

Execução parametrizada da API Python

Nota

Para saber mais, consulte a documentação do Papermill Python.

  1. Crie um novo bloco de notas. Altere o kernel para Python 3:

    Captura de tela que mostra a opção de menu Novo bloco de anotações e a configuração do valor do Kernel como Python 3.

  2. Adicione uma nova célula de código. Em seguida, use a API Python do Papermill para executar e gerar o bloco de anotações parametrizado de saída:

    Python
    import papermill as pm
    
    pm.execute_notebook(
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Input.ipynb',
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Output.ipynb',
    parameters = dict(x = 10, y = 20)
    )
    

    Captura de tela que mostra a execução da API do Python.

  3. Uma nova célula rotulada # Injected-Parameters contém os novos valores de parâmetro que foram passados. Os novos # Injected-Parameters valores são usados para a nova saída mostrada na última célula:

    Captura de tela que mostra a saída para novos parâmetros.

Próximos passos

Saiba mais sobre notebooks e parametrização: