Compartilhar via


Tutorial: Criar e implantar um pacote no workspace

Para ajudá-lo a começar a usar os Pacotes de Ativos do Databricks no workspace, este tutorial orienta você a criar um pacote com um trabalho, implantá-lo e executar o trabalho no pacote – tudo no workspace.

Para obter requisitos para usar pacotes no workspace, consulte Os Pacotes de Ativos do Databricks nos requisitos do workspace.

Para obter mais informações sobre pacotes, consulte o que são pacotes de ativos do Databricks?.

Criar um pacote

Primeiro, crie um pacote no workspace do Databricks:

  1. Navegue até a pasta git em que você deseja criar seu pacote.

    Dica

    Se você tiver aberto anteriormente a pasta Git no editor no workspace, poderá usar o menu de contextos de criação do navegador do workspace para navegar rapidamente até a pasta Git. Consulte contextos de criação.

  2. Clique no botão Criar e, em seguida, clique no conjunto de ativos. Como alternativa, clique com o botão direito do mouse na pasta Git ou no seu kebab associado na árvore de espaço de trabalho e clique em Criar>pacote de ativos:

    Criar um pacote de ativos

  3. Na caixa de diálogo Criar um pacote de ativos , dê um nome ao pacote de ativos, como um pacote totalmente incrível. O nome do pacote só pode conter letras, números, traços e sublinhados. Selecione Projeto vazioe clique em Criar e implantar .

    Caixa de diálogo Criar novo pacote de ativos

Isso cria um pacote inicial na pasta Git, que inclui um .gitignore arquivo de configuração do Git e o necessário arquivo dos Pacotes de Ativos do Databricks databricks.yml. O databricks.yml arquivo contém a configuração principal do pacote. Para obter detalhes, consulte a configuração do Pacote de Ativos do Databricks.

Novo pacote de ativos

Adicionar um caderno

Em seguida, adicione um notebook ao conjunto. O bloco de anotações no exemplo a seguir imprime "Olá, Mundo!".

  1. Clique no bloco Adicionar caderno no mosaico do projeto em pacote. Como alternativa, clique no kebab do pacote no sumário e clique em Criar>Bloco de Anotações.

  2. Renomeie o bloco de anotações para helloworld.

  3. Defina o idioma do notebook como Python e cole o seguinte na célula do notebook:

    print("Hello World!")
    

Definir um trabalho

Agora defina uma tarefa que execute o notebook.

  1. Clique no ícone de implantação do pacote para alternar para o painel Implantações .

    Ícone do painel de implantações

  2. Na seção Recursos do Pacote , clique em Adicionar e, em seguida, nova definição de trabalho.

    Criar definição de trabalho

  3. Digite run-notebook no campo Nome da tarefa da caixa de diálogo Adicionar tarefa ao pacote existente. Clique em Adicionar e implantar.

  4. Uma caixa de diálogo de confirmação de 'Implantar para dev' é exibida com informações sobre o recurso de job que será criado no workspace de desenvolvimento de destino. Clique em Implantar.

  5. Navegue de volta para os arquivos do pacote clicando no ícone de pasta acima do ícone de implantações. Um recurso run-notebook.job.yml de trabalho foi criado com YAML básico para o trabalho e uma tarefa de trabalho de exemplo com comentários adicionais YAML.

  6. Adicione uma tarefa de notebook à definição do trabalho. Substitua o exemplo de YAML no run-notebook.job.yml arquivo pelo seguinte:

    resources:
      jobs:
        run_notebook:
          name: run-notebook
          queue:
            enabled: true
          tasks:
            - task_key: my-notebook-task
              notebook_task:
                notebook_path: ../helloworld.ipynb
    

    Configuração da tarefa do notebook de trabalho YAML

Para obter detalhes sobre como definir um trabalho no YAML, consulte o trabalho. Para a sintaxe YAML de outros tipos de tarefas suportadas, consulte Adicionar tarefas a trabalhos em Bundles de Recursos do Databricks.

Implantar o pacote

Em seguida, implante o pacote e execute o trabalho que contém a tarefa do helloworld notebook.

  1. No painel Implantações do pacote em Destinos, clique na lista suspensa para selecionar o dev workspace de destino se ele ainda não estiver selecionado. Os workspaces de destino são definidos no targets mapeamento do pacote databricks.yml. Confira Modos de implantação do Pacote de Ativos do Databricks.

    Escolher implantação de destino

  2. Clique no botão Implantar . O pacote é validado e os detalhes da validação aparecem em uma caixa de diálogo.

  3. Examine os detalhes da implantação nesta caixa de diálogo Implantar para dev confirmação e clique em Implantar.

    Implantar na caixa de diálogo de desenvolvimento

    Importante

    Implantar pacotes e executar recursos de pacote executa o código como o usuário atual. Verifique se você confia no código no pacote, incluindo YAML, que pode conter configurações que executam comandos.

O status da implantação é a saída para a janela de saída do Project .

Executar o trabalho

Os recursos de pacote implantados são listados em recursos de pacote. Para executá-lo, clique no ícone de reprodução associado ao recurso de trabalho.

Listar recursos implantados

Navegue até Execuções de trabalho da barra de navegação esquerda para verificar a execução do pacote. O nome da execução do job do pacote recebe um prefixo, por exemplo, [dev someone] run-notebook.

Próximas etapas