Partilhar via


Noções básicas sobre o trabalho e os estados de tarefa

No HPC Pack, trabalhos e tarefas têm estados de ciclo de vida quase idênticos. Os principais estados do ciclo de vida são Configurando, Enfileirados, Executando, Concluído,com Falha e Cancelado. Trabalhos e tarefas também passam por breves estados de transição. A tabela a seguir resume todos os estados do ciclo de vida.

Estados de trabalho e tarefa

Estado Definição
configurando O trabalho ou tarefa está no sistema, mas não foi enviado para a fila.
enviado O trabalho ou tarefa foi enviado e aguarda validação antes de ser enfileirado.
Validando O Serviço de Agendador de Trabalho do HPC está validando o trabalho ou a tarefa. Durante a validação, o Serviço de Agendador de Trabalho HPC confirma permissões, aplica as configurações padrão para quaisquer propriedades que o proprietário do trabalho não especificou e valida cada propriedade em relação a restrições. As configurações e restrições padrão são definidas pelo modelo de trabalho. Para obter mais informações sobre modelos de trabalho, consulte Noções básicas sobre modelos de trabalho –do Job Manager. O Serviço de Agendador de Trabalho HPC também confirma que as propriedades do trabalho abrangem todas as propriedades da tarefa (por exemplo, nenhuma tarefa tem um tempo de execução maior que o tempo de execução do trabalho).

Durante a validação, o trabalho também pode passar por um aplicativo de filtro de envio personalizado definido pelo administrador do cluster.

Se o trabalho for aprovado na validação, ele passará para o estado enfileirado. Se o trabalho não passar na validação, o trabalho exibirá uma mensagem de erro e o trabalho será movido para o estado com falha do .
na fila O trabalho ou a tarefa passou pela validação e está aguardando para ser agendada e ativada (execução).

Quando um trabalho em execução, uma tarefa Basic ou uma subtarefa de Varredura Paramétrica é preempípida pelo Serviço de Agendador de Trabalho do HPC, ela volta para o estado de em Fila (a menos que a tarefa não seja reruncável, nesse caso, ela é marcada como falha). Observação: no HPC Pack 2012, a opção padrão para comportamento de preempção em modo de agendamento enfileirado é a preempção imediata no nível da tarefa, em vez de preempção no nível do trabalho.
de Expedição Esse estado só se aplica a tarefas. O Serviço de Agendador de Trabalho do HPC alocou recursos para a tarefa e está entrando em contato com os nós alocados para começar a executar a tarefa. Quando a tarefa é iniciada, ela passa para o estado Executando.
executando O trabalho ou tarefa está em execução em um ou mais nós.
de término do O trabalho ou tarefa foi concluído e a limpeza de tarefas ou trabalho está em andamento.
concluído O trabalho ou tarefa foi concluído com êxito.
falha na O trabalho ou tarefa não foi concluído, parou de ser executado ou retornou um código de saída que indica falha (por padrão, qualquer código de saída diferente de zero).

Além disso, uma tarefa em execução é marcada como falha quando:

- O proprietário do trabalho ou um administrador de cluster cancela a tarefa.
- O Serviço de Agendador de Trabalho do HPC cancela uma tarefa porque excedeu o tempo de execução máximo.
- O Serviço de Agendador de Trabalho do HPC preempõe uma tarefa que não está marcada como executável novamente.
- O Serviço de Agendador de Trabalho do HPC preempõe uma subtarefa iniciada por recurso (de Preparação de Nó,de Versão do Nó e subtarefas do Serviço ).

Se um trabalho ou tarefa não for iniciado devido a uma falha de cluster, o trabalho ou tarefa será repetido automaticamente um número especificado de vezes antes de ser marcado como Falha.
cancelando O trabalho ou a tarefa foi cancelada e a limpeza está em andamento.
Cancelada O trabalho foi cancelado pelo proprietário do trabalho, um administrador de cluster ou pelo Serviço de Agendador de Trabalho do HPC. Por exemplo, o Serviço de Agendador de Trabalho HPC pode cancelar um trabalho se exceder seu runtime ou se ele for preempido.

A tarefa foi cancelada pelo proprietário do trabalho ou por um administrador de cluster antes de começar a ser executada. Se uma tarefa em execução for cancelada, a tarefa será marcada como Falha.

Para cancelar um trabalho ou tarefa, consulte Cancelar um Trabalho ou Tarefa – do Gerenciador de Trabalhos ou Forçar Cancelar um Trabalho ou Tarefa – Gerente de Trabalho.

Referências adicionais