Noções básicas sobre o trabalho e os estados de tarefa
No HPC Pack, trabalhos e tarefas têm estados de ciclo de vida quase idênticos. Os principais estados do ciclo de vida são
Estados de trabalho e tarefa
Estado | Definição |
---|---|
configurando | O trabalho ou tarefa está no sistema, mas não foi enviado para a fila. |
enviado | O trabalho ou tarefa foi enviado e aguarda validação antes de ser enfileirado. |
Validando | O Serviço de Agendador de Trabalho do HPC está validando o trabalho ou a tarefa. Durante a validação, o Serviço de Agendador de Trabalho HPC confirma permissões, aplica as configurações padrão para quaisquer propriedades que o proprietário do trabalho não especificou e valida cada propriedade em relação a restrições. As configurações e restrições padrão são definidas pelo modelo de trabalho. Para obter mais informações sobre modelos de trabalho, consulte Noções básicas sobre modelos de trabalho –do Job Manager. O Serviço de Agendador de Trabalho HPC também confirma que as propriedades do trabalho abrangem todas as propriedades da tarefa (por exemplo, nenhuma tarefa tem um tempo de execução maior que o tempo de execução do trabalho). Durante a validação, o trabalho também pode passar por um aplicativo de filtro de envio personalizado definido pelo administrador do cluster. Se o trabalho for aprovado na validação, ele passará para o estado |
na fila | O trabalho ou a tarefa passou pela validação e está aguardando para ser agendada e ativada (execução). Quando um trabalho em execução, uma tarefa |
de Expedição |
Esse estado só se aplica a tarefas. O Serviço de Agendador de Trabalho do HPC alocou recursos para a tarefa e está entrando em contato com os nós alocados para começar a executar a tarefa. Quando a tarefa é iniciada, ela passa para o estado Executando. |
executando | O trabalho ou tarefa está em execução em um ou mais nós. |
de término do |
O trabalho ou tarefa foi concluído e a limpeza de tarefas ou trabalho está em andamento. |
concluído | O trabalho ou tarefa foi concluído com êxito. |
falha na | O trabalho ou tarefa não foi concluído, parou de ser executado ou retornou um código de saída que indica falha (por padrão, qualquer código de saída diferente de zero). Além disso, uma tarefa em execução é marcada como falha quando: - O proprietário do trabalho ou um administrador de cluster cancela a tarefa. - O Serviço de Agendador de Trabalho do HPC cancela uma tarefa porque excedeu o tempo de execução máximo. - O Serviço de Agendador de Trabalho do HPC preempõe uma tarefa que não está marcada como executável novamente. - O Serviço de Agendador de Trabalho do HPC preempõe uma subtarefa iniciada por recurso ( Se um trabalho ou tarefa não for iniciado devido a uma falha de cluster, o trabalho ou tarefa será repetido automaticamente um número especificado de vezes antes de ser marcado como Falha. |
cancelando | O trabalho ou a tarefa foi cancelada e a limpeza está em andamento. |
Cancelada | O trabalho foi cancelado pelo proprietário do trabalho, um administrador de cluster ou pelo Serviço de Agendador de Trabalho do HPC. Por exemplo, o Serviço de Agendador de Trabalho HPC pode cancelar um trabalho se exceder seu runtime ou se ele for preempido. A tarefa foi cancelada pelo proprietário do trabalho ou por um administrador de cluster antes de começar a ser executada. Se uma tarefa em execução for cancelada, a tarefa será marcada como Falha. Para cancelar um trabalho ou tarefa, consulte Cancelar um Trabalho ou Tarefa – do Gerenciador de Trabalhos ou Forçar Cancelar um Trabalho ou Tarefa – Gerente de Trabalho. |
Referências adicionais
noções básicas sobre trabalhos e tarefas – do Gerenciador de Trabalhos
gerenciamento de trabalhos e tarefas – do Gerenciador de Trabalhos
acompanhar o estado do trabalho – do Gerenciador de Trabalho