Noções básicas sobre a Política de Disponibilidade do Nó do Azure
A política de disponibilidade do nó do Azure determina como e quando os nós do Azure são iniciados (as instâncias de função são implantadas no Azure) e parados (as instâncias de função são removidas no Azure).
Você tem as duas opções a seguir para configurar a disponibilidade para seus nós do Azure:
Automaticamente Os nós são configurados automaticamente para serem iniciados (provisionados) e, em seguida, trazidos para o estado doOnline durante um ou mais intervalos agendados por semana. Você pode especificar várias vezes por semana quando quiser que os nós estejam disponíveis para executar trabalhos. No final de cada bloco de tempo, os nós são interrompidos automaticamente: os nós são colocados offline e as instâncias de função são removidas. Opcionalmente, você pode especificar um intervalo de tempo antes do final de um bloco online quando todos os trabalhos em execução nos nós são drenados. Manual Para disponibilizar os nós do Azure para executar trabalhos, primeiro você deve iniciar manualmente (provisionar) os nós e, em seguida, colocá-los online.
Considerações adicionais
O provisionamento das instâncias de função do Azure pode levar vários minutos em algumas condições, e parar e excluir as instâncias também pode levar vários minutos.
Os nós estão disponíveis para executar trabalhos em um bloco de tempo online somente depois que as instâncias de função tiverem sido provisionadas no Azure. A hora agendada para iniciar (e colocar online) os nós não inclui o tempo que o Azure leva para provisionar as instâncias de função.
Se uma política de disponibilidade automática estiver configurada, como prática recomendada, planeje por 60 minutos em cada bloco de tempo online para implantação de nó, além do tempo que você deseja que os nós estejam disponíveis para executar trabalhos. Você também deve evitar o agendamento de blocos de tempo online em intervalos curtos.
Editar a política de disponibilidade do nó do Azure altera a política para nós que já foram adicionados ao cluster HPC usando o modelo de nó, bem como para nós que você adicionar mais tarde. Por exemplo, você pode editar o modelo de nó do Azure para que os nós configurados para iniciar e parar automaticamente de acordo com um agendamento semanal sejam configurados para iniciar e parar manualmente.
Dependendo da configuração da política de disponibilidade no modelo de nó do Azure e da configuração de Período de Carência de Cancelamento de Tarefa na Configuração do Agendador de Trabalho, a hora exata em que os nós do Azure são interrompidos e a implantação termina pode ser diferente do final agendado de um bloco de tempo online. Isso pode ocorrer quando as tarefas de HPC ainda estão em execução perto do final do bloco de tempo online. Para obter mais informações, consulte a seção Interação da política de disponibilidade com a configuração de Período de Carência de Cancelamento de Tarefa.
Interação da política de disponibilidade com a configuração de Período de Carência de Cancelamento de Tarefa
Quando uma política de disponibilidade automática é configurada, os nós do Azure não iniciam trabalhos depois que um bloco de tempo online é aprovado. No entanto, as tarefas de HPC que ainda estão em execução no final de um bloco de tempo online podem continuar a ser executadas por um período se a configuração de Período de Carência de Cancelamento de Tarefa estiver configurada. A propriedade de cluster Task Cancel Grace Period define um período de tempo para os aplicativos salvarem informações de estado e limparem antes de sair (o período padrão é 15 segundos). A hora exata em que uma tarefa termina depende da rapidez com que a tarefa responde ao evento CTRL_BREAK (o equivalente à combinação de teclas CTRL+BREAK). As tarefas que não processam o evento serão encerradas imediatamente, enquanto as que processam o evento podem levar até que o Período de Carência de Cancelamento de Tarefa saia normalmente.
A tabela a seguir resume quando as tarefas de HPC param de ser executadas como resultado da interação entre a política de disponibilidade do nó do Azure e a configuração de Período de Carência de Cancelamento de Tarefa. Possíveis impactos e soluções alternativas estão listados. A interação difere dependendo se um período de "drenagem" está configurado na política de disponibilidade. O período de drenagem é uma configuração opcional especifica o número de minutos antes do fim de um bloco de tempo online durante o qual, quando nenhuma nova tarefa será iniciada nesses nós.
Período de drenagem de tarefas configurado na política de disponibilidade | Quando o Período de Carência de Cancelamento de Tarefa começa | Ao executar as tarefas de HPC terminam | Impactos | Soluções alternativas |
---|---|---|---|---|
Sim | Início do período de drenagem | Entre o início e o final do Período de Carência de Cancelamento da Tarefa, dependendo se a tarefa sai após receber o sinal ou usa o período de tempo fornecido pelo Período de Carência de Cancelamento de Tarefa. Pode ser antes do fim agendado do bloco de tempo online. exemplo - Fim agendado do bloco de horário online: 20h - Período de carência: 5 min - Período de drenagem: 10 min As tarefas em execução terminarão entre 19h50 e 19h55 |
- Os nós do Azure são interrompidos e a implantação é retirada antes do esperado. - O uso de recursos do Azure para tarefas de HPC pode não ser ideal. |
- Ajuste o Período de Carência de Cancelamento de Tarefa para ser o mesmo que o período de drenagem ou o mais semelhante possível. – Especifique valores pequenos para o período de drenagem e o período de carência, se seus aplicativos permitirem. |
Não | Fim do bloco de tempo online configurado | Entre o início e o final do Período de Carência de Cancelamento da Tarefa, dependendo se a tarefa sai após receber o sinal ou usa o período de tempo fornecido pelo Período de Carência de Cancelamento de Tarefa. Pode ser após o fim agendado do bloco de tempo online. exemplo - Fim agendado do bloco de horário online: 20h - Período de carência: 5 min As tarefas em execução terminarão entre 20h e 20h05 |
– As tarefas de HPC podem continuar em execução além do fim do bloco de tempo online, desde que o Período de Carência de Cancelamento de Tarefa. – A implantação do nó do Azure pode ser estendida além do fim do bloco de tempo do nó, desde que o Período de Carência de Cancelamento de Tarefa. |
- Se os aplicativos permitirem, ajuste o Período de Cortesia de Cancelamento de Tarefa para ser um valor menor. |
Consulte Também
configurar um modelo de nó do Azure para o Microsoft HPC Pack
noções básicas sobre estados de nó, integridade e operações
definir o número de nós de proxy do Azure