BanditPolicy Classe
Define uma política de cessação antecipada com base em critérios de margem e um intervalo de frequência e atraso para avaliação.
Inicialize um BanditPolicy com o fator slack, slack_amount e intervalo de avaliação.
- Herança
-
azureml.train.hyperdrive.policy.EarlyTerminationPolicyBanditPolicy
Construtor
BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)
Parâmetros
Name | Description |
---|---|
slack_factor
|
A proporção utilizada para calcular a distância permitida da execução de experimentação com melhor desempenho. Default value: None
|
slack_amount
|
A distância absoluta permitida da execução com melhor desempenho. Default value: None
|
evaluation_interval
|
A frequência de aplicação da política. Default value: 1
|
delay_evaluation
|
O número de intervalos para os quais atrasar a primeira avaliação de política.
Se for especificada, a política aplica todos os múltiplos que Default value: 0
|
slack_factor
Necessário
|
A proporção utilizada para calcular a distância permitida da execução de experimentação com melhor desempenho. |
slack_amount
Necessário
|
A distância absoluta permitida da execução com melhor desempenho. |
evaluation_interval
Necessário
|
A frequência de aplicação da política. |
delay_evaluation
Necessário
|
O número de intervalos para os quais atrasar a primeira avaliação de política.
Se for especificada, a política aplica todos os múltiplos que |
Observações
A política Bandit utiliza os seguintes parâmetros de configuração:
slack_factor
: a quantidade de margem permitida relativamente à execução de preparação com melhor desempenho. Este fator especifica a margem como uma proporção.slack_amount
: a quantidade de margem permitida relativamente à execução de preparação com melhor desempenho. Este fator especifica a margem como uma quantidade absoluta.evaluation_interval
: opcional. A frequência de aplicação da política. Cada vez que o script de preparação regista as métricas primárias conta como um intervalo.delay_evaluation
: opcional. O número de intervalos para atrasar a avaliação da política. Utilize este parâmetro para evitar a terminação prematura das execuções de preparação. Se for especificada, a política aplica todos os múltiplos queevaluation_interval
são maiores ou iguais adelay_evaluation
.
Qualquer execução que não se insera no fator slack ou na quantidade de margem da métrica de avaliação relativamente à execução com melhor desempenho será terminada.
Considere uma política bandit com slack_factor
= 0,2 e evaluation_interval
= 100.
Suponha que a execução X é a execução com melhor desempenho com um AUC (métrica de desempenho) de 0,8 após 100 intervalos. Além disso, suponha que o melhor AUC reportado para uma execução é Y. Esta política compara o valor (Y + Y * 0,2) com 0,8 e, se menor, cancela a execução. Se delay_evaluation
= 200, a primeira vez que a política será aplicada é no intervalo de 200.
Agora, considere uma política bandit com slack_amount
= 0,2 e evaluation_interval
= 100.
Se a Execução 3 for a execução atualmente com melhor desempenho com um AUC (métrica de desempenho) de 0,8 após 100 intervalos, qualquer execução com um AUC inferior a 0,6 (0,8 - 0,2) após 100 iterações será terminada.
Da mesma forma, também delay_evaluation
pode ser utilizado para atrasar a primeira avaliação da política de terminação para um número específico de sequências.
Para obter mais informações sobre a aplicação de políticas de terminação antecipada, veja Otimizar hiperparâmetros para o seu modelo.
Atributos
delay_evaluation
Devolva o número de sequências para as quais a primeira avaliação está atrasada.
Devoluções
Tipo | Description |
---|---|
A avaliação de atraso. |
evaluation_interval
Devolver o valor do intervalo de avaliação.
Devoluções
Tipo | Description |
---|---|
O intervalo de avaliação. |
slack_factor
Devolva o fator slack no que diz respeito à execução de preparação com melhor desempenho.
Devoluções
Tipo | Description |
---|---|
O factor slack. |
POLICY_NAME
POLICY_NAME = 'Bandit'