BanditPolicy Classe

Referência

Define uma política de encerramento antecipado com base nos critérios de margem de atraso e uma frequência e um intervalo de atraso para avaliação.

Inicialize um BanditPolicy com o fator slack, slack_amount e intervalo de avaliação.

Herança: azureml.train.hyperdrive.policy.EarlyTerminationPolicy

BanditPolicy

Construtor

BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)

Parâmetros

Nome	Description
slack_factor	float A taxa usada para calcular a distância permitida da execução de experimento de melhor desempenho. valor padrão: None
slack_amount	float A distância absoluta permitida da execução de melhor desempenho. valor padrão: None
evaluation_interval	int A frequência para aplicar a política. valor padrão: 1
delay_evaluation	int O número de intervalos para os quais atrasar a primeira avaliação de política. Se for especificado, a política se aplicará a cada múltiplo de `evaluation_interval` maior que ou igual a `delay_evaluation`. valor padrão: 0
slack_factor Obrigatório	float A taxa usada para calcular a distância permitida da execução de experimento de melhor desempenho.
slack_amount Obrigatório	float A distância absoluta permitida da execução de melhor desempenho.
evaluation_interval Obrigatório	int A frequência para aplicar a política.
delay_evaluation Obrigatório	int O número de intervalos para os quais atrasar a primeira avaliação de política. Se for especificado, a política se aplicará a cada múltiplo de `evaluation_interval` maior que ou igual a `delay_evaluation`.

Comentários

A política do Bandit usa os seguintes parâmetros de configuração:

slack_factor: o valor de margem de atraso permitida em relação à execução de treinamento de melhor desempenho. Esse fator especifica a margem de atraso como uma proporção.
slack_amount: o valor de margem de atraso permitida em relação à execução de treinamento de melhor desempenho. Esse fator especifica a margem de atraso como um valor absoluto.
evaluation_interval: Opcional. A frequência para aplicar a política. Cada vez que o script de treinamento registra em log a métrica primária conta como um intervalo.
delay_evaluation: Opcional. O número de intervalos para atrasar a avaliação da política. Use esse parâmetro para evitar o encerramento prematuro de execuções de treinamento. Se for especificado, a política se aplicará a cada múltiplo de evaluation_interval maior que ou igual a delay_evaluation.

Qualquer execução que não se enquadrar no fator de margem de atraso ou no valor da margem de atraso da métrica de avaliação em relação à execução de melhor desempenho será encerrada.

Considere uma política de Bandit com slack_factor = 0.2 e evaluation_interval = 100. Suponha que a execução X seja a execução de melhor desempenho no momento com uma AUC (métrica de desempenho) de 0,8 após 100 intervalos. Além disso, suponha que a melhor AUC relatada para uma execução seja Y. Essa política compara o valor (Y + Y * 0,2) a 0,8 e, se for menor, cancela a execução. Se delay_evaluation = 200, a primeira vez que a política será aplicada será no intervalo 200.

Considere uma política de Bandit com slack_amount = 0.2 e evaluation_interval = 100. Se a execução 3 for a melhor execução atualmente com um AUC (métrica de desempenho) de 0,8 após 100 intervalos, qualquer execução com um AUC menor que 0,6 (0,8 – 0,2) depois de 100 iterações será encerrada. Da mesma forma, o delay_evaluation também pode ser usado para atrasar a primeira avaliação da política de encerramento para um número específico de sequências.

Para obter mais informações sobre como aplicar políticas de encerramento antecipado, confira Ajustar hiperparâmetros para seu modelo.

Atributos

delay_evaluation

Retorna o número de sequências para o qual a primeira avaliação é atrasada.

Retornos

Tipo	Description
int	A avaliação do atraso.

evaluation_interval

Retorna o valor do intervalo de avaliação.

Retornos

Tipo	Description
int	O intervalo da avaliação.

slack_factor

Retorna o fator de margem de atraso permitida em relação à execução de treinamento de melhor desempenho.

Retornos

Tipo	Description
float	O fator de margem de atraso.

POLICY_NAME

POLICY_NAME = 'Bandit'

Compartilhar via

BanditPolicy Classe

Construtor

Parâmetros

Comentários

Atributos

delay_evaluation

Retornos

evaluation_interval

Retornos

slack_factor

Retornos

POLICY_NAME

Comentários

Comentários

Recursos adicionais