BanditPolicy Klas
Definieert een beleid voor vroegtijdige beëindiging op basis van margecriteria en een frequentie- en vertragingsinterval voor evaluatie.
Initialiseer een BanditPolicy met slack-factor, slack_amount en evaluatie-interval.
- Overname
-
azureml.train.hyperdrive.policy.EarlyTerminationPolicyBanditPolicy
Constructor
BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)
Parameters
Name | Description |
---|---|
slack_factor
|
De verhouding die wordt gebruikt om de toegestane afstand tot de best presterende experimentuitvoering te berekenen. Default value: None
|
slack_amount
|
De absolute afstand die is toegestaan tot de best presterende run. Default value: None
|
evaluation_interval
|
De frequentie voor het toepassen van het beleid. Default value: 1
|
delay_evaluation
|
Het aantal intervallen waarvoor de eerste beleidsevaluatie moet worden uitgesteld.
Indien opgegeven, wordt elk veelvoud van Default value: 0
|
slack_factor
Vereist
|
De verhouding die wordt gebruikt om de toegestane afstand tot de best presterende experimentuitvoering te berekenen. |
slack_amount
Vereist
|
De absolute afstand die is toegestaan tot de best presterende run. |
evaluation_interval
Vereist
|
De frequentie voor het toepassen van het beleid. |
delay_evaluation
Vereist
|
Het aantal intervallen waarvoor de eerste beleidsevaluatie moet worden uitgesteld.
Indien opgegeven, wordt elk veelvoud van |
Opmerkingen
Het Bandit-beleid heeft de volgende configuratieparameters:
slack_factor
: De hoeveelheid marge die is toegestaan met betrekking tot de best presterende trainingsuitvoering. Deze factor geeft de marge aan als een verhouding.slack_amount
: De hoeveelheid marge die is toegestaan met betrekking tot de best presterende trainingsuitvoering. Met deze factor wordt de marge als een absoluut bedrag opgegeven.evaluation_interval
:Optionele. De frequentie voor het toepassen van het beleid. Telkens wanneer het trainingsscript registreert, worden de primaire metrische gegevens als één interval geteld.delay_evaluation
:Optionele. Het aantal intervallen om beleidsevaluatie te vertragen. Gebruik deze parameter om voortijdige beëindiging van trainingsuitvoeringen te voorkomen. Indien opgegeven, wordt elk veelvoud vanevaluation_interval
het beleid toegepast dat groter is dan of gelijk is aandelay_evaluation
.
Elke uitvoering die niet binnen de margefactor of margehoeveelheid van de evaluatiewaarde valt met betrekking tot de best presterende uitvoering, wordt beëindigd.
Overweeg een Bandit-beleid met slack_factor
= 0,2 en evaluation_interval
= 100.
Stel dat run X momenteel de best presterende uitvoering is met een AUC (prestatiemetriek) van 0,8 na intervallen van 100. Stel verder dat de beste AUC die voor een uitvoering is gerapporteerd, Y is. Met dit beleid wordt de waarde (Y + Y * 0,2) vergeleken met 0,8. Als de waarde kleiner is, wordt de uitvoering geannuleerd. Als delay_evaluation
= 200, is de eerste keer dat het beleid wordt toegepast op interval 200.
Overweeg nu een Bandit-beleid met slack_amount
= 0,2 en evaluation_interval
= 100.
Als uitvoering 3 momenteel de best presterende uitvoering is met een AUC (prestatiemetriek) van 0,8 na 100 intervallen, wordt elke uitvoering met een AUC kleiner dan 0,6 (0,8 - 0,2) na 100 iteraties beëindigd.
Op dezelfde manier kan de delay_evaluation
ook worden gebruikt om de evaluatie van het eerste beëindigingsbeleid voor een bepaald aantal reeksen te vertragen.
Zie Hyperparameters afstemmen voor uw model voor meer informatie over het toepassen van beleid voor vroegtijdige beëindiging.
Kenmerken
delay_evaluation
Retourneert het aantal reeksen waarvoor de eerste evaluatie is vertraagd.
Retouren
Type | Description |
---|---|
De vertragingsevaluatie. |
evaluation_interval
Retourneer de waarde van het evaluatie-interval.
Retouren
Type | Description |
---|---|
Het evaluatie-interval. |
slack_factor
Retourneer de margefactor met betrekking tot de best presterende trainingsuitvoering.
Retouren
Type | Description |
---|---|
De slack-factor. |
POLICY_NAME
POLICY_NAME = 'Bandit'