Sdílet prostřednictvím


BanditPolicy Třída

Definuje zásady předčasného ukončení založené na kritériích časové rezervy a frekvenci a interval zpoždění pro vyhodnocení.

Inicializujte zásadu BanditPolicy pomocí faktoru slacku, slack_amount a intervalu vyhodnocení.

Dědičnost
azureml.train.hyperdrive.policy.EarlyTerminationPolicy
BanditPolicy

Konstruktor

BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)

Parametry

Name Description
slack_factor

Poměr použitý k výpočtu povolené vzdálenosti od spuštění experimentu s nejlepším výkonem.

výchozí hodnota: None
slack_amount

Absolutní povolená vzdálenost od nejvýkonnějšího běhu

výchozí hodnota: None
evaluation_interval
int

Četnost použití zásad.

výchozí hodnota: 1
delay_evaluation
int

Počet intervalů, pro které se má zpozdit první vyhodnocení zásad. Pokud je zadaný, zásada použije každý násobek evaluation_interval , který je větší nebo roven hodnotě delay_evaluation.

výchozí hodnota: 0
slack_factor
Vyžadováno

Poměr použitý k výpočtu povolené vzdálenosti od spuštění experimentu s nejlepším výkonem.

slack_amount
Vyžadováno

Absolutní povolená vzdálenost od nejvýkonnějšího běhu

evaluation_interval
Vyžadováno
int

Četnost použití zásad.

delay_evaluation
Vyžadováno
int

Počet intervalů, pro které se má zpozdit první vyhodnocení zásad. Pokud je zadaný, zásada použije každý násobek evaluation_interval , který je větší nebo roven hodnotě delay_evaluation.

Poznámky

Zásady Bandit mají následující parametry konfigurace:

  • slack_factor: Povolená časová rezerva s ohledem na trénovací běh s nejlepším výkonem. Tento faktor určuje časovou rezervu jako poměr.

  • slack_amount: Povolená časová rezerva s ohledem na trénovací běh s nejlepším výkonem. Tento faktor určuje časovou rezervu jako absolutní částku.

  • evaluation_interval:Volitelné. Četnost použití zásad. Pokaždé, když trénovací skript protokoluje, se primární metrika počítá jako jeden interval.

  • delay_evaluation:Volitelné. Počet intervalů zpoždění vyhodnocení zásad Tento parametr použijte, pokud chcete zabránit předčasnému ukončení trénovacích běhů. Pokud je zadaný, zásada použije každý násobek evaluation_interval , který je větší nebo roven hodnotě delay_evaluation.

Všechna spuštění, která nespadají do faktoru časové rezervy nebo časové rezervy metriky vyhodnocení s ohledem na spuštění s nejlepším výkonem, budou ukončena.

Představte si zásadu Bandit s slack_factor = 0,2 a evaluation_interval = 100. Předpokládejme, že spuštění X je aktuálně nejvýkonnější spuštění s metrikou AUC (metrika výkonu) 0,8 po 100 intervalech. Dále předpokládejme, že nejlepší AUC hlášená pro spuštění je Y. Tato zásada porovná hodnotu (Y + Y × 0,2) s hodnotou 0,8, a pokud je menší, zruší spuštění. Pokud delay_evaluation = 200, použije se zásada poprvé v intervalu 200.

Teď zvažte zásadu Bandit s slack_amount = 0,2 a evaluation_interval = 100. Pokud je spuštění 3 aktuálně nejvýkonnější spuštění s AUC (metrikou výkonu) 0,8 po 100 intervalech, pak se všechna spuštění s AUC nižší než 0,6 (0,8 až 0,2) po 100 iteracích ukončí. Podobně delay_evaluation lze použít také ke zpoždění vyhodnocení zásad prvního ukončení pro určitý počet sekvencí.

Další informace o použití zásad předčasného ukončení najdete v tématu Ladění hyperparametrů pro váš model.

Atributy

delay_evaluation

Vrátí počet sekvencí, u kterých je první vyhodnocení zpožděné.

Návraty

Typ Description
int

Vyhodnocení zpoždění.

evaluation_interval

Vrátí hodnotu intervalu vyhodnocení.

Návraty

Typ Description
int

Interval vyhodnocení.

slack_factor

Vrátí faktor časové rezervy s ohledem na nejvýkonnější trénovací běh.

Návraty

Typ Description

Faktor časové rezervy.

POLICY_NAME

POLICY_NAME = 'Bandit'