BanditPolicy Třída

Reference

Definuje zásady předčasného ukončení založené na kritériích časové rezervy a frekvenci a interval zpoždění pro vyhodnocení.

Inicializujte zásadu BanditPolicy pomocí faktoru slacku, slack_amount a intervalu vyhodnocení.

Dědičnost: azureml.train.hyperdrive.policy.EarlyTerminationPolicy

BanditPolicy

Konstruktor

BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)

Parametry

Name	Description
slack_factor	float Poměr použitý k výpočtu povolené vzdálenosti od spuštění experimentu s nejlepším výkonem. výchozí hodnota: None
slack_amount	float Absolutní povolená vzdálenost od nejvýkonnějšího běhu výchozí hodnota: None
evaluation_interval	int Četnost použití zásad. výchozí hodnota: 1
delay_evaluation	int Počet intervalů, pro které se má zpozdit první vyhodnocení zásad. Pokud je zadaný, zásada použije každý násobek `evaluation_interval` , který je větší nebo roven hodnotě `delay_evaluation`. výchozí hodnota: 0
slack_factor Vyžadováno	float Poměr použitý k výpočtu povolené vzdálenosti od spuštění experimentu s nejlepším výkonem.
slack_amount Vyžadováno	float Absolutní povolená vzdálenost od nejvýkonnějšího běhu
evaluation_interval Vyžadováno	int Četnost použití zásad.
delay_evaluation Vyžadováno	int Počet intervalů, pro které se má zpozdit první vyhodnocení zásad. Pokud je zadaný, zásada použije každý násobek `evaluation_interval` , který je větší nebo roven hodnotě `delay_evaluation`.

Poznámky

Zásady Bandit mají následující parametry konfigurace:

slack_factor: Povolená časová rezerva s ohledem na trénovací běh s nejlepším výkonem. Tento faktor určuje časovou rezervu jako poměr.
slack_amount: Povolená časová rezerva s ohledem na trénovací běh s nejlepším výkonem. Tento faktor určuje časovou rezervu jako absolutní částku.
evaluation_interval:Volitelné. Četnost použití zásad. Pokaždé, když trénovací skript protokoluje, se primární metrika počítá jako jeden interval.
delay_evaluation:Volitelné. Počet intervalů zpoždění vyhodnocení zásad Tento parametr použijte, pokud chcete zabránit předčasnému ukončení trénovacích běhů. Pokud je zadaný, zásada použije každý násobek evaluation_interval , který je větší nebo roven hodnotě delay_evaluation.

Všechna spuštění, která nespadají do faktoru časové rezervy nebo časové rezervy metriky vyhodnocení s ohledem na spuštění s nejlepším výkonem, budou ukončena.

Představte si zásadu Bandit s slack_factor = 0,2 a evaluation_interval = 100. Předpokládejme, že spuštění X je aktuálně nejvýkonnější spuštění s metrikou AUC (metrika výkonu) 0,8 po 100 intervalech. Dále předpokládejme, že nejlepší AUC hlášená pro spuštění je Y. Tato zásada porovná hodnotu (Y + Y × 0,2) s hodnotou 0,8, a pokud je menší, zruší spuštění. Pokud delay_evaluation = 200, použije se zásada poprvé v intervalu 200.

Teď zvažte zásadu Bandit s slack_amount = 0,2 a evaluation_interval = 100. Pokud je spuštění 3 aktuálně nejvýkonnější spuštění s AUC (metrikou výkonu) 0,8 po 100 intervalech, pak se všechna spuštění s AUC nižší než 0,6 (0,8 až 0,2) po 100 iteracích ukončí. Podobně delay_evaluation lze použít také ke zpoždění vyhodnocení zásad prvního ukončení pro určitý počet sekvencí.

Další informace o použití zásad předčasného ukončení najdete v tématu Ladění hyperparametrů pro váš model.

Atributy

delay_evaluation

Vrátí počet sekvencí, u kterých je první vyhodnocení zpožděné.

Návraty

Typ	Description
int	Vyhodnocení zpoždění.

evaluation_interval

Vrátí hodnotu intervalu vyhodnocení.

Návraty

Typ	Description
int	Interval vyhodnocení.

slack_factor

Vrátí faktor časové rezervy s ohledem na nejvýkonnější trénovací běh.

Návraty

Typ	Description
float	Faktor časové rezervy.

POLICY_NAME

POLICY_NAME = 'Bandit'

Sdílet prostřednictvím

BanditPolicy Třída

Konstruktor

Parametry

Poznámky

Atributy

delay_evaluation

Návraty

evaluation_interval

Návraty

slack_factor

Návraty

POLICY_NAME

Váš názor

Váš názor

Další materiály