Hyperopt-koncept

Kommentar

Versionen med öppen källkod av Hyperopt underhålls inte längre.

Hyperopt ingår inte i Databricks Runtime for Machine Learning efter 16,4 LTS ML. Azure Databricks rekommenderar att du använder antingen Optuna- för ennodsoptimering eller RayTune för en liknande upplevelse som de inaktuella hyperopt-distribuerade hyperparameterjusteringsfunktionerna. Läs mer om hur du använder RayTune i Azure Databricks.

I den här artikeln beskrivs några av de begrepp som du behöver känna till för att använda distribuerad Hyperopt.

Exempel som illustrerar hur du använder Hyperopt i Azure Databricks finns i Hyperopt.

`fmin()`

Du använder fmin() för att köra en Hyperopt-körning. Argumenten för fmin() visas i tabellen. Mer information finns i Hyperopt-dokumentationen . Exempel på hur du använder varje argument finns i exempelanteckningsböckerna.

Argumentnamn	beskrivning
`fn`	Objektiv funktion. Hyperopt anropar den här funktionen med värden som genereras från hyperparameterrummet som anges i space-argumentet. Den här funktionen kan returnera förlusten som ett skalärt värde eller i en ordlista (se Hyperopt-dokument för mer information). Den här funktionen innehåller vanligtvis kod för modellträning och förlustberäkning.
`space`	Definierar hyperparameterutrymmet som ska sökas. Hyperopt ger stor flexibilitet i hur det här utrymmet definieras. Du kan välja ett kategoriskt alternativ, till exempel algoritm eller probabilistisk distribution för numeriska värden som uniform och logg.
`algo`	Hyperopt-sökalgoritm som ska användas för att söka i hyperparameterutrymme. De vanligaste är `hyperopt.rand.suggest` för slumpmässig sökning och `hyperopt.tpe.suggest` för TPE.
`max_evals`	Antal inställningar för hyperparameter som ska provas (antalet modeller som passar).
`max_queue_len`	Antal hyperparameterinställningar Som Hyperopt bör generera i förväg. Eftersom algoritmen för Hyperopt TPE-generering kan ta lite tid kan det vara bra att öka detta utöver standardvärdet 1, men i allmänhet inte större än `SparkTrials` inställningen `parallelism`.
`trials`	Ett `Trials` eller `SparkTrials` -objekt. Använd `SparkTrials` när du anropar algoritmer med en enda dator, till exempel scikit-learn-metoder i målfunktionen. Använd `Trials` när du anropar distribuerade träningsalgoritmer som MLlib-metoder eller Horovod i målfunktionen.
`early_stop_fn`	En valfri funktion för tidigt stopp för att avgöra om `fmin` ska stoppas innan `max_evals` nås. Standard är `None`. Indatasignaturen för funktionen är `Trials, args` och utdatasignaturen är `bool, args`. Utdata booleskt värde angör huruvida man ska stoppa eller inte. `*args` är ett tillstånd där utdata från ett anrop till `early_stop_fn` fungerar som indata till nästa anrop. `Trials` kan vara ett `SparkTrials` objekt. När du använder `SparkTrials` är funktionen för tidig stopp inte garanterad att köras efter varje försök utan istället övervakas. Exempel på en funktion för tidig stoppning

Klassen `SparkTrials`

SparkTrials är ett API som utvecklats av Databricks som gör att du kan distribuera en Hyperopt-körning utan att göra andra ändringar i Hyperopt-koden. SparkTrials påskyndar justeringen av en enda dator genom att distribuera utvärderingsversioner till Spark-arbetare.

Kommentar

SparkTrials är utformad för att parallellisera beräkningar för ML-modeller på en enskild maskin, såsom scikit-learn. För modeller som skapats med distribuerade ML-algoritmer som MLlib eller Horovod ska du inte använda SparkTrials. I det här fallet parallelliseras modellskapandeprocessen automatiskt i klustret och du bör använda standardklassen TrialsHyperopt .

I det här avsnittet beskrivs hur du konfigurerar de argument som du skickar till SparkTrials och implementeringsaspekter av SparkTrials.

Argument

SparkTrials tar två valfria argument:

parallelism: Maximalt antal utvärderingsförsök som ska utvärderas samtidigt. Med ett högre tal kan du skala ut testning av fler inställningar för hyperparametrar. Eftersom Hyperopt föreslår nya försök baserade på tidigare resultat finns det en kompromiss mellan parallellitet och adaptivitet. För en fast max_evals, påskyndar större parallellitet beräkningar, men lägre parallellitet kan leda till bättre resultat eftersom varje iteration har tillgång till fler tidigare resultat.

Standard: Antal Spark-exekutorer som är tillgängliga. Max: 128. Om värdet är större än antalet samtidiga uppgifter som tillåts av klusterkonfigurationen minskar SparkTrials parallelliteten till det här värdet.
timeout: Maximalt antal sekunder som ett fmin() anrop kan ta. När det här antalet överskrids avslutas alla körningar och fmin() stängs. Information om slutförda körningar sparas.

Implementering

När du definierar den målfunktion fn som skickas till fmin(), och när du väljer en klusterkonfiguration, är det bra att förstå hur SparkTrials distribuerar justeringsuppgifter.

I Hyperopt motsvarar en utvärderingsversion vanligtvis att passa en modell på en inställning av hyperparametrar. Hyperopt genererar iterativt försök, utvärderar dem och upprepar.

Med SparkTrialsgenererar drivrutinsnoden i klustret nya utvärderingsversioner och arbetsnoderna utvärderar dessa utvärderingsversioner. Varje försök genereras med ett Spark-jobb som har en uppgift och utvärderas i uppgiften på en arbetsdator. Om klustret har konfigurerats för att köra flera uppgifter per arbetare kan flera utvärderingsversioner utvärderas samtidigt på den arbetaren.

`SparkTrials` och MLflow

Databricks Runtime ML stöder loggning till MLflow från arbetare. Du kan lägga till anpassad loggningskod i den målfunktion som du skickar till Hyperopt.

SparkTrials loggar justeringsresultat som kapslade MLflow-körningar på följande sätt:

Huvudkörning eller överordnad körning: Anropet till fmin() loggas som huvudkörning. Om det finns en aktiv körning loggar SparkTrials till den här aktiva körningen och avslutar inte körningen när fmin() returnerar. Om det inte finns någon aktiv körning SparkTrials skapas en ny körning, loggas till den och avslutas körningen innan fmin() returneras.
Underordnade körningar: Varje hyperparameterinställning som testas (en "utvärderingsversion") loggas som en underordnad körning under huvudkörningen. Loggposter från MLflow-arbetare lagras också under motsvarande underordnade körningar.

När du anropar fmin(), rekommenderar Databricks aktiv MLflow-körningshantering, det vill säga att du omsluter anropet till fmin() i en with mlflow.start_run():-instruktion. Detta säkerställer att varje fmin() anrop loggas till en separat MLflow-huvudkörning och gör det enklare att logga extra taggar, parametrar eller mått för den körningen.

Kommentar

När du anropar fmin() flera gånger inom samma aktiva MLflow-körning loggar MLflow dessa anrop till samma huvudkörning. För att lösa namnkonflikter för loggade parametrar och taggar lägger MLflow till ett UUID i namn med konflikter.

När du registrerar från medarbetare behöver du inte hantera körningar på ett uttryckligt sätt i målfunktionen. Anropa mlflow.log_param("param_from_worker", x) i målfunktionen för att logga en parameter till den underordnade körningen. Du kan logga parametrar, mått, taggar och artefakter i målfunktionen.

Feedback

Var den här sidan till hjälp?

Last updated on 2025-03-27

Hyperopt-koncept

I detta avsnitt:

fmin()

Klassen SparkTrials

Argument

Implementering

SparkTrials och MLflow

Feedback

Ytterligare resurser

`fmin()`

Klassen `SparkTrials`

`SparkTrials` och MLflow