Używanie rozproszonych algorytmów trenowania za pomocą biblioteki Hyperopt

Uwaga

Wersja biblioteki Hyperopt typu open source nie jest już utrzymywana.

Funkcja Hyperopt nie jest uwzględniona w środowisku Databricks Runtime for Machine Learning po 16.4 LTS ML. Azure Databricks zaleca użycie Optuna do optymalizacji pojedynczego węzła lub RayTune jako alternatywy dla wycofanej funkcji rozproszonego dostrajania hiperparametrów Hyperopt. Dowiedz się więcej o korzystaniu z RayTune w usłudze Azure Databricks.

Oprócz algorytmów trenowania pojedynczego komputera, takich jak te z biblioteki scikit-learn, można użyć funkcji Hyperopt z algorytmami trenowania rozproszonego. W tym scenariuszu funkcja Hyperopt generuje wersje próbne z różnymi ustawieniami hiperparametrów w węźle sterownika. Każda wersja próbna jest wykonywana z węzła sterownika, zapewniając mu dostęp do pełnych zasobów klastra. Ta konfiguracja działa z dowolnymi rozproszonymi algorytmami lub bibliotekami uczenia maszynowego, w tym bibliotekami MLlib i HorovodRunner platformy Apache Spark.

Jeśli używasz funkcji Hyperopt z rozproszonymi algorytmami trenowania, nie przekazuj argumentu trials do fmin(), a w szczególności nie używaj klasy SparkTrials. SparkTrials jest przeznaczony do rozprowadzania prób dla algorytmów, które nie są rozproszone. W przypadku algorytmów trenowania rozproszonego użyj domyślnej Trials klasy, która jest uruchamiana w sterowniku klastra. Funkcja Hyperopt ocenia każdy eksperyment na węźle sterownika, aby algorytm uczenia maszynowego mógł zainicjować szkolenie rozproszone.

Uwaga

Azure Databricks nie obsługuje automatycznego rejestrowania w MLflow za pomocą klasy Trials. W przypadku korzystania z algorytmów trenowania rozproszonego należy ręcznie wywołać bibliotekę MLflow, aby rejestrować wersje próbne dla funkcji Hyperopt.

Przykład notatnika: zastosowanie Hyperopt z algorytmami MLlib

W przykładowym notesie pokazano, jak używać funkcji Hyperopt do dostosowywania rozproszonych algorytmów trenowania biblioteki MLlib.

Notatnik treningu rozproszonego Hyperopt i MLlib

Zdobądź notatnik

Przykład notesu: używanie funkcji Hyperopt z programem HorovodRunner

HorovodRunner to ogólny interfejs API służący do uruchamiania rozproszonych obciążeń uczenia głębokiego w usłudze Databricks. Rozwiązanie HorovodRunner integruje platformę Horovod z trybem barierowym platformy Spark, aby zapewnić większą stabilność dla długotrwałych zadań uczenia głębokiego na platformie Spark.

W przykładowym notesie pokazano, jak używać funkcji Hyperopt do dostosowywania trenowania rozproszonego na potrzeby uczenia głębokiego na podstawie narzędzia HorovodRunner.

Notatnik rozproszonego treningu z Hyperopt i HorovodRunner

Zdobądź notatnik

Opinia

Czy ta strona była pomocna?

Last updated on 2026-02-01