Przykłady trenowania modelu

Ta sekcja zawiera przykłady przedstawiające sposób trenowania modeli uczenia maszynowego w usłudze Azure Databricks przy użyciu wielu popularnych bibliotek typu open source.

Możesz również użyć rozwiązania AutoML, który automatycznie przygotowuje zestaw danych do trenowania modelu, wykonuje zestaw prób przy użyciu bibliotek typu open source, takich jak scikit-learn i XGBoost, oraz tworzy notes języka Python z kodem źródłowym dla każdego przebiegu wersji próbnej, aby można było przeglądać, odtwarzać i modyfikować kod.

Przykładowy notes pokazujący sposób trenowania modelu uczenia maszynowego, który używa danych w wykazie aparatu Unity i zapisywania przewidywań z powrotem do wykazu aparatu Unity, zobacz Trenowanie i rejestrowanie modeli uczenia maszynowego w wykazie aparatu Unity.

Przykłady uczenia maszynowego

Pakiet Notesy Funkcje
scikit-learn Samouczek dotyczący uczenia maszynowego Model klasyfikacji, MLflow, automatyczne dostrajanie hiperparametrów za pomocą funkcji Hyperopt i MLflow
scikit-learn Przykład kompleksowego Model klasyfikacji, MLflow, automatyczne dostrajanie hiperparametrów za pomocą funkcji Hyperopt i MLflow, XGBoost, rejestru modeli, obsługi modeli
MLlib Przykłady biblioteki MLlib Klasyfikacja binarna, drzewa decyzyjne, regresja GBT, przesyłanie strumieniowe ze strukturą, przekształcanie niestandardowe
xgboost Przykłady biblioteki XGBoost Python, PySpark i Scala, obciążenia z jednym węzłem i rozproszone trenowanie

Przykłady dostrajania hiperparametrów

Aby uzyskać ogólne informacje na temat dostrajania hiperparametrów w usłudze Azure Databricks, zobacz Dostrajanie hiperparametrów.

Pakiet Notes Funkcje
Hyperopt Rozproszona funkcja hyperopt Rozproszona funkcja hyperopt, scikit-learn, MLflow
Hyperopt Porównywanie modeli Używanie rozproszonej funkcji hyperopt do wyszukiwania przestrzeni hiperparametrów dla różnych typów modeli jednocześnie
Hyperopt Rozproszone algorytmy trenowania i hiperopt Hyperopt, MLlib
Hyperopt Najlepsze rozwiązania dotyczące funkcji Hyperopt Najlepsze rozwiązania dotyczące zestawów danych o różnych rozmiarach