Wprowadzenie

3 min

W uczeniu maszynowym modele są trenowane w celu przewidywania nieznanych etykiet dla nowych danych na podstawie korelacji między znanymi etykietami i funkcjami znajdującymi się w danych treningowych. W zależności od używanego algorytmu może być konieczne określenie hiperparametrów w celu skonfigurowania sposobu trenowania modelu.

Na przykład algorytm regresji logistycznej używa hiperparametru współczynnika regularyzacji, aby przeciwdziałać nadmiernemu dopasowaniu; a techniki uczenia głębokiego dla splotowych sieci neuronowych (CNN) używają hiperparametrów, takich jak szybkość uczenia, aby kontrolować, jak wagi są dostosowywane podczas trenowania, oraz rozmiar partii w celu określenia, ile elementów danych jest uwzględnionych w każdej partii szkoleniowej.

Uwaga

Machine Edukacja to dziedzina akademicka z własną konkretną terminologią. Analitycy danych odwołują się do wartości określonych na podstawie funkcji trenowania jako parametrów, więc dla wartości używanych do konfigurowania zachowania trenowania, ale które nie pochodzą z danych treningowych , dlatego termin hiperparametr jest wymagany.

Wybór wartości hiperparametrów może znacząco wpłynąć na wynikowy model, co sprawia, że ważne jest, aby wybrać najlepsze możliwe wartości dla określonych danych i predykcyjnych celów wydajności.

Dostrajanie hiperparametrów

Diagram of different hyperparameter values resulting in different models by performing hyperparameter tuning.

Dostrajanie hiperparametryczne jest realizowane przez trenowanie wielu modeli przy użyciu tego samego algorytmu i danych treningowych, ale różnych wartości hiperparametrów. Wynikowy model z każdego przebiegu trenowania jest następnie oceniany w celu określenia metryki wydajności, dla której chcesz zoptymalizować (na przykład dokładność), a wybrany jest model o najlepszej wydajności.

W usłudze Azure Machine Edukacja można dostroić hiperparametry, przesyłając skrypt jako zadanie zamiatania. Zadanie zamiatania uruchomi wersję próbną dla każdej kombinacji hiperparametrów do przetestowania. Każda wersja próbna używa skryptu trenowania z sparametryzowanymi wartościami hiperparametrów do trenowania modelu i rejestruje docelową metrykę wydajności osiągniętą przez wytrenowany model.

Cele szkolenia

Ten moduł obejmuje następujące zagadnienia:

Zdefiniuj przestrzeń wyszukiwania hiperparametrów.
Konfigurowanie próbkowania hiperparametrów.
Wybierz zasady wczesnego zakończenia.
Uruchamianie zadania zamiatania.

Kontynuuj

Wprowadzenie

Dostrajanie hiperparametrów

Cele szkolenia

Opinia