Udostępnij za pośrednictwem


Dostrajanie hiperparametrów modelu

W tym artykule opisano sposób używania składnika Dostrajanie hiperparametrów modelu w projektancie usługi Azure Machine Learning. Celem jest określenie optymalnych hiperparametrów dla modelu uczenia maszynowego. Składnik kompiluje i testuje wiele modeli przy użyciu różnych kombinacji ustawień. Porównuje metryki we wszystkich modelach, aby uzyskać kombinacje ustawień.

Parametry i hiperparametry terminów mogą być mylące. Parametry modelu są ustawiane w okienku po prawej stronie składnika. Zasadniczo ten składnik wykonuje zamiatanie parametrów przez określone ustawienia parametrów. Poznaje optymalny zestaw hiperparametrów, który może być inny dla każdego konkretnego drzewa decyzyjnego, zestawu danych lub metody regresji. Proces znajdowania optymalnej konfiguracji jest czasami nazywany dostrajaniem.

Składnik obsługuje następującą metodę znajdowania optymalnych ustawień modelu: zintegrowane trenowanie i dostrajanie. W tej metodzie skonfigurujesz zestaw parametrów do użycia. Następnie można zezwolić składnikowi na iterowanie wielu kombinacji. Składnik mierzy dokładność, dopóki nie znajdzie "najlepszego" modelu. W przypadku większości składników uczących się można wybrać parametry, które powinny zostać zmienione podczas procesu trenowania i które powinny pozostać stałe.

W zależności od tego, jak długo chcesz uruchomić proces dostrajania, możesz zdecydować się na wyczerpujące przetestowanie wszystkich kombinacji. Możesz też skrócić proces, ustanawiając siatkę kombinacji parametrów i testując losowy podzestaw siatki parametrów.

Ta metoda generuje wytrenowany model, który można zapisać do ponownego użycia.

Napiwek

Możesz wykonać powiązane zadanie. Przed rozpoczęciem dostrajania zastosuj wybór funkcji, aby określić kolumny lub zmienne, które mają najwyższą wartość informacji.

Jak skonfigurować hiperparametry dostrajania modelu

Uczenie optymalnych hiperparametrów dla modelu uczenia maszynowego wymaga znacznego użycia potoków.

Trenowanie modelu przy użyciu zamiatania parametrów

W tej sekcji opisano sposób wykonywania podstawowego zamiatania parametrów, który trenuje model przy użyciu składnika Dostrajanie hiperparametrów modelu.

  1. Dodaj składnik Dostrajanie hiperparametrów modelu do potoku w projektancie.

  2. Połącz nietrenowany model z danymi wejściowymi po lewej stronie.

    Uwaga

    Dostrajanie hiperparametrów modelu można łączyć tylko z wbudowanymi składnikami algorytmu uczenia maszynowego i nie może obsługiwać niestandardowego modelu wbudowanego w tworzenie modelu języka Python.

  3. Dodaj zestaw danych, którego chcesz użyć do trenowania, i połącz go z środkowym wejściem hiperparametrów modelu dostrajania.

    Opcjonalnie, jeśli masz otagowany zestaw danych, możesz połączyć go z najbardziej odpowiednim portem wejściowym (opcjonalny zestaw danych weryfikacji). Dzięki temu można mierzyć dokładność podczas trenowania i dostrajania.

  4. W prawym panelu funkcji Dostrajanie hiperparametrów modelu wybierz wartość trybu zamiatania parametrów. Ta opcja określa sposób wybierania parametrów.

    • Cała siatka: po wybraniu tej opcji składnik jest zapętlany przez siatkę wstępnie zdefiniowaną przez system, aby wypróbować różne kombinacje i zidentyfikować najlepsze osoby uczące się. Ta opcja jest przydatna, gdy nie wiesz, jakie mogą być najlepsze ustawienia parametrów i chcesz wypróbować wszystkie możliwe kombinacje wartości.

    • Losowe zamiatanie: po wybraniu tej opcji składnik losowo wybierze wartości parametrów dla zakresu zdefiniowanego przez system. Należy określić maksymalną liczbę przebiegów, które mają być wykonywane przez składnik. Ta opcja jest przydatna, gdy chcesz zwiększyć wydajność modelu przy użyciu wybieranych metryk, ale nadal oszczędzać zasoby obliczeniowe.

  5. W polu Etykieta wybierz selektor kolumn, aby wybrać kolumnę z pojedynczą etykietą.

  6. Wybierz liczbę przebiegów:

    • Maksymalna liczba przebiegów w losowym zamiataniu: w przypadku wybrania losowego zamiatania można określić, ile razy model ma zostać wytrenowany przy użyciu losowej kombinacji wartości parametrów.
  7. W obszarze Ranking (Ranking) wybierz pojedynczą metrykę, która ma być używana do klasyfikowania modeli.

    Po uruchomieniu funkcji zamiatania parametrów składnik oblicza wszystkie odpowiednie metryki dla typu modelu i zwraca je w raporcie wyników zamiatania. Składnik używa oddzielnych metryk dla modeli regresji i klasyfikacji.

    Jednak wybrana metryka określa sposób klasyfikacji modeli. Tylko najlepszy model, sklasyfikowany przez wybraną metrykę, jest wynikiem wyjściowym wytrenowanego modelu do użycia na potrzeby oceniania.

  8. W przypadku inicjatora losowego wprowadź liczbę całkowitą jako pseudolosowy stan generatora liczb używany do losowego wybierania wartości parametrów dla wstępnie zdefiniowanego zakresu. Ten parametr jest skuteczny tylko wtedy, gdy tryb zamiatania parametrów to Losowe zamiatanie.

  9. Prześlij potok.

Wyniki dostrajania hiperparametrów

Po zakończeniu trenowania:

  • Aby wyświetlić wyniki zamiatania, możesz kliknąć go prawym przyciskiem myszy, a następnie wybrać pozycję Visualize (Wizualizacja) lub kliknąć prawym przyciskiem myszy lewy port wyjściowy składnika w celu wizualizacji.

    Wyniki zamiatania obejmują wszystkie metryki zamiatania parametrów i dokładności, które mają zastosowanie do typu modelu, a metryka wybrana do klasyfikacji określa, który model jest uważany za "najlepszy".

  • Aby zapisać migawkę wytrenowanego modelu, wybierz kartę Dane wyjściowe i dzienniki w prawym panelu składnika Trenowanie modelu . Wybierz ikonę Zarejestruj zestaw danych , aby zapisać model jako składnik wielokrotnego użytku.

Uwagi techniczne

Ta sekcja zawiera szczegóły implementacji i porady.

Jak działa funkcja zamiatania parametrów

Podczas konfigurowania funkcji zamiatania parametrów należy zdefiniować zakres wyszukiwania. Wyszukiwanie może używać ograniczonej liczby wybranych losowo parametrów. Może to być wyczerpujące wyszukiwanie w zdefiniowanym obszarze parametrów.

  • Losowe zamiatanie: ta opcja trenuje model przy użyciu określonej liczby iteracji.

    Określasz zakres wartości do iterowania, a składnik używa losowo wybranego podzestawu tych wartości. Wartości są wybierane z zastąpieniem, co oznacza, że liczby wcześniej wybrane losowo nie są usuwane z puli dostępnych liczb. W związku z tym prawdopodobieństwo wybrania dowolnej wartości pozostaje takie same we wszystkich przebiegach.

  • Cała siatka: opcja użycia całej siatki oznacza, że każda kombinacja jest testowana. Ta opcja jest najbardziej dokładna, ale wymaga najwięcej czasu.

Kontrolowanie długości i złożoności trenowania

Iterowanie wielu kombinacji ustawień może być czasochłonne, dlatego składnik udostępnia kilka sposobów ograniczenia procesu:

  • Ogranicz liczbę iteracji używanych do testowania modelu.
  • Ogranicz przestrzeń parametrów.
  • Ogranicz zarówno liczbę iteracji, jak i przestrzeń parametrów.

Zalecamy potok z ustawieniami, aby określić najbardziej wydajną metodę trenowania dla określonego zestawu danych i modelu.

Wybieranie metryki oceny

Na końcu testowania model przedstawia raport zawierający dokładność każdego modelu, dzięki czemu można przejrzeć wyniki metryk:

  • Jednolity zestaw metryk jest używany dla wszystkich modeli klasyfikacji binarnej.
  • Dokładność jest używana dla wszystkich modeli klasyfikacji wieloklasowej.
  • Inny zestaw metryk jest używany na potrzeby modeli regresji.

Jednak podczas trenowania należy wybrać pojedynczą metrykę do użycia w klasyfikacji modeli, które są generowane podczas procesu dostrajania. Może się okazać, że najlepsza metryka różni się w zależności od problemu biznesowego oraz kosztów fałszywie dodatnich i fałszywie ujemnych.

Metryki używane do klasyfikacji binarnej

  • Dokładność jest proporcją wyników true do łącznej liczby przypadków.

  • Precyzja to proporcja wyników true do wyników dodatnich.

  • Kompletność to ułamek wszystkich poprawnych wyników dla wszystkich wyników.

  • Wynik F to miara, która równoważy precyzję i kompletność.

  • AUC to wartość reprezentująca obszar pod krzywą, gdy na osi x są kreślene wyniki fałszywie dodatnie, a na osi y są kreśline prawdziwie dodatnie.

  • Średnia utrata dziennika jest różnicą między dwoma rozkładami prawdopodobieństwa: rzeczywistym i drugim w modelu.

Metryki używane do regresji

  • Średnia wartość błędu bezwzględnego określa wszystkie błędy w modelu, gdzie błąd oznacza odległość przewidywanej wartości z wartości true. Jest często skracany jako MAE.

  • Pierwiastek błędu średniokwadratowego mierzy średnią kwadratów błędów, a następnie przyjmuje pierwiastek tej wartości. Jest często skracany jako RMSE.

  • Względny błąd bezwzględny reprezentuje błąd jako wartość procentową wartości true.

  • Względny błąd kwadratu normalizuje całkowity błąd kwadratu, dzieląc przez łączny błąd kwadratu przewidywanych wartości.

  • Współczynnik determinacji to pojedyncza liczba wskazująca, jak dobrze dane pasują do modelu. Wartość jednej oznacza, że model dokładnie odpowiada danym. Wartość zero oznacza, że dane są losowe lub w przeciwnym razie nie można dopasować ich do modelu. Jest często nazywany r2, R2 lub r kwadrat.

Składniki, które nie obsługują funkcji zamiatania parametrów

Prawie wszystkie osoby uczące się w usłudze Azure Machine Learning obsługują krzyżową walidację ze zintegrowanym zamiataniem parametrów, dzięki czemu można wybrać parametry do potoku. Jeśli osoba ucząca się nie obsługuje ustawiania zakresu wartości, nadal możesz użyć jej w walidacji krzyżowej. W takim przypadku dla zamiatania wybrano zakres dozwolonych wartości.

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.