Składnik regresji sieci neuronowej

Tworzy model regresji przy użyciu algorytmu sieci neuronowej

Kategoria: Uczenie maszynowe / Inicjowanie modelu / Regresja

Omówienie składnika

W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.

Ten składnik umożliwia utworzenie modelu regresji przy użyciu dostosowywalnego algorytmu sieci neuronowej.

Mimo że sieci neuronowe są powszechnie znane z uczenia głębokiego i modelowania złożonych problemów, takich jak rozpoznawanie obrazów, są łatwo dostosowywane do problemów regresji. Każda klasa modeli statystycznych może być określana jako sieć neuronowa, jeśli używają one adaptacyjnych wag i mogą przybliżone funkcje nieliniowe swoich danych wejściowych. W związku z tym regresja sieci neuronowej jest odpowiednia do problemów, w których bardziej tradycyjny model regresji nie może pasować do rozwiązania.

Regresja sieci neuronowej jest metodą uczenia nadzorowanego i dlatego wymaga oznakowanego zestawu danych, który zawiera kolumnę etykiety. Ponieważ model regresji przewiduje wartość liczbową, kolumna etykiety musi być numerycznym typem danych.

Model można wytrenować, podając model i oznakowany zestaw danych jako dane wejściowe do trenowania modelu. Wytrenowany model może następnie służyć do przewidywania wartości dla nowych przykładów wejściowych.

Konfigurowanie regresji sieci neuronowej

Sieci neuronowe można dostosowywać w szerokim zakresie. W tej sekcji opisano sposób tworzenia modelu przy użyciu dwóch metod:

  • Tworzenie modelu sieci neuronowej przy użyciu architektury domyślnej

    Jeśli zaakceptujesz domyślną architekturę sieci neuronowej, użyj okienka Właściwości , aby ustawić parametry kontrolujące zachowanie sieci neuronowej, takie jak liczba węzłów w warstwie ukrytej, szybkość nauki i normalizacja.

    Zacznij tutaj, jeśli dopiero zaczynasz korzystać z sieci neuronowych. Składnik obsługuje wiele dostosowań, a także dostrajanie modeli bez dogłębnej wiedzy na temat sieci neuronowych.

  • Definiowanie architektury niestandardowej dla sieci neuronowej

    Użyj tej opcji, jeśli chcesz dodać dodatkowe ukryte warstwy lub w pełni dostosować architekturę sieci, jej połączenia i funkcje aktywacji.

    Ta opcja jest najlepsza, jeśli znasz już nieco sieci neuronowe. Język Net# służy do definiowania architektury sieci.

Tworzenie modelu sieci neuronowej przy użyciu architektury domyślnej

  1. Dodaj składnik regresji sieci neuronowej do potoku w projektancie. Ten składnik można znaleźć w obszarze Uczenie maszynowe, Inicjowanie w kategorii Regresja .

  2. Określ sposób trenowania modelu, ustawiając opcję Utwórz tryb trenera .

    • Pojedynczy parametr: wybierz tę opcję, jeśli wiesz już, jak skonfigurować model.

    • Zakres parametrów: wybierz tę opcję, jeśli nie masz pewności co do najlepszych parametrów i chcesz uruchomić zamiatanie parametrów. Wybierz zakres wartości do iterowania, a hiperparametry modelu dostrajania iterują wszystkie możliwe kombinacje podanych ustawień w celu określenia hiperparametrów, które generują optymalne wyniki.

  3. W obszarze Specyfikacja warstwy ukrytej wybierz pozycję W pełni połączony przypadek. Ta opcja tworzy model przy użyciu domyślnej architektury sieci neuronowej, która dla modelu regresji sieci neuronowej ma następujące atrybuty:

    • Sieć ma dokładnie jedną ukrytą warstwę.
    • Warstwa wyjściowa jest w pełni połączona z warstwą ukrytą, a warstwa ukryta jest w pełni połączona z warstwą wejściową.
    • Użytkownik może ustawić liczbę węzłów w warstwie ukrytej (wartość domyślna to 100).

    Ponieważ liczba węzłów w warstwie wejściowej jest określana przez liczbę funkcji w danych treningowych, w modelu regresji może istnieć tylko jeden węzeł w warstwie wyjściowej.

  4. W polu Liczba ukrytych węzłów wpisz liczbę ukrytych węzłów. Wartość domyślna to jedna ukryta warstwa z 100 węzłami. (Ta opcja nie jest dostępna, jeśli zdefiniujesz architekturę niestandardową przy użyciu języka Net#).

  5. W polu Wskaźnik nauki wpisz wartość, która definiuje krok wykonywany w każdej iteracji przed korektą. Większa wartość współczynnika uczenia może spowodować szybsze zbieżnie modelu, ale może zastąpić lokalne minima.

  6. W polu Liczba iteracji uczenia określ maksymalną liczbę przypadków przetwarzania przypadków trenowania przez algorytm.

  7. W polu Momentum wpisz wartość, która ma być stosowana podczas uczenia się jako waga w węzłach z poprzednich iteracji.

  8. Wybierz opcję Shuffle examples (Przykłady mieszania), aby zmienić kolejność przypadków między iteracjami. Jeśli usuniesz zaznaczenie tej opcji, sprawy są przetwarzane dokładnie w tej samej kolejności przy każdym uruchomieniu potoku.

  9. W przypadku inicjatora liczb losowych można opcjonalnie wpisać wartość, która ma być używana jako inicjator. Określenie wartości inicjacji jest przydatne, gdy chcesz zapewnić powtarzalność między przebiegami tego samego potoku.

  10. Połącz zestaw danych trenowania i wytrenuj model:

    • Jeśli ustawisz opcję Utwórz tryb trenera na pojedynczy parametr, połącz oznakowany zestaw danych i składnik Train Model (Trenowanie modelu ).

    • Jeśli ustawisz opcję Utwórz tryb trenera na wartość Zakres parametrów, połącz oznakowany zestaw danych i wytrenuj model przy użyciu hiperparametrów dostrajania modelu.

    Uwaga

    Jeśli przekazujesz zakres parametrów do trenowania modelu, używa tylko wartości domyślnej na liście pojedynczych parametrów.

    W przypadku przekazania pojedynczego zestawu wartości parametrów do składnika Hiperparametrów modelu dostrajania , gdy oczekuje ona zakresu ustawień dla każdego parametru, ignoruje wartości i używa wartości domyślnych dla ucznia.

    Jeśli wybierzesz opcję Zakres parametrów i wprowadzisz pojedynczą wartość dla dowolnego parametru, określona pojedyncza wartość będzie używana w całym zamiataniu, nawet jeśli inne parametry zmienią się w zakresie wartości.

  11. Prześlij potok.

Wyniki

Po zakończeniu szkolenia:

  • Aby zapisać migawkę wytrenowanego modelu, wybierz kartę Dane wyjściowe w prawym panelu składnika Trenowanie modelu . Wybierz ikonę Zarejestruj zestaw danych , aby zapisać model jako składnik wielokrotnego użytku.

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.