Wieloklasowy składnik regresji logistycznej

W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.

Użyj tego składnika, aby utworzyć model regresji logistycznej, który może służyć do przewidywania wielu wartości.

Klasyfikacja przy użyciu regresji logistycznej jest metodą uczenia nadzorowanego i dlatego wymaga oznaczonego zestawu danych. Wytrenujesz model, podając model i oznaczony etykietą zestaw danych jako dane wejściowe do składnika, takiego jak Train Model. Wytrenowany model może następnie służyć do przewidywania wartości dla nowych przykładów wejściowych.

Usługa Azure Machine Learning udostępnia również dwuklasowy składnik regresji logistycznej , który jest odpowiedni do klasyfikacji zmiennych binarnych lub dychotomicznych.

Informacje o regresji logistycznej wieloklasowej

Regresja logistyczna to dobrze znana metoda w statystykach, która służy do przewidywania prawdopodobieństwa wyniku i jest popularna w przypadku zadań klasyfikacji. Algorytm przewiduje prawdopodobieństwo wystąpienia zdarzenia przez dopasowanie danych do funkcji logistycznej.

W regresji logistycznej wieloklasowej klasyfikator może służyć do przewidywania wielu wyników.

Konfigurowanie regresji logistycznej wieloklasowej

  1. Dodaj składnik Regresja logistyczna w wielu klasach do potoku.

  2. Określ sposób trenowania modelu, ustawiając opcję Utwórz tryb trenera .

    • Pojedynczy parametr: użyj tej opcji, jeśli wiesz, jak skonfigurować model i podaj określony zestaw wartości jako argumenty.

    • Zakres parametrów: wybierz tę opcję, jeśli nie masz pewności co do najlepszych parametrów i chcesz uruchomić zamiatanie parametrów. Wybierz zakres wartości do iterowania, a hiperparametry modelu dostrajania iterują wszystkie możliwe kombinacje podanych ustawień w celu określenia hiperparametrów, które generują optymalne wyniki.

  3. Tolerancja optymalizacji— określ wartość progową dla zbieżności optymalizatora. Jeśli poprawa między iteracji jest mniejsza niż próg, algorytm zatrzymuje się i zwraca bieżący model.

  4. L1 waga regularyzacji, Waga regularnych L2: Wpisz wartość do użycia dla parametrów regularyzacji L1 i L2. W obu przypadkach zalecana jest wartość niezerowa.

    Regularyzacja to metoda zapobiegania nadmiernemu dopasowaniu modeli z ekstremalnymi wartościami współczynników. Regularyzacja działa, dodając karę skojarzoną z wartościami współczynników do błędu hipotezy. Dokładny model o skrajnych wartościach współczynników byłby bardziej ukarany, ale mniej dokładny model z bardziej konserwatywnymi wartościami byłby ukarany mniej.

    Regularyzacja L1 i L2 mają różne efekty i zastosowania. L1 można zastosować do rozrzednych modeli, co jest przydatne podczas pracy z danymi o wysokiej wymiarach. Z kolei regularyzacja L2 jest preferowana w przypadku danych, które nie są rozrzedne. Ten algorytm obsługuje liniową kombinację wartości regularyzacji L1 i L2: to znaczy, jeśli x = L1 i y = L2, ax + by = c definiuje liniowy zakres terminów regularyzacji.

    Różne kombinacje liniowe terminów L1 i L2 zostały opracowane dla modeli regresji logistycznej, takich jak regularyzacja elastycznej sieci.

  5. Losowy nasion liczb: wpisz wartość całkowitą, która ma być używana jako inicjator algorytmu, jeśli wyniki mają być powtarzalne w przypadku przebiegów. W przeciwnym razie wartość zegara systemowego jest używana jako nasion, co może powodować nieco inne wyniki w uruchomieniach tego samego potoku.

  6. Połącz oznaczony zestaw danych i wytrenuj model:

    • Jeśli ustawisz opcję Utwórz tryb trenera na pojedynczy parametr, połącz oznakowany zestaw danych i składnik Train Model .

    • Jeśli ustawisz opcję Utwórz tryb trenera na wartość Zakres parametrów, połącz oznakowany zestaw danych i wytrenuj model przy użyciu hiperparametrów tune model.

    Uwaga

    Jeśli przekazujesz zakres parametrów do trenowania modelu, używa tylko wartości domyślnej na liście pojedynczych parametrów.

    Jeśli przekazujesz jeden zestaw wartości parametrów do składnika Hiperparametry modelu dostrajania , gdy oczekuje on zakresu ustawień dla każdego parametru, ignoruje wartości i używa wartości domyślnych dla ucznia.

    Jeśli wybierzesz opcję Zakres parametrów i wprowadzisz pojedynczą wartość dla dowolnego parametru, ta określona wartość jest używana w całym zamiataniu, nawet jeśli inne parametry zmieniają się w zakresie wartości.

  7. Prześlij potok.

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.