Trenowanie modelu
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Trenowanie modelu klasyfikacji lub regresji w trybie nadzorowym
Kategoria: Machine Learning / Trenuj
Uwaga
Dotyczy: tylko Machine Learning Studio (klasyczne)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Omówienie modułu
W tym artykule opisano, jak używać modułu Train Model (Trenowanie modelu) w programie Machine Learning Studio (wersja klasyczna) do trenowania modelu klasyfikacji lub regresji. Trenowanie odbywa się po zdefiniowanym modelu i ustawieniu jego parametrów oraz wymaga oznakowanych danych. Możesz również użyć funkcji Train Model (Trenowanie modelu ), aby ponownie wytrenować istniejący model przy użyciu nowych danych.
Jak działa proces trenowania
W Machine Learning tworzenie i używanie modelu uczenia maszynowego jest zwykle procesem trzyetapowym.
Model można skonfigurować, wybierając określony typ algorytmu i definiując jego parametry lub hiperparametry. Wybierz dowolny z następujących typów modeli:
- Modele klasyfikacji oparte na sieciach neuronowych, drzewach decyzyjnych, lasach decyzyjnych i innych algorytmach.
- Modele regresji, które mogą obejmować standardową regresję liniową lub które używają innych algorytmów, w tym sieci neuronowych i regresji baysejskiej.
Podaj zestaw danych, który jest oznaczony etykietą i ma dane zgodne z algorytmem. Połączenie zarówno dane, jak i model do trenowania modelu.
To, co generuje trenowanie, to określony format binarny, iLearner, który hermetyzuje wzorce statystyczne uczony na podstawie danych. Nie można bezpośrednio modyfikować ani odczytywać tego formatu; Jednak inne moduły w programie Studio (wersja klasyczna) mogą używać tego wytrenowany model.
Możesz również wyświetlić właściwości modelu. Aby uzyskać więcej informacji, zobacz sekcję Wyniki.
Po zakończeniu trenowania użyj wytrenowany model z jednym z modułów oceniania, aby wykonać przewidywania na podstawie nowych danych.
Uwaga
Inne wyspecjalizowane zadania uczenia maszynowego wymagają różnych metod trenowania, a program Studio (klasyczny) udostępnia dla nich oddzielne moduły szkoleniowe. Na przykład wykrywanie obrazów, klastrowanie i detction anomalii używają niestandardowych metod trenowania. Model trenowania jest przeznaczony tylko do użycia z modelami regresji i klasyfikacji.
Szkolenie nadzorowane i nienadzorowane
Być może wiesz już o terminach nadzorowane lub nienadzorowane uczenie . Trenowanie modelu klasyfikacji lub regresji za pomocą funkcji Train Model (Trenowanie modelu ) to klasyczny przykład nadzorowanego uczenia maszynowego. Oznacza to, że należy podać zestaw danych zawierający dane historyczne, z których można poznać wzorce. Dane powinny zawierać zarówno wynik (etykietę), który próbujesz przewidzieć, jak i powiązane czynniki (zmienne). Model uczenia maszynowego potrzebuje wyników, aby określić funkcje, które najlepiej prognozują wyniki.
Podczas procesu trenowania dane są sortowane według wyników, a algorytm wyodrębnia wzorce statystyczne w celu skompilowania modelu.
Uczenie nienadzorowane wskazuje, że wynik jest nieznany lub że nie chcesz używać znanych etykiet. Na przykład algorytmy klastrowania zwykle korzystają z nienadzorowanych metod uczenia, ale mogą używać etykiet, jeśli są dostępne. Innym przykładem jest modelowanie tematu przy użyciu LDA. Z tymi algorytmami nie można używać funkcji Train Model (Trenowanie modelu).
Porada
Nowość w uczeniu maszynowym? Ten samouczek zawiera opis procesu uzyskiwania danych, konfigurowania algorytmu, trenowania, a następnie używania modelu: Tworzenie pierwszego eksperymentu uczenia maszynowego
Jak używać trenowania modelu
W Machine Learning Studio (klasycznej) skonfiguruj model klasyfikacji lubmodele modelu regresji.
Możesz również wyt szkolenie modelu niestandardowego utworzonego za pomocą funkcji Create R Model (Utwórz model R).
Dodaj moduł Train Model (Trenowanie modelu) do eksperymentu. Ten moduł można znaleźć w kategorii Machine Learning kategorii. Rozwiń pozycję Train (Trenowanie), a następnie przeciągnij moduł Train Model (Trenowanie modelu) do eksperymentu.
Po lewej stronie danych wejściowych dołącz tryb nieprzetrenowany. Dołącz zestaw danych treningowych do danych wejściowych po prawej stronie w sekcji Train Model (Trenowanie modelu).
Zestaw danych trenowania musi zawierać kolumnę etykiety. Wszystkie wiersze bez etykiet są ignorowane.
W przypadku kolumny Etykieta kliknij pozycję Uruchom selektor kolumn i wybierz pojedynczą kolumnę zawierającą wyniki, których model może użyć do trenowania.
W przypadku problemów klasyfikacji kolumna etykiet musi zawierać wartości kategorii lub wartości dyskretne. Niektóre przykłady to ocena "tak/nie", kod klasyfikacji choroby lub nazwa albo grupa dochodów. Jeśli wybierzemy kolumnę niekategoryczną, moduł zwróci błąd podczas trenowania.
W przypadku problemów z regresją kolumna etykiety musi zawierać dane liczbowe reprezentujące zmienną odpowiedzi. W idealnym przypadku dane liczbowe reprezentują ciągłą skalę.
Przykładami mogą być ocena ryzyka kredytowego, przewidywany czas awarii dysku twardego lub prognozowana liczba połączeń z centrum telefonicznej obsługi klienta w danym dniu lub o danej godzinie. Jeśli nie wybierzesz kolumny liczbowej, może wystąpić błąd.
- Jeśli nie określisz kolumny etykiety do użycia, Machine Learning spróbuje wywniosczyć, która kolumna jest odpowiednią etykietą, przy użyciu metadanych zestawu danych. Jeśli wybierze nieprawidłową kolumnę, użyj selektora kolumn, aby ją poprawić.
Porada
Jeśli masz problemy z używaniem selektora kolumn, zobacz artykuł Select Columns in Dataset ( Wybieranie kolumn w zestawie danych), aby uzyskać porady. Opisano w nim niektóre typowe scenariusze i porady dotyczące korzystania z opcji WITH RULES i BY NAME .
Uruchom eksperyment. Jeśli masz dużo danych, może to trochę potrwać.
Wyniki
Po wytrenowanie modelu:
Aby wyświetlić parametry modelu i wagi cech, kliknij prawym przyciskiem myszy dane wyjściowe i wybierz pozycję Visualize (Wizualizacja).
Aby użyć modelu w innych eksperymentach, kliknij go prawym przyciskiem myszy i wybierz polecenie Zapisz model. Wpisz nazwę modelu.
Dzięki temu model jest zapisywany jako migawka, która nie jest aktualizowana przez powtórzone przebiegi eksperymentu.
Aby użyć modelu do przewidywania nowych wartości, połącz go z modułem Score Model (Ocena modelu) wraz z nowymi danymi wejściowymi.
Zadania powiązane
Jeśli musisz wytszkolić typ modelu, który nie jest obsługiwany przez model trenowania, dostępnych jest kilka opcji:
Utwórz niestandardową metodę oceniania przy użyciu skryptu w języku R lub użyj jednego z wielu dostępnych pakietów oceniania w języku R.
Napisz własny skrypt języka Python do trenowania modelu i oceny go lub użyj istniejącej biblioteki języka Python:
Modele wykrywania anomalii
- Szkolenie modelu wykrywania anomalii obsługuje moduły wykrywania anomalii w programie Studio (wersja klasyczna).
Modele rekomendacji
Jeśli model używa rekomendacji matchbox podanej w Machine Learning, użyj modułu Modułu rekomendacji train matchbox.
Jeśli używasz innego algorytmu do analizy koszyka rynkowego lub rekomendacji, użyj jego metod trenowania w skrypcie języka R lub skrypcie języka Python.
Klastrowanie modeli
Użyj funkcji Train Clustering Model (Trenowanie modelu klastrowania) dla dołączonego algorytmu K-węzłów.
W przypadku innych modeli klastrowania użyj modułów skryptów języka R lub skryptów języka Python , aby skonfigurować i wytszkolić modele.
Przykłady
Aby uzyskać przykłady dotyczące sposobu , w jaki moduł Train Model (Trenowanie modelu) jest używany w eksperymentach uczenia maszynowego, zobacz te eksperymenty w Azure AI Gallery:
- Prognozowanie handlu detalicznego: pokazuje, jak tworzyć, trenować i porównywać wiele modeli.
- Przewidywanie opóźnień lotów: pokazuje, jak trenować wiele powiązanych modeli klasyfikacji.
Oczekiwane dane wejściowe
Nazwa | Typ | Opis |
---|---|---|
Nieprzetrenowany model | ILearner, interfejs | Bez wytrenowany uczony |
Zestaw danych | Tabela danych | Dane szkoleniowe |
Parametry modułu
Nazwa | Zakres | Typ | Domyślny | Opis |
---|---|---|---|---|
Kolumna etykiety | dowolny | ColumnSelection | Wybierz kolumnę zawierającą etykietę lub kolumnę wyniku |
Dane wyjściowe
Nazwa | Typ | Opis |
---|---|---|
Wytrenowany model | ILearner, interfejs | Wytrenowany uczony |
Wyjątki
Aby uzyskać listę wszystkich błędów modułu, zobacz Module Error Codes (Kody błędów modułów).
Wyjątek | Opis |
---|---|
Błąd 0032 | Wyjątek występuje, jeśli argument nie jest liczbą. |
Błąd 0033 | Wyjątek występuje, jeśli argument ma wartość Nieskończoność. |
Błąd 0083 | Wyjątek występuje, jeśli zestaw danych używany do trenowania nie może być używany dla konkretnego typu uczących się. |
Błąd 0035 | Wyjątek występuje, jeśli nie podano żadnych funkcji dla danego użytkownika lub elementu. |
Błąd 0003 | Wyjątek występuje, jeśli co najmniej jeden z wejść ma wartość null lub jest pusty. |
Błąd 0020 | Wyjątek występuje, gdy liczba kolumn w niektórych zestawach danych przekazanych do modułu jest zbyt mała. |
Błąd 0021 | Wyjątek występuje, gdy liczba wierszy w niektórych zestawach danych przekazanych do modułu jest zbyt mała. |
Błąd 0013 | Wyjątek występuje, jeśli przekazany do modułu uczenia ma nieprawidłowy typ. |