Machine Learning — szkolenie

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

W tym artykule opisano moduły dostępne w programie Machine Learning Studio (wersja klasyczna) służące do trenowania modelu uczenia maszynowego. Trenowanie to proces analizowania danych wejściowych przy użyciu parametrów wstępnie zdefiniowanego modelu. Na podstawie tej analizy model uczy się wzorców i zapisuje je w postaci wytrenowany model.

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

W tym artykule opisano również ogólny proces tworzenia, trenowania, oceny i oceniania Machine Learning Studio (klasycznej).

Tworzenie i używanie modeli uczenia maszynowego

Typowy przepływ pracy uczenia maszynowego obejmuje następujące fazy:

  • Wybieranie odpowiedniego algorytmu i ustawianie opcji początkowych.
  • Trenowanie modelu na podstawie zgodnych danych.
  • Tworzenie przewidywań przy użyciu nowych danych na podstawie wzorców w modelu.
  • Ocenianie modelu w celu określenia, czy przewidywania są dokładne, ile jest błędów i czy występuje jakieś przesłonienie.

Machine Learning Studio (wersja klasyczna) obsługuje elastyczną, dostosowywaną platformę do uczenia maszynowego. Każde zadanie w tym procesie jest wykonywane przez określony typ modułu, który można modyfikować, dodawać lub usuwać bez przerywania pozostałej części eksperymentu.

Moduły w tej kategorii obsługują trenowania dla różnych typów modeli. Podczas trenowania dane są analizowane przez algorytm uczenia maszynowego. Ten algorytm analizuje rozkład i typ danych, kompiluje statystyki i tworzy wzorce, które mogą być później używane do przewidywania.

Więcej informacji na temat trenowania modelu

Gdy Machine Learning model jest trenowany, wiersze z brakującymi wartościami są pomijane. Dlatego jeśli chcesz ręcznie naprawić wartości, użyj imputacji lub określ inną metodę obsługi brakujących wartości, użyj modułu Clean Missing Data (Czyszczenie brakujących danych) przed rozpoczęciem trenowania zestawu danych.

Zalecamy użycie modułu Edit Metadata (Edytowanie metadanych ) w celu rozwiązania innych problemów z danymi. Może być konieczne oznaczenie kolumny etykiety, zmiana typów danych lub poprawna nazwa kolumn.

Inne typowe zadania oczyszczania danych, takie jak normalizacja, próbkowanie, nning i skalowanie, można znaleźć w kategorii Przekształcanie danych.

Wybieranie odpowiedniego instruktora

Metoda, która jest stosowana do trenowania modelu, zależy od typu tworzyć modelu i typu danych, których wymaga model. Na przykład program Machine Learning moduły przeznaczone specjalnie do trenowania modeli wykrywania anomalii, modeli rekomendacji i nie tylko.

Sprawdź listę modułów szkoleniowych, aby ustalić, która z nich jest poprawna dla Twojego scenariusza.

Jeśli nie masz pewności co do najlepszych parametrów do użycia podczas trenowania modelu, użyj jednego z modułów podanych do czyszczenie parametrów i walidacji:

  • Hiperparametry modelu dostrajania mogą przeprowadzić czyszczenie parametrów dla niemal wszystkich modeli klasyfikacji i regresji. Trenuje wiele modeli, a następnie zwraca najlepszy model.

  • Moduł Czyszczenie klastrowania obsługuje dostrajanie modelu podczas procesu trenowania i jest przeznaczony do użytku tylko z modelami klastrowania. Można określić zakres centroidów i trenować dane, automatycznie wykrywając najlepsze parametry.

  • Moduł Cross-Validate Model (Model krzyżowy) jest również przydatny do optymalizacji modelu, ale nie zwraca wytrenowany model. Zamiast tego udostępnia metryki, których można użyć do określenia najlepszego modelu.

Ponowne szkolenie modeli

Jeśli musisz ponownie wytrenować model produkcyjny, możesz ponownie uruchomić eksperyment w dowolnym momencie.

Proces ponownego trenowania można również zautomatyzować przy użyciu usług internetowych. Aby uzyskać przewodnik, zobacz Retraining and updating Machine Learning models with Azure Data Factory (Ponowne trenowanie i aktualizowanie modeli Azure Data Factory).

Korzystanie ze wstępnie wytrenowane modele

Machine Learning zawiera niektóre wstępnie wytrenowane modele, takie jak moduł Pretrained Cascade Image Classification (Wstępnie wytrenowana klasyfikacja obrazów kaskadowych). Tych modeli można używać do oceniania bez dodatkowych danych wejściowych.

Ponadto niektóre moduły (takie jak wykrywanie anomalii szeregów czasu) nie generują wytrenowany model w formacie iLearner. Ale one biorą dane treningowe i tworzą model wewnętrznie, którego następnie można użyć do przewidywania. Aby ich użyć, wystarczy skonfigurować parametry i podać dane.

Zapisywanie migawki wytrenego modelu

Jeśli chcesz zapisać lub wyeksportować model, kliknij prawym przyciskiem myszy moduł trenowania, a następnie wybierz pozycję Zapisz jako wytrenowany model. Model jest eksportowany do formatu iLearner i zapisywany w obszarze roboczym w obszarze Trained Models (Wytrenowane modele). Wytrenowane modele mogą być ponownie używane w innych eksperymentach lub połączone z innymi modułami w celu oceny.

Możesz również użyć modułu Load Trained Model (Ładowanie wytrenowanych modeli ) w eksperymencie, aby pobrać przechowywany model.

Lista modułów

Kategoria Train (Trenuj) obejmuje następujące moduły:

Niektóre moduły nie znajdują się w tej kategorii, ponieważ wymagają specjalnego formatu lub są dostosowane do określonego zadania:

Zobacz też