Trenowanie modelu klastrowania

W tym artykule opisano składnik w projektancie Azure Machine Learning.

Ten składnik służy do trenowania modelu klastrowania.

Składnik przyjmuje nietrenowany model klastrowania, który został już skonfigurowany przy użyciu składnika klastrowania metodą K-Średnich , i trenuje model przy użyciu zestawu danych z etykietą lub bez etykiet. Składnik tworzy zarówno wytrenowany model, którego można użyć do przewidywania, jak i zestaw przypisań klastra dla każdego przypadku w danych treningowych.

Uwaga

Nie można wytrenować modelu klastrowania przy użyciu składnika Train Model (Trenowanie modelu ), który jest ogólnym składnikiem trenowania modeli uczenia maszynowego. Wynika to z tego, że trenowanie modelu działa tylko z nadzorowanymi algorytmami uczenia. Algorytmy K-średnich i inne algorytmy klastrowania umożliwiają uczenie bez nadzoru, co oznacza, że algorytm może uczyć się na podstawie danych bez etykiet.

Jak używać trenowania modelu klastrowania

  1. Dodaj składnik Train Clustering Model (Trenowanie modelu klastrowania) do potoku w projektancie. Składnik można znaleźć w obszarze Machine Learning składników w kategorii Trenowanie.

  2. Dodaj składnik klastrowania metodą K-Średnich lub inny składnik niestandardowy, który tworzy zgodny model klastrowania, i ustaw parametry modelu klastrowania.

  3. Dołączanie zestawu danych treningowych do prawego elementu wejściowego trenowania modelu klastrowania.

  4. W obszarze Zestaw kolumn wybierz kolumny z zestawu danych do użycia w klastrach kompilacji. Pamiętaj, aby wybrać kolumny, które tworzą dobre funkcje: na przykład unikaj używania identyfikatorów lub innych kolumn z unikatowymi wartościami lub kolumn, które mają te same wartości.

    Jeśli etykieta jest dostępna, możesz użyć jej jako funkcji lub pozostawić ją na wyjściu.

  5. Wybierz opcję Sprawdź, czy chcesz dołączyć lub usunąć zaznaczenie wyników tylko wtedy, gdy chcesz wygenerować dane treningowe wraz z nową etykietą klastra.

    Jeśli usuniesz zaznaczenie tej opcji, tylko przypisania klastra są danymi wyjściowymi.

  6. Prześlij potok lub kliknij składnik Train Clustering Model (Trenowanie modelu klastrowania) i wybierz pozycję Run Selected (Uruchom wybrane).

Wyniki

Po zakończeniu szkolenia:

  • Aby zapisać migawkę wytrenowanego modelu, wybierz kartę Dane wyjściowe w prawym panelu składnika Trenowanie modelu . Wybierz ikonę Zarejestruj zestaw danych , aby zapisać model jako składnik wielokrotnego użytku.

  • Aby wygenerować wyniki na podstawie modelu, użyj polecenia Przypisz dane do klastrów.

Uwaga

Jeśli musisz wdrożyć wytrenowany model w projektancie, upewnij się, że opcja Przypisywanie danych do klastrów zamiast generowania wyników modelu jest połączona z danymi wejściowymi składnika Web Service Output w potoku wnioskowania.

Następne kroki

Zobacz zestaw składników dostępnych do Azure Machine Learning.