Trenowanie modelu klastrowania
W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.
Ten składnik służy do trenowania modelu klastrowania.
Składnik przyjmuje nietrenowany model klastrowania, który został już skonfigurowany przy użyciu składnika klastrowania metodą K-Średnich, i trenuje model przy użyciu zestawu danych oznaczonych etykietami lub bez etykiet. Składnik tworzy zarówno wytrenowany model, którego można użyć do przewidywania, jak i zestaw przypisań klastra dla każdego przypadku w danych treningowych.
Uwaga
Nie można wytrenować modelu klastrowania przy użyciu składnika Train Model (Trenowanie modelu ), który jest ogólnym składnikiem trenowania modeli uczenia maszynowego. Dzieje się tak, ponieważ trenowanie modelu działa tylko z nadzorowanymi algorytmami uczenia. Algorytmy K-średnich i inne algorytmy klastrowania umożliwiają uczenie nienadzorowane, co oznacza, że algorytm może uczyć się na podstawie danych bez etykiet.
Jak używać trenowania modelu klastrowania
Dodaj składnik Train Clustering Model (Trenowanie modelu klastrowania) do potoku w projektancie. Składnik można znaleźć w obszarze Składniki usługi Machine Learning w kategorii Trenowanie.
Dodaj składnik Klaster K-Średnich lub inny składnik niestandardowy, który tworzy zgodny model klastrowania, i ustaw parametry modelu klastrowania.
Dołącz zestaw danych szkoleniowych do danych wejściowych po prawej stronie w obszarze Train Clustering Model (Trenowanie modelu klastrowania).
W obszarze Zestaw kolumn wybierz kolumny z zestawu danych do użycia w klastrach konstrukcyjnych. Pamiętaj, aby wybrać kolumny, które tworzą dobre funkcje: na przykład unikaj używania identyfikatorów lub innych kolumn, które mają unikatowe wartości lub kolumny, które mają te same wartości.
Jeśli etykieta jest dostępna, możesz użyć jej jako funkcji lub pozostawić ją na wyjściu.
Wybierz opcję Sprawdź, czy chcesz dołączyć lub usunąć zaznaczenie tylko wyników, jeśli chcesz wyświetlić dane treningowe wraz z nową etykietą klastra.
Jeśli usuniesz zaznaczenie tej opcji, tylko przypisania klastra są danymi wyjściowymi.
Prześlij potok lub kliknij składnik Train Clustering Model (Trenowanie modelu klastrowania) i wybierz pozycję Run Selected (Uruchom wybrane).
Wyniki
Po zakończeniu szkolenia:
Aby zapisać migawkę wytrenowanego modelu, wybierz kartę Dane wyjściowe w prawym panelu składnika Trenowanie modelu . Wybierz ikonę Zarejestruj zestaw danych , aby zapisać model jako składnik wielokrotnego użytku.
Aby wygenerować wyniki na podstawie modelu, użyj polecenia Przypisz dane do klastrów.
Uwaga
Jeśli musisz wdrożyć wytrenowany model w projektancie, upewnij się, że opcja Assign Data to Clusters zamiast Score Model (Generowanie wyników w modelu ) jest połączona z danymi wejściowymi składnika Web Service Output w potoku wnioskowania.
Następne kroki
Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.