Składnik: Przypisywanie danych do klastrów
W tym artykule opisano sposób używania składnika Assign Data to Clusters w projektancie usługi Azure Machine Learning. Składnik generuje przewidywania za pomocą modelu klastrowania, który został wytrenowany za pomocą algorytmu klastrowania metodą K-średnich.
Składnik Assign Data to Clusters (Przypisywanie danych do klastrów) zwraca zestaw danych zawierający prawdopodobne przypisania dla każdego nowego punktu danych.
Jak używać przypisywania danych do klastrów
W projektancie usługi Azure Machine Learning znajdź wcześniej wytrenowany model klastrowania. Model klastrowania można utworzyć i wytrenować przy użyciu jednej z następujących metod:
Skonfiguruj algorytm klastrowania metodą K-średnich przy użyciu składnika klastrowania metodą K-Średnich i wytrenuj model przy użyciu zestawu danych i składnika Train Clustering Model (Trenowanie modelu klastrowania) (w tym artykule).
Możesz również dodać istniejący wytrenowany model klastrowania z grupy Zapisane modele w obszarze roboczym.
Dołącz wytrenowany model do lewego portu wejściowego Przypisywanie danych do klastrów.
Dołącz nowy zestaw danych jako dane wejściowe.
W tym zestawie danych etykiety są opcjonalne. Ogólnie rzecz biorąc, klastrowanie jest metodą uczenia nienadzorowanego. Nie oczekuje się wcześniejszej znajomości kategorii. Jednak kolumny wejściowe muszą być takie same jak kolumny używane podczas trenowania modelu klastrowania lub występuje błąd.
Napiwek
Aby zmniejszyć liczbę kolumn zapisanych w projektancie z przewidywań klastra, użyj pozycji Wybierz kolumny w zestawie danych i wybierz podzbiór kolumn.
Pozostaw zaznaczone pole wyboru Sprawdź pod kątem dołączenia lub usuń zaznaczenie tylko dla wyniku, jeśli chcesz, aby wyniki zawierały pełny wejściowy zestaw danych, w tym kolumnę wyświetlającą wyniki (przypisania klastra).
Jeśli to pole wyboru zostanie wyczyszczone, zostaną zwrócone tylko wyniki. Ta opcja może być przydatna podczas tworzenia przewidywań w ramach usługi internetowej.
Prześlij potok.
Wyniki
- Aby wyświetlić wartości w zestawie danych, kliknij prawym przyciskiem myszy składnik, a następnie wybierz polecenie Visualize (Wizualizacja). Możesz też wybrać składnik i przejść do karty Dane wyjściowe w prawym panelu, kliknij ikonę histogramu w danych wyjściowych portów , aby zwizualizować wynik.