Klastrowanie modułów

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

W tym artykule opisano moduły w programie Machine Learning Studio (wersja klasyczna), które obsługują tworzenie modeli klastrowania.

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Co to jest klastrowanie?

Klastrowanie w uczeniu maszynowym to metoda grupowania punktów danych w podobne klastry. Jest ona również nazywana segmentacją.

Przez lata opracowano wiele algorytmów klastrowania. Prawie wszystkie algorytmy klastrowania używają funkcji poszczególnych elementów do wyszukiwania podobnych elementów. Możesz na przykład zastosować klastrowanie, aby znaleźć podobne osoby według danych demograficznych. Klastrowanie z analizą tekstu umożliwia grupowanie zdań o podobnych tematach lub tonacji.

Klastrowanie jest nazywane techniką uczenia nienadzorowanego, ponieważ może być używana w danych bez etykiet. W rzeczywistości klastrowanie jest przydatnym pierwszym krokiem do odnajdywania nowych wzorców i wymaga niewielkiej wiedzy na temat struktury danych i sposobu, w jaki elementy są powiązane. Klastrowanie jest często używane do eksploracji danych przed analizą przy użyciu innych algorytmów predykcyjnych.

Jak utworzyć model klastrowania

W Machine Learning Studio (wersja klasyczna) można używać klastrowania z danymi z etykietami lub bez etykiet.

  • W danych bez etykiet algorytm klastrowania określa, które punkty danych znajdują się najbliżej siebie, i tworzy klastry wokół punktu centralnego lub centroidy. Następnie można użyć identyfikatora klastra jako tymczasowej etykiety dla grupy danych.

  • Jeśli dane mają etykiety, możesz użyć etykiety do kierowania liczbą klastrów lub użyć etykiety jako innej funkcji.

Po skonfigurowaniu algorytmu klastrowania trenuj go na danych przy użyciu modułów Train Clustering Model (Trenowanie modelu klastrowania) lub Sweep Clustering (Czyszczenie klastra ).

Gdy model zostanie wytrenowany, użyj go do przewidywania członkostwa w klastrze dla nowych punktów danych. Jeśli na przykład klastrowanie było używane do grupowania klientów przez zachowanie zakupów, można użyć modelu do przewidywania zachowania zakupów nowych klientów.

Lista modułów

Kategoria klastrowania obejmuje ten moduł:

Aby użyć innego algorytmu klastrowania lub utworzyć niestandardowy model klastrowania przy użyciu języka R, zobacz następujące tematy:

Przykłady

Przykłady klastrowania w działaniu można znaleźć w Azure AI Gallery.

Zapoznaj się z tymi artykułami, aby uzyskać pomoc przy wyborze algorytmu:

Zobacz też