Trénování modelu clusteringu
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Navlakuje model clusteringu a přiřazuje data ze školicí sady do clusterů.
kategorie: Machine Learning/výuka
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Přehled modulu
tento článek popisuje, jak pomocí modulu výuka clusteringu clustering v Machine Learning studiu (classic) naučit Model clusteringu.
Modul převezme provedený model clusteringu, který jste už nakonfigurovali pomocí technologie K-označuje modul clusteringu a navlakuje model pomocí označené nebo neoznačené sady dat. Modul vytvoří jak vyškolený model, který můžete použít pro předpověď, a sadu přiřazení clusteru pro každý případ v školicích datech.
Poznámka
Model clusteringu nejde se vyškole pomocí modulu výuka modelu , který je obecným modulem pro vytváření modelů strojového učení. Důvodem je to, že model výuky funguje jenom se základními algoritmy učení. K-znamená a další algoritmy clusteringu umožňují bezdohledné učení, což znamená, že se algoritmus může naučit z neoznačených dat.
Použití modelu výukového clusteringu
Přidejte modul pro vytváření clusterů výukového modelu do experimentu v studiu (Classic). modul najdete v části Machine Learning modulyv kategorii vlaků .
Přidejte modul pro clusteringu, který je prostředkem pro clustering , nebo jiný vlastní modul, který vytvoří kompatibilní model clusteringu, a nastavte parametry modelu clusteringu.
Připojte školicí datovou sadu k pravému vstupu modelu clusteringu s výukou.
V části sada sloupcůvyberte sloupce z datové sady, které chcete použít při vytváření clusterů. Nezapomeňte vybrat sloupce, které mají dobré funkce, například Vyhněte se použití ID nebo jiných sloupců, které mají jedinečné hodnoty, nebo sloupců, které mají všechny stejné hodnoty.
Pokud je popisek k dispozici, můžete ho buď použít jako funkci, nebo ho nechat zapnutý.
Vyberte možnost a zaškrtněte políčko připojit nebo zrušit zaškrtnutí pouze pro výsledek, pokud chcete výstup školicích dat společně s novým označením clusteru.
Pokud zrušíte výběr této možnosti, budou výstupem pouze přiřazení clusteru.
Spusťte experiment nebo klikněte na modul výukového modelu clusteringu a vyberte Spustit vybrané.
Výsledky
Po dokončení školení:
Chcete-li zobrazit cluster a jejich oddělení v grafu, klikněte pravým tlačítkem na výstup datové sady výsledků a vyberte vizualizovat.
Graf představuje hlavní komponenty clusteru, nikoli skutečné hodnoty. Další informace najdete v tématu Analýza hlavní komponenty .
Chcete-li zobrazit hodnoty v datové sadě, přidejte instanci modulu převést do datové sady a připojte ji k výstupu datové sady výsledků . Spusťte modul převést do datové sady , který načte kopii dat, která můžete zobrazit nebo stáhnout.
Pokud chcete vyškolený model Uložit pro pozdější opětovné použití, klikněte pravým tlačítkem myši na modul, vyberte trained modela klikněte na Uložit jako trained model.
K vygenerování skóre z modelu použijte přiřazení dat do clusterů.
Příklady
Příklad toho, jak se Clustering používá ve službě Machine Learning, najdete v Azure AI Gallery:
Clusteringu: Vyhledání podobných společností: ukazuje, jak používat clusteringu u atributů odvozených z nestrukturovaného textu.
Clustering: Color kvantizační: ukazuje, jak pomocí clusteringu najít související barvy a snížit počet bitů použitých v obrázcích.
Clusteringu: seskupit data Iris: poskytuje jednoduchý příklad clusteringu na základě datové sady Iris.
Očekávané vstupy
Název | Typ | Description |
---|---|---|
Nevlakový model | Rozhraní ICluster | Nevlakový model clusteringu |
Datová sada | Tabulka dat | Vstupní zdroj dat |
Parametry modulu
Name | Rozsah | Typ | Výchozí | Description |
---|---|---|---|---|
Sada sloupců | Libovolný | ColumnSelection | Vzor výběru sloupce | |
Kontrolovat pouze výsledek připojení nebo zrušení kontroly | Libovolný | Logická hodnota | true | Zda výstupní datová sada musí obsahovat vstupní datovou sadu, která je připojena sloupcem přiřazení (zaškrtnuto) nebo pouze sloupcem přiřazení (nezaškrtnuto) |
Výstupy
Název | Typ | Description |
---|---|---|
Školený model | Rozhraní ICluster | Model proučeného clusteringu |
Datová sada výsledků | Tabulka dat | Vstupní datová sada, která je připojena datovým sloupcem pro přiřazení nebo sloupce přiřazení |
Výjimky
Výjimka | Description |
---|---|
Chyba 0003 | K výjimce dojde v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdné. |
seznam chyb, které jsou specifické pro moduly studia (classic), najdete v článku kódy chyb Machine Learning.
seznam výjimek rozhraní API najdete v tématu Machine Learning REST API chybové kódy.
Viz také
Seznam modulů a-Z
Trénování
Přiřazení dat do clusterů
Clustering K-Means