ML modulů v sadě ML Studio (classic)
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- Podívejte se na informace o přesunu projektů strojového učení z ML Studia (klasického) do Azure Machine Learning.
- Další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Toto téma obsahuje přehled všech modulů zahrnutých v Machine Learning Studiu (klasickém), což je interaktivní vizuální pracovní prostor pro snadné vytváření a testování prediktivních modelů.
Poznámka
Platí pro: Machine Learning Studio (classic)
Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.
Co je modul?
V Machine Learning Studio (classic) je modul stavebním blokem pro vytváření experimentů. Každý modul zapouzdřuje konkrétní algoritmus strojového učení, funkci nebo knihovnu kódu, které mohou pracovat s daty ve vašem pracovním prostoru. Moduly jsou navržené tak, aby přijíma spojené připojení z jiných modulů sdílely a upravovány data.
Kód, který běží v každém modulu, pochází z mnoha zdrojů. Patří sem open source knihovny a jazyky, algoritmy vyvinuté výzkumem Microsoftu a nástroje pro práci s Azure a dalšími cloudovými službami.
Tip
Hledáte algoritmy strojového učení? Podívejte se Machine Learning, která obsahuje moduly mimo jiné pro rozhodovací stromy, clustering, neurální sítě. Kategorie Train ( Trénování ) a Evaluate (Vyhodnocení) obsahují moduly, které vám pomůžou s trénováním a testováním modelů.
Připojením a konfigurací modulů můžete vytvořit pracovní postup, který načte data z externích zdrojů, připraví je k analýze, použije algoritmy strojového učení a vygeneruje výsledky.
Když je experiment otevřený v Machine Learning Studiu (klasickém), zobrazí se úplný seznam aktuálních modulů v navigačním podokně vlevo. Tyto stavební bloky přetáhnete do experimentu a pak je připojíte, abyste vytvořili kompletní pracovní postup strojového učení, který se nazývá experiment.
Někdy se moduly aktualizují a přidávají nové funkce nebo odebírat starší kód. Když k tomu dojde, všechny experimenty, které jste vytvořili a které používají tento modul, budou dál běžet. Při příštím otevření experimentu se ale zobrazí výzva k upgradu modulu nebo k použití jiného modulu.
Příklady
Příklad vytvoření kompletního experimentu strojového učení najdete v těchto kurzech:
Kategorie modulu
Aby bylo snazší najít související moduly, jsou nástroje strojového učení v Machine Learning Studiu (klasickém) seskupené podle těchto kategorií.
Převody formátu dat
Pomocí těchto modulů můžete převést data do jednoho z formátů používaných jinými nástroji nebo formáty strojového učení.
-
Tyto moduly slouží ke čtení dat a modelů z cloudových zdrojů dat, včetně clusterů Hadoop, služby Azure Table Storage a webových adres URL. Tyto moduly můžete použít také k zápisu výsledků do úložiště nebo do databáze.
-
Tyto moduly slouží k přípravě dat pro analýzu. Můžete měnit datové typy, označit sloupce příznakem jako funkce nebo popisky, generovat funkce a škálovat nebo normalizovat data.
-
Transformace číselných dat odvozených ze zpracování digitálního signálu
-
Použijete společné rozdělení pravděpodobnosti k vytváření funkcí, které kompaktně popisují velké datové sady.
-
Tato skupina poskytuje celou řadu nástrojů pro datové vědy. Můžete například odebrat nebo nahradit chybějící hodnoty, zvolit podmnožinu sloupců, přidat sloupec nebo zřetězit dvě datové sady.
-
Vydělí datovou sadu kritérii nebo velikostí, vytvoří trénovací a testovací sadu nebo izoluje určité řádky.
-
Transformace číselných dat
Výběr funkce
Pomocí těchto modulů identifikujte nejlepší funkce v datech pomocí široce prošeřených statistických metod.
Machine Learning
Tato skupina obsahuje většinu algoritmů strojového učení podporovaných Machine Learning.
Obsahuje také moduly určené k podpoře algoritmů trénování modelů, generování skóre a vyhodnocení výkonu modelu.
-
Po vytrénování modelu použijte tyto nástroje k měření přesnosti modelu.
-
Tyto moduly poskytují algoritmy strojového učení, které můžete přizpůsobit nastavením parametrů. Algoritmy v této části jsou seskupené podle typu:
-
Tyto moduly použijte k předání nových dat prostřednictvím algoritmu a vygenerování sady výsledků pro vyhodnocení. Výsledky bodování můžete použít také jako součást prediktivní služby.
-
Tyto moduly natrénují inicializované modely strojového učení na datech, která poskytnete.
Moduly knihovny OpenCV
Tyto moduly poskytují snadný přístup k oblíbené knihovně open source pro zpracování obrázků a klasifikaci obrázků.
Moduly jazyka R
Pomocí těchto modulů můžete do experimentu přidat vlastní kód R nebo implementovat model strojového učení založený na balíčku R.
Jazykové moduly Pythonu
Pomocí těchto modulů můžete do experimentu přidat vlastní kód Pythonu.
Statistické funkce
Tyto moduly slouží k výpočtu rozdělení pravděpodobnosti, vytváření vlastních výpočtů a provádění široké škály dalších úloh souvisejících s číselnými proměnnými.
Analýza textu
Tyto moduly slouží k hashování funkcí a rozpoznávání pojmenovaných entit nebo k předběžnému zpracování textu pomocí nástrojů pro zpracování přirozeného jazyka.
Časová řada
Tyto moduly slouží k vyhodnocení anomálií v trendech pomocí algoritmů speciálně navržených pro data časových řad.
Související úlohy
Machine Learning Studio (klasické) se nepokoušejí duplikovat nástroje pro integraci dat podporované v jiných nástrojích, jako je Azure Data Factory. Moduly místo toho poskytují funkce specifické pro strojové učení:
- Normalizace, seskupování a škálování dat
- Výpočet statistické distribuce dat
- Převod na jiné formáty strojového učení
- Import dat používaných pro experimenty strojového učení a export výsledků
- Analýza textu, výběr funkcí a redukce počtu dimenzí
Pokud potřebujete sofistikovanější zařízení pro manipulaci s daty a úložiště, projděte si následující témata:
- Azure Data Factory: Enterprise cloudové zpracování dat připravené pro cloud.
- Azure SQL Database: Škálovatelné úložiště s integrovaným přístupem ke strojové učení.
- CosmosDB: úložiště dat NoSQL; import dat do Machine Learning Studia (classic).
- Azure Data Lake Analytics: Distribuovaná analýza velkých dat.
- Stream Analytics: zpracování událostí pro Internet věcí.
- Azure Analýza textu: více možností pro zpracování textu a související Cognitive Services pro rozpoznávání řeči, obrázku a obličeje.
- Azure Databricks: analytická platforma založená na Sparku.