Sdílet prostřednictvím


ML modulů v sadě ML Studio (classic)

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Toto téma obsahuje přehled všech modulů zahrnutých v Machine Learning Studiu (klasickém), což je interaktivní vizuální pracovní prostor pro snadné vytváření a testování prediktivních modelů.

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Co je modul?

V Machine Learning Studio (classic) je modul stavebním blokem pro vytváření experimentů. Každý modul zapouzdřuje konkrétní algoritmus strojového učení, funkci nebo knihovnu kódu, které mohou pracovat s daty ve vašem pracovním prostoru. Moduly jsou navržené tak, aby přijíma spojené připojení z jiných modulů sdílely a upravovány data.

Kód, který běží v každém modulu, pochází z mnoha zdrojů. Patří sem open source knihovny a jazyky, algoritmy vyvinuté výzkumem Microsoftu a nástroje pro práci s Azure a dalšími cloudovými službami.

Tip

Hledáte algoritmy strojového učení? Podívejte se Machine Learning, která obsahuje moduly mimo jiné pro rozhodovací stromy, clustering, neurální sítě. Kategorie Train ( Trénování ) a Evaluate (Vyhodnocení) obsahují moduly, které vám pomůžou s trénováním a testováním modelů.

Připojením a konfigurací modulů můžete vytvořit pracovní postup, který načte data z externích zdrojů, připraví je k analýze, použije algoritmy strojového učení a vygeneruje výsledky.

Když je experiment otevřený v Machine Learning Studiu (klasickém), zobrazí se úplný seznam aktuálních modulů v navigačním podokně vlevo. Tyto stavební bloky přetáhnete do experimentu a pak je připojíte, abyste vytvořili kompletní pracovní postup strojového učení, který se nazývá experiment.

Někdy se moduly aktualizují a přidávají nové funkce nebo odebírat starší kód. Když k tomu dojde, všechny experimenty, které jste vytvořili a které používají tento modul, budou dál běžet. Při příštím otevření experimentu se ale zobrazí výzva k upgradu modulu nebo k použití jiného modulu.

Příklady

Příklad vytvoření kompletního experimentu strojového učení najdete v těchto kurzech:

Kategorie modulu

Aby bylo snazší najít související moduly, jsou nástroje strojového učení v Machine Learning Studiu (klasickém) seskupené podle těchto kategorií.

Převody formátu dat

Pomocí těchto modulů můžete převést data do jednoho z formátů používaných jinými nástroji nebo formáty strojového učení.

  • Vstup a výstup dat

    Tyto moduly slouží ke čtení dat a modelů z cloudových zdrojů dat, včetně clusterů Hadoop, služby Azure Table Storage a webových adres URL. Tyto moduly můžete použít také k zápisu výsledků do úložiště nebo do databáze.

  • Transformace dat

    Tyto moduly slouží k přípravě dat pro analýzu. Můžete měnit datové typy, označit sloupce příznakem jako funkce nebo popisky, generovat funkce a škálovat nebo normalizovat data.

  • Filtr

    Transformace číselných dat odvozených ze zpracování digitálního signálu

  • Učení s počty

    Použijete společné rozdělení pravděpodobnosti k vytváření funkcí, které kompaktně popisují velké datové sady.

  • Manipulace

    Tato skupina poskytuje celou řadu nástrojů pro datové vědy. Můžete například odebrat nebo nahradit chybějící hodnoty, zvolit podmnožinu sloupců, přidat sloupec nebo zřetězit dvě datové sady.

  • Ukázka a rozdělení

    Vydělí datovou sadu kritérii nebo velikostí, vytvoří trénovací a testovací sadu nebo izoluje určité řádky.

  • Škálování a redukce

    Transformace číselných dat

Výběr funkce

Pomocí těchto modulů identifikujte nejlepší funkce v datech pomocí široce prošeřených statistických metod.

Machine Learning

Tato skupina obsahuje většinu algoritmů strojového učení podporovaných Machine Learning.

Obsahuje také moduly určené k podpoře algoritmů trénování modelů, generování skóre a vyhodnocení výkonu modelu.

  • Vyhodnotit

    Po vytrénování modelu použijte tyto nástroje k měření přesnosti modelu.

  • Inicializace

    Tyto moduly poskytují algoritmy strojového učení, které můžete přizpůsobit nastavením parametrů. Algoritmy v této části jsou seskupené podle typu:

  • Skóre

    Tyto moduly použijte k předání nových dat prostřednictvím algoritmu a vygenerování sady výsledků pro vyhodnocení. Výsledky bodování můžete použít také jako součást prediktivní služby.

  • Trénování

    Tyto moduly natrénují inicializované modely strojového učení na datech, která poskytnete.

Moduly knihovny OpenCV

Tyto moduly poskytují snadný přístup k oblíbené knihovně open source pro zpracování obrázků a klasifikaci obrázků.

Moduly jazyka R

Pomocí těchto modulů můžete do experimentu přidat vlastní kód R nebo implementovat model strojového učení založený na balíčku R.

Jazykové moduly Pythonu

Pomocí těchto modulů můžete do experimentu přidat vlastní kód Pythonu.

Statistické funkce

Tyto moduly slouží k výpočtu rozdělení pravděpodobnosti, vytváření vlastních výpočtů a provádění široké škály dalších úloh souvisejících s číselnými proměnnými.

Analýza textu

Tyto moduly slouží k hashování funkcí a rozpoznávání pojmenovaných entit nebo k předběžnému zpracování textu pomocí nástrojů pro zpracování přirozeného jazyka.

Časová řada

Tyto moduly slouží k vyhodnocení anomálií v trendech pomocí algoritmů speciálně navržených pro data časových řad.

Machine Learning Studio (klasické) se nepokoušejí duplikovat nástroje pro integraci dat podporované v jiných nástrojích, jako je Azure Data Factory. Moduly místo toho poskytují funkce specifické pro strojové učení:

  • Normalizace, seskupování a škálování dat
  • Výpočet statistické distribuce dat
  • Převod na jiné formáty strojového učení
  • Import dat používaných pro experimenty strojového učení a export výsledků
  • Analýza textu, výběr funkcí a redukce počtu dimenzí

Pokud potřebujete sofistikovanější zařízení pro manipulaci s daty a úložiště, projděte si následující témata:

Viz také