Referenční informace o algoritmech a komponentách pro návrháře služby Azure Machine Learning
PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)
Poznámka:
Návrhář podporuje dva typy komponent, klasické předem připravené komponenty a vlastní komponenty. Tyto dva typy komponent nejsou kompatibilní.
Klasické předem připravené komponenty poskytují předem připravené komponenty pro zpracování dat a tradiční úlohy strojového učení, jako je regrese a klasifikace. Tento typ komponenty se podporuje i nadále, ale nebudou se přidávat žádné nové komponenty.
Vlastní komponenty umožňují poskytnout vlastní kód jako součást. Podporuje sdílení mezi pracovními prostory a bezproblémové vytváření obsahu v sadě Studio, CLI a rozhraních sady SDK.
Tento článek se týká klasických předem připravených komponent.
Tento referenční obsah poskytuje technické pozadí pro každou z klasických předem připravených komponent dostupných v návrháři služby Azure Machine Learning.
Každá komponenta představuje sadu kódu, která se dá spouštět nezávisle a provádět úlohu strojového učení vzhledem k požadovaným vstupům. Komponenta může obsahovat určitý algoritmus nebo provádět úlohu, která je důležitá pro strojové učení, například chybějící nahrazení hodnoty nebo statistickou analýzu.
Nápovědu k výběru algoritmů najdete v tématu
Tip
V jakémkoli kanálu v návrháři můžete získat informace o konkrétní komponentě. Vyberte odkaz Další informace na kartě komponenty při najetí myší na komponentu v seznamu komponent nebo v pravém podokně komponenty.
Komponenty přípravy dat
Funkce | Popis | komponenta |
---|---|---|
Vstup a výstup dat | Přesuňte data z cloudových zdrojů do kanálu. Zapište výsledky nebo zprostředkující data do služby Azure Storage nebo SQL Database při spuštění kanálu nebo použijte cloudové úložiště k výměně dat mezi kanály. | Ruční zadávání dat Export dat Import dat |
transformace dat | Operace s daty, která jsou jedinečná pro strojové učení, jako je normalizace nebo binningová data, redukce dimenzí a převod dat mezi různými formáty souborů. | Přidat sloupce Přidat řádky Použití matematické operace Použití transformace SQL Vyčištění chybějících dat Hodnoty klipů Převést na CSV Převést na datovou sadu Převést na hodnoty ukazatele Upravit metadata Seskupení dat do intervalů Spojení dat Normalizovat data Dělení a ukázka Odebrat duplicitní řádky UDEŘIL Výběr transformace sloupců Výběr sloupců v datové sadě Rozdělení dat |
Výběr součástí | Vyberte podmnožinu relevantních užitečných funkcí, které se mají použít k vytvoření analytického modelu. | Výběr funkcí založených na filtru Důležitost funkce permutace |
Statistické funkce | Poskytuje širokou škálu statistických metod souvisejících s datovými vědami. | Shrnutí dat |
Algoritmy strojového učení
Funkce | Popis | komponenta |
---|---|---|
Regrese | Predikce hodnoty | Zvýšení regrese rozhodovacího stromu Regrese rozhodovacího doménového struktury Regrese rychlého kvantování doménové struktury Lineární regrese Regrese neurální sítě Poissonova regrese |
Clustering | Seskupte data dohromady. | K-Means Clustering |
Klasifikace | Predikce třídy Vyberte si z binárních (dvou tříd) nebo vícetřídových algoritmů. | Rozhodovací strom s více třídami Rozhodovací doménová struktura s více třídami Logistická regrese s více třídami Neurální síť s více třídami Jedna vs. Všechna vícetřídka Jedna vs. jedna multitřída Perceptron se dvěma třídami Rozhodovací strom se dvěma třídami Rozhodovací doménová struktura se dvěma třídami Logistická regrese se dvěma třídami Neurální síť se dvěma třídami Dvoutřídní podpůrný vektorový stroj |
Komponenty pro sestavování a vyhodnocování modelů
Webová služba
Seznamte se s komponentami webové služby, které jsou nezbytné pro odvozování v reálném čase v návrháři služby Azure Machine Learning.
Chybové zprávy
Přečtěte si o chybových zprávách a kódech výjimek, se kterými se můžete setkat pomocí komponent v návrháři služby Azure Machine Learning.
Prostředí komponent
Všechny předdefinované komponenty v návrháři se budou spouštět v pevném prostředí poskytovaném Microsoftem.
Dříve bylo toto prostředí založené na Pythonu 3.6 a teď je upgradované na Python 3.8. Tento upgrade je transparentní, protože komponenty se automaticky spustí v prostředí Pythonu 3.8 a od uživatele se nevyžaduje žádná akce. Aktualizace prostředí může mít vliv na výstupy komponent a nasazení koncového bodu v reálném čase z odvozování v reálném čase. Další informace najdete v následujících částech.
Výstupy komponent se liší od předchozích výsledků.
Po upgradu verze Pythonu z verze 3.6 na verzi 3.8 je možné odpovídajícím způsobem upgradovat také závislosti předdefinovaných komponent. Proto se mohou výstupy některých komponent lišit od předchozích výsledků.
Pokud používáte komponentu Execute Python Script a máte dříve nainstalované balíčky spojené s Pythonem 3.6, můžete narazit na chyby, jako jsou:
- "Nepodařilo se najít verzi, která požadavek splňuje."
- Nenašla se žádná odpovídající distribuce. Pak budete muset zadat verzi balíčku přizpůsobenou Pythonu 3.8 a znovu spustit kanál.
Problém s nasazením koncového bodu v reálném čase z kanálu odvozování v reálném čase
Pokud přímo nasadíte koncový bod v reálném čase z předchozího dokončeného kanálu pro odvozování v reálném čase, může narazit na chyby.
Doporučení: Naklonujte kanál odvozování a odešlete ho znovu a pak ho nasaďte do koncového bodu v reálném čase.