Referenční informace o algoritmech a komponentách pro návrháře služby Azure Machine Učení

Článek
01/10/2024

PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

Poznámka:

Návrhář podporuje dva typy komponent, klasické předem připravené komponenty a vlastní komponenty. Tyto dva typy komponent nejsou kompatibilní.

Klasické předem připravené komponenty poskytují předem připravené komponenty pro zpracování dat a tradiční úlohy strojového učení, jako je regrese a klasifikace. Tento typ komponenty se podporuje i nadále, ale nebudou se přidávat žádné nové komponenty.

Vlastní komponenty umožňují poskytnout vlastní kód jako součást. Podporuje sdílení mezi pracovními prostory a bezproblémové vytváření obsahu v sadě Studio, CLI a rozhraních sady SDK.

Tento článek se týká klasických předem připravených komponent.

Tento referenční obsah poskytuje technické pozadí pro každou z klasických předem připravených komponent dostupných v návrháři služby Azure Machine Učení.

Každá komponenta představuje sadu kódu, která se dá spouštět nezávisle a provádět úlohu strojového učení vzhledem k požadovaným vstupům. Komponenta může obsahovat určitý algoritmus nebo provádět úlohu, která je důležitá pro strojové učení, například chybějící nahrazení hodnoty nebo statistickou analýzu.

Nápovědu k výběru algoritmů najdete v tématu

Tip

V jakémkoli kanálu v návrháři můžete získat informace o konkrétní komponentě. Vyberte odkaz Další informace na kartě komponenty při najetí myší na komponentu v seznamu komponent nebo v pravém podokně komponenty.

Komponenty přípravy dat

Funkce	Popis	komponenta
Vstup a výstup dat	Přesuňte data z cloudových zdrojů do kanálu. Zapište výsledky nebo zprostředkující data do služby Azure Storage nebo SQL Database při spuštění kanálu nebo použijte cloudové úložiště k výměně dat mezi kanály.	Ruční zadávání dat Export dat Import dat
transformace dat	Operace s daty, která jsou jedinečná pro strojové učení, jako je normalizace nebo binningová data, redukce dimenzí a převod dat mezi různými formáty souborů.	Přidat sloupce Přidat řádky Použití matematické operace Použití transformace SQL Vyčištění chybějících dat Hodnoty klipů Převést na CSV Převést na datovou sadu Převést na hodnoty ukazatele Upravit metadata Seskupení dat do intervalů Spojení dat Normalizovat data Dělení a ukázka Odebrat duplicitní řádky SMOTE Výběr transformace sloupců Výběr sloupců v datové sadě Rozdělení dat
Výběr součástí	Vyberte podmnožinu relevantních užitečných funkcí, které se mají použít k vytvoření analytického modelu.	Výběr funkcí založených na filtru Důležitost funkce permutace
Statistické funkce	Poskytuje širokou škálu statistických metod souvisejících s datovými vědami.	Shrnutí dat

Algoritmy strojového učení

Funkce	Popis	komponenta
Regrese	Predikce hodnoty	Zvýšení regrese rozhodovacího stromu Regrese rozhodovacího doménového struktury Regrese rychlého kvantování doménové struktury Lineární regrese Regrese neurální sítě Poissonova regrese
Clustering	Seskupte data dohromady.	K-Means Clustering
Klasifikace	Predikce třídy Vyberte si z binárních (dvou tříd) nebo vícetřídových algoritmů.	Rozhodovací strom s více třídami Rozhodovací doménová struktura s více třídami Logistická regrese s více třídami Neurální síť s více třídami Jedna vs. Všechna vícetřídka Jedna vs. jedna multitřída Perceptron se dvěma třídami Rozhodovací strom se dvěma třídami Rozhodovací doménová struktura se dvěma třídami Logistická regrese se dvěma třídami Neurální síť se dvěma třídami Dvoutřídní podpůrný vektorový stroj

Komponenty pro sestavování a vyhodnocování modelů

Funkce	Popis	komponenta
Trénování modelu	Spusťte data prostřednictvím algoritmu.	Trénování modelu clusteringu Trénování modelu Trénování modelu Pytorch Ladění hyperparametrů modelu
Vyhodnocování a vyhodnocování modelů	Změřte přesnost natrénovaného modelu.	Použít transformaci Přiřazení dat ke clusterům Křížové ověření modelu Vyhodnocení modelu Určení skóre obrázku modelu Určení skóre modelu
Jazyk Pythonu	Napište kód a vložte ho do komponenty pro integraci Pythonu s vaším kanálem.	Vytvoření modelu Pythonu Spuštění skriptu Pythonu
Jazyk R	Napište kód a vložte ho do komponenty pro integraci jazyka R s kanálem.	Spuštění skriptu jazyka R
Analýza textu	Poskytuje specializované výpočetní nástroje pro práci se strukturovaným i nestrukturovaným textem.	Převod wordu na vektor Extrahování funkcí N Gram z textu Hashování funkcí Předběžné zpracování textu Latent Dirichlet Allocation Určení skóre modelu Vowpal Wabbit Trénování modelu Vowpal Wabbit
Počítačové zpracování obrazu	Předběžné zpracování obrazových dat a komponenty související s rozpoznáváním obrázků	Použití transformace obrázku Převést do adresáře obrázků Transformace inicializačních obrázků Rozdělit adresář obrázků DenseNet ResNet
Doporučení	Vytvářejte modely doporučení.	Vyhodnocení doporučeného Určení skóre doporučeného svd Určení skóre širokého a hloubkového doporučovače Trénovat doporučovač SVD Trénovat širokoúhlý a hluboký doporučovač
Detekce anomálií	Vytvářejte modely detekce anomálií.	Detekce anomálií založených na PCA Trénování modelu detekce anomálií

Webová služba

Seznamte se s komponentami webové služby, které jsou nezbytné pro odvozování v reálném čase v návrháři služby Azure Machine Učení.

Chybové zprávy

Přečtěte si informace o chybových zprávách a kódech výjimek, se kterými se můžete setkat pomocí komponent v návrháři azure Machine Učení.

Prostředí komponent

Všechny předdefinované komponenty v návrháři se budou spouštět v pevném prostředí poskytovaném Microsoftem.

Dříve bylo toto prostředí založené na Pythonu 3.6 a teď je upgradované na Python 3.8. Tento upgrade je transparentní, protože komponenty se automaticky spustí v prostředí Pythonu 3.8 a od uživatele se nevyžaduje žádná akce. Aktualizace prostředí může mít vliv na výstupy komponent a nasazení koncového bodu v reálném čase z odvozování v reálném čase. Další informace najdete v následujících částech.

Výstupy komponent se liší od předchozích výsledků.

Po upgradu verze Pythonu z verze 3.6 na verzi 3.8 je možné odpovídajícím způsobem upgradovat také závislosti předdefinovaných komponent. Proto se mohou výstupy některých komponent lišit od předchozích výsledků.

Pokud používáte komponentu Execute Python Script a máte dříve nainstalované balíčky spojené s Pythonem 3.6, můžete narazit na chyby, jako jsou:

"Nepodařilo se najít verzi, která požadavek splňuje."
Nenašla se žádná odpovídající distribuce. Pak budete muset zadat verzi balíčku přizpůsobenou Pythonu 3.8 a znovu spustit kanál.

Problém s nasazením koncového bodu v reálném čase z kanálu odvozování v reálném čase

Pokud přímo nasadíte koncový bod v reálném čase z předchozího dokončeného kanálu pro odvozování v reálném čase, může narazit na chyby.

Doporučení: Naklonujte kanál odvozování a odešlete ho znovu a pak ho nasaďte do koncového bodu v reálném čase.

Další kroky

Kurz: Vytvoření modelu v návrháři pro predikci automatických cen