Referenční informace o algoritmech a komponentách pro návrháře služby Azure Machine Učení

PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

Poznámka:

Návrhář podporuje dva typy komponent, klasické předem připravené komponenty a vlastní komponenty. Tyto dva typy komponent nejsou kompatibilní.

Klasické předem připravené komponenty poskytují předem připravené komponenty pro zpracování dat a tradiční úlohy strojového učení, jako je regrese a klasifikace. Tento typ komponenty se podporuje i nadále, ale nebudou se přidávat žádné nové komponenty.

Vlastní komponenty umožňují poskytnout vlastní kód jako součást. Podporuje sdílení mezi pracovními prostory a bezproblémové vytváření obsahu v sadě Studio, CLI a rozhraních sady SDK.

Tento článek se týká klasických předem připravených komponent.

Tento referenční obsah poskytuje technické pozadí pro každou z klasických předem připravených komponent dostupných v návrháři služby Azure Machine Učení.

Každá komponenta představuje sadu kódu, která se dá spouštět nezávisle a provádět úlohu strojového učení vzhledem k požadovaným vstupům. Komponenta může obsahovat určitý algoritmus nebo provádět úlohu, která je důležitá pro strojové učení, například chybějící nahrazení hodnoty nebo statistickou analýzu.

Nápovědu k výběru algoritmů najdete v tématu

Tip

V jakémkoli kanálu v návrháři můžete získat informace o konkrétní komponentě. Vyberte odkaz Další informace na kartě komponenty při najetí myší na komponentu v seznamu komponent nebo v pravém podokně komponenty.

Komponenty přípravy dat

Funkce Popis komponenta
Vstup a výstup dat Přesuňte data z cloudových zdrojů do kanálu. Zapište výsledky nebo zprostředkující data do služby Azure Storage nebo SQL Database při spuštění kanálu nebo použijte cloudové úložiště k výměně dat mezi kanály. Ruční zadávání dat
Export dat
Import dat
transformace dat Operace s daty, která jsou jedinečná pro strojové učení, jako je normalizace nebo binningová data, redukce dimenzí a převod dat mezi různými formáty souborů. Přidat sloupce
Přidat řádky
Použití matematické operace
Použití transformace SQL
Vyčištění chybějících dat
Hodnoty klipů
Převést na CSV
Převést na datovou sadu
Převést na hodnoty ukazatele
Upravit metadata
Seskupení dat do intervalů
Spojení dat
Normalizovat data
Dělení a ukázka
Odebrat duplicitní řádky
SMOTE
Výběr transformace sloupců
Výběr sloupců v datové sadě
Rozdělení dat
Výběr součástí Vyberte podmnožinu relevantních užitečných funkcí, které se mají použít k vytvoření analytického modelu. Výběr funkcí založených na filtru
Důležitost funkce permutace
Statistické funkce Poskytuje širokou škálu statistických metod souvisejících s datovými vědami. Shrnutí dat

Algoritmy strojového učení

Funkce Popis komponenta
Regrese Predikce hodnoty Zvýšení regrese rozhodovacího stromu
Regrese rozhodovacího doménového struktury
Regrese rychlého kvantování doménové struktury
Lineární regrese
Regrese neurální sítě
Poissonova regrese
Clustering Seskupte data dohromady. K-Means Clustering
Klasifikace Predikce třídy Vyberte si z binárních (dvou tříd) nebo vícetřídových algoritmů. Rozhodovací strom s více třídami
Rozhodovací doménová struktura s více třídami
Logistická regrese s více třídami
Neurální síť s více třídami
Jedna vs. Všechna vícetřídka
Jedna vs. jedna multitřída
Perceptron se dvěma třídami
Rozhodovací strom se dvěma třídami
Rozhodovací doménová struktura se dvěma třídami
Logistická regrese se dvěma třídami
Neurální síť se dvěma třídami
Dvoutřídní podpůrný vektorový stroj

Komponenty pro sestavování a vyhodnocování modelů

Funkce Popis komponenta
Trénování modelu Spusťte data prostřednictvím algoritmu. Trénování modelu clusteringu
Trénování modelu
Trénování modelu Pytorch
Ladění hyperparametrů modelu
Vyhodnocování a vyhodnocování modelů Změřte přesnost natrénovaného modelu. Použít transformaci
Přiřazení dat ke clusterům
Křížové ověření modelu
Vyhodnocení modelu
Určení skóre obrázku modelu
Určení skóre modelu
Jazyk Pythonu Napište kód a vložte ho do komponenty pro integraci Pythonu s vaším kanálem. Vytvoření modelu Pythonu
Spuštění skriptu Pythonu
Jazyk R Napište kód a vložte ho do komponenty pro integraci jazyka R s kanálem. Spuštění skriptu jazyka R
Analýza textu Poskytuje specializované výpočetní nástroje pro práci se strukturovaným i nestrukturovaným textem. Převod wordu na vektor
Extrahování funkcí N Gram z textu
Hashování funkcí
Předběžné zpracování textu
Latent Dirichlet Allocation
Určení skóre modelu Vowpal Wabbit
Trénování modelu Vowpal Wabbit
Počítačové zpracování obrazu Předběžné zpracování obrazových dat a komponenty související s rozpoznáváním obrázků Použití transformace obrázku
Převést do adresáře obrázků
Transformace inicializačních obrázků
Rozdělit adresář obrázků
DenseNet
ResNet
Doporučení Vytvářejte modely doporučení. Vyhodnocení doporučeného
Určení skóre doporučeného svd
Určení skóre širokého a hloubkového doporučovače
Trénovat doporučovač SVD
Trénovat širokoúhlý a hluboký doporučovač
Detekce anomálií Vytvářejte modely detekce anomálií. Detekce anomálií založených na PCA
Trénování modelu detekce anomálií

Webová služba

Seznamte se s komponentami webové služby, které jsou nezbytné pro odvozování v reálném čase v návrháři služby Azure Machine Učení.

Chybové zprávy

Přečtěte si informace o chybových zprávách a kódech výjimek, se kterými se můžete setkat pomocí komponent v návrháři azure Machine Učení.

Prostředí komponent

Všechny předdefinované komponenty v návrháři se budou spouštět v pevném prostředí poskytovaném Microsoftem.

Dříve bylo toto prostředí založené na Pythonu 3.6 a teď je upgradované na Python 3.8. Tento upgrade je transparentní, protože komponenty se automaticky spustí v prostředí Pythonu 3.8 a od uživatele se nevyžaduje žádná akce. Aktualizace prostředí může mít vliv na výstupy komponent a nasazení koncového bodu v reálném čase z odvozování v reálném čase. Další informace najdete v následujících částech.

Výstupy komponent se liší od předchozích výsledků.

Po upgradu verze Pythonu z verze 3.6 na verzi 3.8 je možné odpovídajícím způsobem upgradovat také závislosti předdefinovaných komponent. Proto se mohou výstupy některých komponent lišit od předchozích výsledků.

Pokud používáte komponentu Execute Python Script a máte dříve nainstalované balíčky spojené s Pythonem 3.6, můžete narazit na chyby, jako jsou:

  • "Nepodařilo se najít verzi, která požadavek splňuje."
  • Nenašla se žádná odpovídající distribuce. Pak budete muset zadat verzi balíčku přizpůsobenou Pythonu 3.8 a znovu spustit kanál.

Problém s nasazením koncového bodu v reálném čase z kanálu odvozování v reálném čase

Pokud přímo nasadíte koncový bod v reálném čase z předchozího dokončeného kanálu pro odvozování v reálném čase, může narazit na chyby.

Doporučení: Naklonujte kanál odvozování a odešlete ho znovu a pak ho nasaďte do koncového bodu v reálném čase.

Další kroky