Referens för algoritm och komponent för Azure Machine Learning Designer

Artikel
01/10/2024

GÄLLER FÖR: Python SDK azure-ai-ml v2 (aktuell)

Kommentar

Designer stöder två typer av komponenter, klassiska fördefinierade komponenter och anpassade komponenter. Dessa två typer av komponenter är inte kompatibla.

Klassiska fördefinierade komponenter tillhandahåller fördefinierade komponenter som främst används för databearbetning och traditionella maskininlärningsuppgifter som regression och klassificering. Den här typen av komponent stöds fortfarande, men inga nya komponenter läggs till.

Med anpassade komponenter kan du ange din egen kod som en komponent. Det finns stöd för delning mellan arbetsytor och sömlös redigering i Studio-, CLI- och SDK-gränssnitt.

Den här artikeln gäller för klassiska fördefinierade komponenter.

Det här referensinnehållet ger den tekniska bakgrunden för var och en av de klassiska fördefinierade komponenterna som är tillgängliga i Azure Machine Learning-designern.

Varje komponent representerar en uppsättning kod som kan köras separat och utföra en maskininlärningsuppgift, med de indata som krävs. En komponent kan innehålla en viss algoritm eller utföra en uppgift som är viktig inom maskininlärning, till exempel saknade värdeersättning eller statistisk analys.

Hjälp med att välja algoritmer finns i

Dricks

I valfri pipeline i designern kan du få information om en specifik komponent. Välj länken Läs mer på komponentkortet när du hovrar på komponenten i komponentlistan eller i komponentens högra fönster.

Komponenter för förberedelse av data

Funktioner	beskrivning	Komponent
Inmatning och utmatning av data	Flytta data från molnkällor till din pipeline. Skriv dina resultat eller mellanliggande data till Azure Storage eller SQL Database när du kör en pipeline, eller använd molnlagring för att utbyta data mellan pipelines.	Ange data manuellt Exportera data Importera data
Data Transformation	Åtgärder för data som är unika för maskininlärning, till exempel normalisering eller binning av data, minskning av dimensionalitet och konvertering av data mellan olika filformat.	Lägg till kolumner Lägg till rader Tillämpa matematisk åtgärd Tillämpa SQL-transformering Rensa saknade data Klipp ut värden Konvertera till CSV Konvertera till datauppsättning Konvertera till indikatorvärden Redigera metadata Gruppera data i lagerplatser Koppla data Normalisera data Partition och exempel Ta bort dubblettrader SMOTE Välj kolumntransformering Välj kolumner i datauppsättning Split Data (Dela data)
Funktionsurval	Välj en delmängd av relevanta, användbara funktioner som ska användas för att skapa en analysmodell.	Filtrera baserat funktionsval Funktionsvikt för permutation
Statistiska funktioner	Tillhandahålla en mängd olika statistiska metoder som rör datavetenskap.	Sammanfatta data

Maskininlärningsalgoritmer

Funktioner	beskrivning	Komponent
Regression	Förutsäga ett värde.	Förbättrad regression av beslutsträd Regression av beslutsskog Fast Forest Quantile Regression Linjär regression Regression för neuralt nätverk Poisson Regression
Klustring	Gruppera data tillsammans.	K-Means-klustring
Klassificering	Förutsäga en klass. Välj mellan binära algoritmer (två klasser) eller multiklassalgoritmer.	Flerklasssförstärkning av beslutsträd Beslutsskog för flera grupper Logistisk regression för flera grupper Neuralt nätverk med flera grupper En jämfört med alla multiklasser One vs. One Multiclass Genomsnittlig perceptron med två klasser Two-Class Boosted Decision Tree (Tvåklassigt förbättrat beslutsträd) Beslutsskog med två klasser Logistisk regression i två klasser Neuralt nätverk med två klasser Två klassstödvektordator

Komponenter för att skapa och utvärdera modeller

Funktioner	beskrivning	Komponent
Modellträning	Kör data via algoritmen.	Träna klustringsmodell Train Model (Träningsmodell) Träna Pytorch-modell Justera modellhyperparametrar
Bedömning och utvärdering av modell	Mät noggrannheten för den tränade modellen.	Tillämpa transformering Tilldela data till kluster Kors verifiera modell Utvärdera modell Poängbildmodell Poängmodell
Python-språk	Skriv kod och bädda in den i en komponent för att integrera Python med din pipeline.	Skapa Python-modell Köra Python-skript
R-språk	Skriv kod och bädda in den i en komponent för att integrera R med din pipeline.	Köra R-skript
Textanalys	Tillhandahålla specialiserade beräkningsverktyg för att arbeta med både strukturerad och ostrukturerad text.	Konvertera Word till vektor Extrahera N Gram-funktioner från text Funktionshashing Förbearbeta text Latent Dirichlet-allokering Poäng vowpal wabbit modell Träna Vowpal Wabbit-modell
Visuellt innehåll	Förbearbetning av bilddata och komponenter relaterade till bildigenkänning.	Tillämpa bildomvandling Konvertera till avbildningskatalog Init-bildomvandling Dela avbildningskatalog DenseNet ResNet
Rekommendation	Skapa rekommendationsmodeller.	Utvärdera rekommenderare Poängsätta SVD-rekommenderare Poäng bred och djuprekommendator Träna SVD-rekommendationer Träna bred och djuprekommendator
Avvikelseidentifiering	Skapa modeller för avvikelseidentifiering.	PCA-baserad avvikelseidentifiering Träna modell för avvikelseidentifiering

Webbtjänst

Lär dig mer om webbtjänstkomponenterna, som är nödvändiga för realtidsinferens i Azure Machine Learning Designer.

Felmeddelanden

Lär dig mer om de felmeddelanden och undantagskoder som du kan stöta på med hjälp av komponenter i Azure Machine Learning Designer.

Komponentmiljö

Alla inbyggda komponenter i designern körs i en fast miljö som tillhandahålls av Microsoft.

Tidigare baserades miljön på Python 3.6, men nu har den uppgraderats till Python 3.8. Uppgraderingen är transparent eftersom komponenterna körs automatiskt i Python 3.8-miljön och kräver ingen åtgärd från användaren. Miljöuppdateringen kan påverka komponentutdata och distribuera realtidsslutpunkt från en slutsatsdragning i realtid. Mer information finns i följande avsnitt.

Komponenternas utdata skiljer sig från tidigare resultat

När Python-versionen har uppgraderats från 3.6 till 3.8 kan beroendena för inbyggda komponenter också uppgraderas i enlighet med detta. Därför kanske vissa komponenters utdata skiljer sig från tidigare resultat.

Om du använder komponenten Kör Python-skript och tidigare har installerat paket som är kopplade till Python 3.6 kan du stöta på fel som:

"Det gick inte att hitta en version som uppfyller kravet."
"Ingen matchande distribution hittades." Sedan måste du ange den paketversion som är anpassad till Python 3.8 och köra pipelinen igen.

Distribuera realtidsslutpunkt från problem med slutsatsdragningspipeline i realtid

Om du distribuerar realtidsslutpunkten direkt från en tidigare slutförd pipeline för slutsatsdragning i realtid kan det uppstå fel.

Rekommendation: Klona slutsatsdragningspipelinen och skicka den igen och distribuera sedan till realtidsslutpunkten.

Nästa steg

Självstudie: Skapa en modell i designern för att förutsäga automatiska priser