Share via


Vad är Azure Machine Learning Designer (v1)?

Azure Machine Learning-designern är ett dra och släpp-gränssnitt som används för att träna och distribuera modeller i Azure Machine Learning. I den här artikeln beskrivs de uppgifter som du kan utföra i designern.

Anteckning

Designer stöder två typer av komponenter, klassiska fördefinierade komponenter (v1) och anpassade komponenter(v2). Dessa två typer av komponenter är INTE kompatibla.

Klassiska fördefinierade komponenter tillhandahåller fördefinierade komponenter som främst används för databearbetning och traditionella maskininlärningsuppgifter som regression och klassificering. Den här typen av komponent stöds fortfarande, men inga nya komponenter läggs till.

Med anpassade komponenter kan du omsluta din egen kod som en komponent. Den stöder delning av komponenter mellan arbetsytor och sömlös redigering i Gränssnitten Studio, CLI v2 och SDK v2.

För nya projekt rekommenderar vi starkt att du använder anpassad komponent, som är kompatibel med AzureML V2 och fortsätter att ta emot nya uppdateringar.

Den här artikeln gäller för klassiska fördefinierade komponenter som inte är kompatibla med CLI v2 och SDK v2.

GIF för att skapa en pipeline i designern.

Designern använder din Azure Machine Learning-arbetsyta för att organisera delade resurser, till exempel:

Modellträning och -distribution

Använd en visuell arbetsyta för att skapa ett arbetsflöde för maskininlärning från slutpunkt till slutpunkt. Träna, testa och distribuera modeller i designern:

  • Dra och släpp datatillgångar och komponenter på arbetsytan.
  • Anslut komponenterna för att skapa ett pipeline-utkast.
  • Skicka en pipelinekörning med hjälp av beräkningsresurserna på din Azure Machine Learning-arbetsyta.
  • Konvertera dina träningspipelines till slutsatsdragningspipelines.
  • Publicera dina pipelines till en REST-pipelineslutpunkt för att skicka en ny pipeline som körs med olika parametrar och datatillgångar.
    • Publicera en träningspipeline för att återanvända en enda pipeline för att träna flera modeller samtidigt som parametrar och datatillgångar ändras.
    • Publicera en pipeline för batchslutsatsdragning för att göra förutsägelser om nya data med hjälp av en tidigare tränad modell.
  • Distribuera en pipeline för slutsatsdragning i realtid till en onlineslutpunkt för att göra förutsägelser om nya data i realtid.

Arbetsflödesdiagram för träning, batchinferens och slutsatsdragning i realtid i designern.

Pipeline

En pipeline består av datatillgångar och analyskomponenter som du ansluter till. Pipelines har många användningsområden: du kan skapa en pipeline som tränar en enda modell eller en som tränar flera modeller. Du kan skapa en pipeline som gör förutsägelser i realtid eller i batch, eller göra en pipeline som bara rensar data. Med pipelines kan du återanvända ditt arbete och organisera dina projekt.

Pipelineutkast

När du redigerar en pipeline i designern sparas förloppet som ett pipelineutkast. Du kan redigera ett pipelineutkast när som helst genom att lägga till eller ta bort komponenter, konfigurera beräkningsmål, skapa parametrar och så vidare.

En giltig pipeline har följande egenskaper:

  • Datatillgångar kan bara ansluta till komponenter.
  • -komponenter kan bara ansluta till datatillgångar eller andra komponenter.
  • Alla indataportar för komponenter måste ha en viss anslutning till dataflödet.
  • Alla obligatoriska parametrar för varje komponent måste anges.

När du är redo att köra pipeline-utkastet skickar du ett pipelinejobb.

Pipelinejobb

Varje gång du kör en pipeline lagras konfigurationen av pipelinen och dess resultat på din arbetsyta som ett pipelinejobb. Du kan gå tillbaka till valfritt pipelinejobb för att inspektera det för felsökning eller granskning. Klona ett pipelinejobb för att skapa ett nytt pipeline-utkast som du kan redigera.

Pipelinejobb grupperas i experiment för att organisera jobbhistorik. Du kan ange experimentet för varje pipelinejobb.

Data

En maskininlärningsdatatillgång gör det enkelt att komma åt och arbeta med dina data. Flera exempeldatatillgångar ingår i designern som du kan experimentera med. Du kan registrera fler datatillgångar när du behöver dem.

Komponent

En komponent är en algoritm som du kan utföra på dina data. Designern har flera komponenter som sträcker sig från funktioner för dataingress till tränings-, bedömnings- och valideringsprocesser.

En komponent kan ha en uppsättning parametrar som du kan använda för att konfigurera komponentens interna algoritmer. När du väljer en komponent på arbetsytan visas komponentens parametrar i fönstret Egenskaper till höger om arbetsytan. Du kan ändra parametrarna i det här fönstret för att finjustera din modell. Du kan ange beräkningsresurserna för enskilda komponenter i designern.

Skärmbild som visar komponentegenskaperna.

Mer information om hur du navigerar i biblioteket med tillgängliga maskininlärningsalgoritmer finns i Referensöversikt över algoritmkomponenter&. Hjälp med att välja en algoritm finns i översiktsbladet för Azure Machine Learning-algoritmen.

Beräkningsresurser

Använd beräkningsresurser från din arbetsyta för att köra din pipeline och vara värd för dina distribuerade modeller som onlineslutpunkter eller pipelineslutpunkter (för batchinferens). De beräkningsmål som stöds är:

Beräkningsmål Utbildning Distribution
Azure Machine Learning-beräkning
Azure Kubernetes Service

Beräkningsmål är kopplade till din Azure Machine Learning-arbetsyta. Du hanterar dina beräkningsmål på arbetsytan i Azure Machine Learning-studio.

Distribuera

Om du vill utföra slutsatsdragning i realtid måste du distribuera en pipeline som en onlineslutpunkt. Onlineslutpunkten skapar ett gränssnitt mellan ett externt program och din bedömningsmodell. Ett anrop till en onlineslutpunkt returnerar förutsägelseresultat till programmet i realtid. Om du vill göra ett anrop till en onlineslutpunkt skickar du API-nyckeln som skapades när du distribuerade slutpunkten. Slutpunkten baseras på REST, ett populärt arkitekturval för webbprogrammeringsprojekt.

Onlineslutpunkter måste distribueras till ett Azure Kubernetes Service kluster.

Information om hur du distribuerar din modell finns i Självstudie: Distribuera en maskininlärningsmodell med designern.

Publicera

Du kan också publicera en pipeline till en pipelineslutpunkt. Precis som med en onlineslutpunkt kan du med en pipelineslutpunkt skicka nya pipelinejobb från externa program med hjälp av REST-anrop. Du kan dock inte skicka eller ta emot data i realtid med hjälp av en pipelineslutpunkt.

Publicerade pipelines är flexibla, de kan användas för att träna eller träna om modeller, utföra batchinferens, bearbeta nya data och mycket mer. Du kan publicera flera pipelines till en enda pipelineslutpunkt och ange vilken pipelineversion som ska köras.

En publicerad pipeline körs på de beräkningsresurser som du definierar i pipelineutkastet för varje komponent.

Designern skapar samma PublishedPipeline-objekt som SDK:t.

Nästa steg