Vad är Azure Machine Learning Designer (v1)?

Azure Machine Learning Designer är ett dra och släpp-gränssnitt som används för att träna och distribuera modeller i Azure Machine Learning. Den här artikeln beskriver de uppgifter du kan utföra i designern.

Kommentar

Designer stöder två typer av komponenter, klassiska fördefinierade komponenter(v1) och anpassade komponenter(v2). Dessa två typer av komponenter är INTE kompatibla.

Klassiska fördefinierade komponenter ger fördefinierade komponenter huvudsakligen för databearbetning och traditionella maskininlärningsuppgifter som regression och klassificering. Den här typen av komponent stöds fortfarande, men inga nya komponenter läggs till.

Med anpassade komponenter kan du omsluta din egen kod som en komponent. Den stöder delning av komponenter mellan arbetsytor och sömlös redigering i Studio-, CLI v2- och SDK v2-gränssnitt.

För nya projekt rekommenderar vi starkt att du använder anpassad komponent, som är kompatibel med AzureML V2 och fortsätter att ta emot nya uppdateringar.

Den här artikeln gäller för klassiska fördefinierade komponenter och är inte kompatibel med CLI v2 och SDK v2.

GIF of a building a pipeline in the designer.

Designern använder din Azure Machine Learning-arbetsyta för att organisera delade resurser, till exempel:

Modellträning och distribution

Använd en visuell arbetsyta för att skapa ett maskininlärningsarbetsflöde från slutpunkt till slutpunkt. Träna, testa och distribuera modeller i designern:

  • Dra och släpp datatillgångar och komponenter på arbetsytan.
  • Anslut komponenterna för att skapa ett pipeline-utkast.
  • Skicka en pipelinekörning med hjälp av beräkningsresurserna på din Azure Machine Learning-arbetsyta.
  • Konvertera dina träningspipelines till slutsatsdragningspipelines.
  • Publicera dina pipelines till en REST-pipelineslutpunkt för att skicka en ny pipeline som körs med olika parametrar och datatillgångar.
    • Publicera en träningspipeline för att återanvända en enda pipeline för att träna flera modeller samtidigt som parametrar och datatillgångar ändras.
    • Publicera en pipeline för batchinferens för att göra förutsägelser om nya data med hjälp av en tidigare tränad modell.
  • Distribuera en pipeline för slutsatsdragning i realtid till en onlineslutpunkt för att göra förutsägelser om nya data i realtid.

Workflow diagram for training, batch inference, and real-time inference in the designer.

Pipeline

En pipeline består av datatillgångar och analyskomponenter som du ansluter till. Pipelines har många användningsområden: du kan skapa en pipeline som tränar en enda modell eller en som tränar flera modeller. Du kan skapa en pipeline som gör förutsägelser i realtid eller i batch, eller skapa en pipeline som bara rensar data. Med pipelines kan du återanvända ditt arbete och organisera dina projekt.

Pipeline-utkast

När du redigerar en pipeline i designern sparas förloppet som ett pipelineutkast. Du kan redigera ett pipelineutkast när som helst genom att lägga till eller ta bort komponenter, konfigurera beräkningsmål, skapa parametrar och så vidare.

En giltig pipeline har följande egenskaper:

  • Datatillgångar kan bara ansluta till komponenter.
  • komponenter kan bara ansluta till antingen datatillgångar eller andra komponenter.
  • Alla indataportar för komponenter måste ha en viss anslutning till dataflödet.
  • Alla obligatoriska parametrar för varje komponent måste anges.

När du är redo att köra pipelineutkastet skickar du ett pipelinejobb.

Pipelinejobb

Varje gång du kör en pipeline lagras konfigurationen av pipelinen och dess resultat på din arbetsyta som ett pipelinejobb. Du kan gå tillbaka till alla pipelinejobb för att inspektera det för felsökning eller granskning. Klona ett pipelinejobb för att skapa ett nytt pipeline-utkast som du kan redigera.

Pipelinejobb grupperas i experiment för att organisera jobbhistorik. Du kan ange experimentet för varje pipelinejobb.

Data

En maskininlärningsdatatillgång gör det enkelt att komma åt och arbeta med dina data. Flera exempeldatatillgångar ingår i designern som du kan experimentera med. Du kan registrera fler datatillgångar när du behöver dem.

Komponent

En komponent är en algoritm som du kan utföra på dina data. Designern har flera komponenter som sträcker sig från funktioner för dataingress till tränings-, bedömnings- och valideringsprocesser.

En komponent kan ha en uppsättning parametrar som du kan använda för att konfigurera komponentens interna algoritmer. När du väljer en komponent på arbetsytan visas komponentens parametrar i fönstret Egenskaper till höger om arbetsytan. Du kan ändra parametrarna i det här fönstret för att finjustera din modell. Du kan ange beräkningsresurserna för enskilda komponenter i designern.

Screenshot showing the component properties.

Mer information om hur du navigerar i biblioteket med tillgängliga maskininlärningsalgoritmer finns i Referensöversikt över algoritm och komponent. Hjälp med att välja en algoritm finns i fuskbladet för Azure Machine Learning-algoritmen.

Beräkningsresurser

Använd beräkningsresurser från arbetsytan för att köra pipelinen och vara värd för dina distribuerade modeller som onlineslutpunkter eller pipelineslutpunkter (för batchinferens). De beräkningsmål som stöds är:

Beräkningsmål Utbildning Distribution
Azure Machine Learning-beräkning
Azure Kubernetes Service

Beräkningsmål är kopplade till din Azure Machine Learning-arbetsyta. Du hanterar dina beräkningsmål på din arbetsyta i Azure Machine Learning-studio.

Distribuera

Om du vill utföra realtidsinferenser måste du distribuera en pipeline som en onlineslutpunkt. Onlineslutpunkten skapar ett gränssnitt mellan ett externt program och din bedömningsmodell. Ett anrop till en onlineslutpunkt returnerar förutsägelseresultat till programmet i realtid. Om du vill göra ett anrop till en onlineslutpunkt skickar du den API-nyckel som skapades när du distribuerade slutpunkten. Slutpunkten baseras på REST, ett populärt arkitekturval för webbprogrammeringsprojekt.

Onlineslutpunkter måste distribueras till ett Azure Kubernetes Service-kluster.

Information om hur du distribuerar din modell finns i Självstudie: Distribuera en maskininlärningsmodell med designern.

Publicera

Du kan också publicera en pipeline till en pipelineslutpunkt. På samma sätt som en onlineslutpunkt kan du med en pipelineslutpunkt skicka nya pipelinejobb från externa program med hjälp av REST-anrop. Du kan dock inte skicka eller ta emot data i realtid med hjälp av en pipelineslutpunkt.

Publicerade pipelines är flexibla, de kan användas för att träna eller träna om modeller, utföra batchinferens, bearbeta nya data och mycket mer. Du kan publicera flera pipelines till en enda pipelineslutpunkt och ange vilken pipelineversion som ska köras.

En publicerad pipeline körs på de beräkningsresurser som du definierar i pipelineutkastet för varje komponent.

Designern skapar samma PublishedPipeline-objekt som SDK:t.

Nästa steg