Wat is Azure Machine Learning Designer (v1)?

Azure Machine Learning Designer is een interface voor slepen en neerzetten die wordt gebruikt voor het trainen en implementeren van modellen in Azure Machine Learning. In dit artikel worden de taken beschreven die u in de ontwerpfunctie kunt uitvoeren.

Notitie

Designer ondersteunt twee typen onderdelen, klassieke vooraf gebouwde onderdelen (v1) en aangepaste onderdelen (v2). Deze twee typen onderdelen zijn NIET compatibel.

Klassieke vooraf samengestelde onderdelen bieden belangrijke vooraf gedefinieerde onderdelen voor gegevensverwerking en traditionele machine learning-taken, zoals regressie en classificatie. Dit type onderdeel wordt nog steeds ondersteund, maar er worden geen nieuwe onderdelen toegevoegd.

Met aangepaste onderdelen kunt u uw eigen code verpakken als onderdeel. Het biedt ondersteuning voor het delen van onderdelen in werkruimten en naadloze creatie in Studio-, CLI v2- en SDK v2-interfaces.

Voor nieuwe projecten raden we u ten zeerste aan aangepaste onderdelen te gebruiken, die compatibel is met AzureML V2 en nieuwe updates blijven ontvangen.

Dit artikel is van toepassing op klassieke vooraf samengestelde onderdelen en niet compatibel met CLI v2 en SDK v2.

  • Zie Zelfstudie: Een regressiemodel zonder code trainen om aan de slag te gaan met de ontwerpfunctie.
  • Zie de naslaginformatie over algoritme en onderdelen voor meer informatie over de onderdelen die beschikbaar zijn in de ontwerpfunctie.

GIF of a building a pipeline in the designer.

De ontwerpfunctie gebruikt uw Azure Machine Learning-werkruimte om gedeelde resources te organiseren, zoals:

Modeltraining en -implementatie

Gebruik een visueel canvas om een end-to-end machine learning-werkstroom te maken. Modellen trainen, testen en implementeren in de ontwerpfunctie:

  • Sleep gegevensassets en -onderdelen naar het canvas.
  • Verbinding maken de onderdelen om een pijplijnconcept te maken.
  • Verzend een pijplijnuitvoering met behulp van de rekenresources in uw Azure Machine Learning-werkruimte.
  • Converteer uw trainingspijplijnen naar deductiepijplijnen.
  • Publiceer uw pijplijnen naar een REST-pijplijneindpunt om een nieuwe pijplijn te verzenden die wordt uitgevoerd met verschillende parameters en gegevensassets.
    • Publiceer een trainingspijplijn om één pijplijn opnieuw te gebruiken om meerdere modellen te trainen terwijl u parameters en gegevensassets wijzigt.
    • Publiceer een pijplijn voor batchdeductie om voorspellingen te doen over nieuwe gegevens met behulp van een eerder getraind model.
  • Implementeer een realtime deductiepijplijn naar een online-eindpunt om in realtime voorspellingen te doen over nieuwe gegevens.

Workflow diagram for training, batch inference, and real-time inference in the designer.

Pijplijn

Een pijplijn bestaat uit gegevensassets en analytische onderdelen die u verbindt. Pijplijnen hebben veel gebruik: u kunt een pijplijn maken waarmee één model wordt getraind of een pijplijn die meerdere modellen traint. U kunt een pijplijn maken die in realtime of in batch voorspellingen doet of een pijplijn maakt waarmee alleen gegevens worden opgeschoond. Met pijplijnen kunt u uw werk opnieuw gebruiken en uw projecten organiseren.

Pijplijnconcept

Wanneer u een pijplijn in de ontwerpfunctie bewerkt, wordt uw voortgang opgeslagen als een pijplijnconcept. U kunt op elk gewenst moment een pijplijnconcept bewerken door onderdelen toe te voegen of te verwijderen, rekendoelen te configureren, parameters te maken, enzovoort.

Een geldige pijplijn heeft de volgende kenmerken:

  • Gegevensassets kunnen alleen verbinding maken met onderdelen.
  • onderdelen kunnen alleen verbinding maken met gegevensassets of andere onderdelen.
  • Alle invoerpoorten voor onderdelen moeten een verbinding met de gegevensstroom hebben.
  • Alle vereiste parameters voor elk onderdeel moeten worden ingesteld.

Wanneer u klaar bent om uw pijplijnconcept uit te voeren, dient u een pijplijntaak in.

Pijplijntaak

Telkens wanneer u een pijplijn uitvoert, worden de configuratie van de pijplijn en de resultaten ervan als pijplijntaak opgeslagen in uw werkruimte. U kunt teruggaan naar elke pijplijntaak om deze te inspecteren voor probleemoplossing of controle. Kloon een pijplijntaak om een nieuw pijplijnconcept te maken dat u kunt bewerken.

Pijplijntaken worden gegroepeerd in experimenten om de taakgeschiedenis te organiseren. U kunt het experiment instellen voor elke pijplijntaak.

Gegevens

Met een machine learning-gegevensasset kunt u eenvoudig uw gegevens openen en ermee werken. Er zijn verschillende voorbeeldgegevensassets opgenomen in de ontwerpfunctie waarmee u kunt experimenteren. U kunt meer gegevensassets registreren wanneer u ze nodig hebt.

Onderdeel

Een onderdeel is een algoritme dat u op uw gegevens kunt uitvoeren. De ontwerpfunctie bevat verschillende onderdelen, variërend van functies voor inkomend gegevensverkeer tot trainings-, score- en validatieprocessen.

Een onderdeel kan een set parameters hebben die u kunt gebruiken om de interne algoritmen van het onderdeel te configureren. Wanneer u een onderdeel op het canvas selecteert, worden de parameters van het onderdeel weergegeven in het deelvenster Eigenschappen rechts van het canvas. U kunt de parameters in dit deelvenster wijzigen om het model af te stemmen. U kunt de berekeningsresources voor afzonderlijke onderdelen instellen in de ontwerpfunctie.

Screenshot showing the component properties.

Zie het overzicht van de naslaginformatie over algoritmes en onderdelen voor hulp bij het navigeren door de bibliotheek met beschikbare machine learning-algoritmen. Zie het cheatsheet van het Azure Machine Learning-algoritme voor hulp bij het kiezen van een algoritme.

Rekenresources

Gebruik rekenresources uit uw werkruimte om uw pijplijn uit te voeren en uw geïmplementeerde modellen als online-eindpunten of pijplijneindpunten te hosten (voor batchdeductie). De ondersteunde rekendoelen zijn:

Rekendoel Training Implementatie
Azure Machine Learning-rekenproces
Azure Kubernetes Service

Rekendoelen worden gekoppeld aan uw Azure Machine Learning-werkruimte. U beheert uw rekendoelen in uw werkruimte in de Azure Machine Learning-studio.

Implementeren

Als u realtime deductie wilt uitvoeren, moet u een pijplijn implementeren als een online-eindpunt. Het online-eindpunt maakt een interface tussen een externe toepassing en uw scoremodel. Een aanroep naar een online-eindpunt retourneert in realtime voorspellingsresultaten naar de toepassing. Als u een aanroep naar een online-eindpunt wilt maken, geeft u de API-sleutel door die is gemaakt toen u het eindpunt implementeerde. Het eindpunt is gebaseerd op REST, een populaire architectuurkeuze voor webprogrammeringsprojecten.

Online-eindpunten moeten worden geïmplementeerd in een Azure Kubernetes Service-cluster.

Zie Zelfstudie: Een machine learning-model implementeren met de ontwerpfunctie voor meer informatie over het implementeren van uw model.

Publiceren

U kunt ook een pijplijn publiceren naar een pijplijneindpunt. Net als bij een online-eindpunt kunt u met een pijplijneindpunt nieuwe pijplijntaken verzenden vanuit externe toepassingen met behulp van REST-aanroepen. U kunt echter geen gegevens in realtime verzenden of ontvangen met behulp van een pijplijneindpunt.

Gepubliceerde pijplijnen zijn flexibel, ze kunnen worden gebruikt om modellen te trainen of opnieuw te trainen, batchdeductie uit te voeren, nieuwe gegevens te verwerken en nog veel meer. U kunt meerdere pijplijnen publiceren naar één pijplijneindpunt en opgeven welke pijplijnversie moet worden uitgevoerd.

Een gepubliceerde pijplijn wordt uitgevoerd op de rekenresources die u definieert in het pijplijnconcept voor elk onderdeel.

De ontwerpfunctie maakt hetzelfde PublishedPipeline-object als de SDK.

Volgende stappen