Wat is Azure Machine Learning Designer (v1)?

Artikel
05/29/2023

Azure Machine Learning Designer is een interface voor slepen en neerzetten die wordt gebruikt voor het trainen en implementeren van modellen in Azure Machine Learning. In dit artikel worden de taken beschreven die u in de ontwerpfunctie kunt uitvoeren.

Notitie

Designer ondersteunt twee typen onderdelen: klassieke vooraf gemaakte onderdelen (v1) en aangepaste onderdelen (v2). Deze twee typen onderdelen zijn NIET compatibel.

Klassieke vooraf samengestelde onderdelen bieden vooraf gedefinieerde onderdelen voor de gegevensverwerking en traditionele machine learning-taken, zoals regressie en classificatie. Dit type onderdeel wordt nog steeds ondersteund, maar er worden geen nieuwe onderdelen toegevoegd.

Met aangepaste onderdelen kunt u uw eigen code als onderdeel verpakken. Het biedt ondersteuning voor het delen van onderdelen in werkruimten en naadloze creatie in studio-, CLI v2- en SDK v2-interfaces.

Voor nieuwe projecten raden we u ten zeerste aan om een aangepast onderdeel te gebruiken, dat compatibel is met AzureML V2 en nieuwe updates blijft ontvangen.

Dit artikel is van toepassing op klassieke vooraf gemaakte onderdelen en niet compatibel met CLI v2 en SDK v2.

Zie Zelfstudie: Een regressiemodel zonder code trainen om aan de slag te gaan met de ontwerpfunctie.
Zie algoritme en onderdeelverwijzing voor meer informatie over de onderdelen die beschikbaar zijn in de ontwerpfunctie.

De ontwerpfunctie gebruikt uw Azure Machine Learning-werkruimte om gedeelde resources te organiseren, zoals:

Pijplijnen
Gegevens
Rekenresources
Geregistreerde modellen
Gepubliceerde pijplijnen
Realtime-eindpunten

Modeltraining en -implementatie

Gebruik een visueel canvas om een end-to-end machine learning-werkstroom te maken. Modellen trainen, testen en implementeren in de ontwerpfunctie:

Gegevensassets en -onderdelen slepen en neerzetten op het canvas.
Verbind de onderdelen om een pijplijnconcept te maken.
Verzend een pijplijnuitvoering met behulp van de rekenresources in uw Azure Machine Learning-werkruimte.
Converteer uw trainingspijplijnen naar deductiepijplijnen.
Publiceer uw pijplijnen naar een REST-pijplijneindpunt om een nieuwe pijplijn te verzenden die wordt uitgevoerd met verschillende parameters en gegevensassets.
- Publiceer een trainingspijplijn om één pijplijn opnieuw te gebruiken om meerdere modellen te trainen terwijl u parameters en gegevensassets wijzigt.
- Publiceer een batchdeductiepijplijn om voorspellingen te doen over nieuwe gegevens met behulp van een eerder getraind model.
Implementeer een realtime deductiepijplijn naar een online-eindpunt om in realtime voorspellingen te doen over nieuwe gegevens.

Werkstroomdiagram voor training, batchdeductie en realtime deductie in de ontwerpfunctie.

Pijplijn

Een pijplijn bestaat uit gegevensassets en analytische onderdelen, die u verbindt. Pijplijnen hebben veel toepassingen: u kunt een pijplijn maken waarmee één model wordt getraind, of een pijplijn waarmee meerdere modellen worden getraind. U kunt een pijplijn maken die in realtime of in batch voorspellingen doet, of een pijplijn maken die alleen gegevens opschoont. Met pijplijnen kunt u uw werk opnieuw gebruiken en uw projecten organiseren.

Pijplijnconcept

Wanneer u een pijplijn in de ontwerpfunctie bewerkt, wordt uw voortgang opgeslagen als een pijplijnconcept. U kunt een pijplijnconcept op elk gewenst moment bewerken door onderdelen toe te voegen of te verwijderen, rekendoelen te configureren, parameters te maken, enzovoort.

Een geldige pijplijn heeft de volgende kenmerken:

Gegevensassets kunnen alleen verbinding maken met onderdelen.
-onderdelen kunnen alleen verbinding maken met gegevensassets of andere onderdelen.
Alle invoerpoorten voor onderdelen moeten enige verbinding hebben met de gegevensstroom.
Alle vereiste parameters voor elk onderdeel moeten worden ingesteld.

Wanneer u klaar bent om uw pijplijnconcept uit te voeren, verzendt u een pijplijntaak.

Pijplijntaak

Telkens wanneer u een pijplijn uitvoert, worden de configuratie van de pijplijn en de resultaten ervan als een pijplijntaak opgeslagen in uw werkruimte. U kunt teruggaan naar een pijplijntaak om deze te controleren voor probleemoplossing of controle. Kloon een pijplijntaak om een nieuw pijplijnconcept te maken dat u kunt bewerken.

Pijplijntaken worden gegroepeerd in experimenten om de taakgeschiedenis te ordenen. U kunt het experiment instellen voor elke pijplijntaak.

Gegevens

Met een machine learning-gegevensasset kunt u eenvoudig uw gegevens openen en ermee werken. In de ontwerpfunctie zijn verschillende voorbeeldgegevensassets opgenomen waarmee u kunt experimenteren. U kunt meer gegevensassets registreren wanneer u deze nodig hebt.

Onderdeel

Een onderdeel is een algoritme dat u kunt uitvoeren op uw gegevens. De ontwerpfunctie bevat verschillende onderdelen, variërend van functies voor inkomend gegevensverkeer tot trainings-, score- en validatieprocessen.

Een onderdeel kan een set parameters hebben die u kunt gebruiken om de interne algoritmen van het onderdeel te configureren. Wanneer u een onderdeel op het canvas selecteert, worden de parameters van het onderdeel weergegeven in het deelvenster Eigenschappen rechts van het canvas. U kunt de parameters in dit deelvenster wijzigen om het model af te stemmen. U kunt de berekeningsresources voor afzonderlijke onderdelen instellen in de ontwerpfunctie.

Schermopname van de eigenschappen van het onderdeel.

Zie Overzicht van naslaginformatie over algoritmeonderdelen &voor hulp bij het navigeren door de bibliotheek met beschikbare machine learning-algoritmen. Zie de cheatsheet voor Azure Machine Learning-algoritmen voor hulp bij het kiezen van een algoritme.

Rekenresources

Gebruik rekenresources uit uw werkruimte om uw pijplijn uit te voeren en uw geïmplementeerde modellen te hosten als online-eindpunten of pijplijneindpunten (voor batchdeductie). De ondersteunde rekendoelen zijn:

Rekendoel	Training	Implementatie
Azure Machine Learning Compute	✓
Azure Kubernetes Service		✓

Rekendoelen zijn gekoppeld aan uw Azure Machine Learning-werkruimte. U beheert uw rekendoelen in uw werkruimte in de Azure Machine Learning-studio.

Implementeren

Als u realtime deductie wilt uitvoeren, moet u een pijplijn implementeren als een online-eindpunt. Het online-eindpunt maakt een interface tussen een externe toepassing en uw scoremodel. Een aanroep van een online-eindpunt retourneert in realtime voorspellingsresultaten naar de toepassing. Als u een online-eindpunt wilt aanroepen, geeft u de API-sleutel door die is gemaakt tijdens de implementatie van het eindpunt. Het eindpunt is gebaseerd op REST, een populaire architectuurkeuze voor webprogrammeringsprojecten.

Online-eindpunten moeten worden geïmplementeerd in een Azure Kubernetes Service-cluster.

Zie Zelfstudie: Een machine learning-model implementeren met de ontwerpfunctie voor meer informatie over het implementeren van uw model.

Publiceren

U kunt ook een pijplijn publiceren naar een pijplijneindpunt. Net als bij een online-eindpunt kunt u met een pijplijneindpunt nieuwe pijplijntaken verzenden vanuit externe toepassingen met behulp van REST-aanroepen. U kunt echter geen gegevens in realtime verzenden of ontvangen met behulp van een pijplijneindpunt.

Gepubliceerde pijplijnen zijn flexibel, ze kunnen worden gebruikt om modellen te trainen of opnieuw te trainen, batchdeductie uit te voeren, nieuwe gegevens te verwerken en nog veel meer. U kunt meerdere pijplijnen publiceren naar één pijplijneindpunt en opgeven welke pijplijnversie moet worden uitgevoerd.

Een gepubliceerde pijplijn wordt uitgevoerd op de rekenresources die u definieert in het pijplijnconcept voor elk onderdeel.

De ontwerpfunctie maakt hetzelfde PublishedPipeline-object als de SDK.

Volgende stappen

Leer de basisprincipes van predictive analytics en machine learning met Zelfstudie: Autoprijzen voorspellen met de ontwerpfunctie
Meer informatie over het wijzigen van bestaande ontwerpvoorbeelden om ze aan te passen aan uw behoeften.

Delen via