Pijplijnparameters gebruiken om modellen opnieuw te trainen in de ontwerpfunctie

Artikel
11/28/2023

In dit artikel leert u hoe u Azure Machine Learning Designer gebruikt om een machine learning-model opnieuw te trainen met behulp van pijplijnparameters. U gebruikt gepubliceerde pijplijnen om uw werkstroom te automatiseren en parameters in te stellen om uw model te trainen op nieuwe gegevens. Met pijplijnparameters kunt u bestaande pijplijnen opnieuw gebruiken voor verschillende taken.

In dit artikel leert u het volgende:

Een machine learning-model trainen.
Maak een pijplijnparameter.
Publiceer uw trainingspijplijn.
Uw model opnieuw trainen met nieuwe parameters.

Vereisten

Een Azure Machine Learning-werkruimte
Deel 1 van deze reeks procedures voltooien, gegevens transformeren in de ontwerpfunctie

Belangrijk

Als u grafische elementen die in dit document worden vermeld, zoals knoppen in Studio of Designer, niet ziet, hebt u mogelijk niet het juiste machtigingsniveau voor de werkruimte. Neem contact op met de beheerder van uw Azure-abonnement om te controleren of u het juiste toegangsniveau hebt gekregen. Zie Gebruikers en rollen beherenvoor meer informatie.

In dit artikel wordt ook ervan uitgegaan dat u enige kennis hebt van het bouwen van pijplijnen in de ontwerpfunctie. Voltooi de zelfstudie voor een begeleide inleiding.

Voorbeeldpijplijn

De pijplijn die in dit artikel wordt gebruikt, is een gewijzigde versie van een voorspelling voor het inkomen van een voorbeeldpijplijn op de startpagina van de ontwerpfunctie. De pijplijn maakt gebruik van het onderdeel Gegevens importeren in plaats van de voorbeeldgegevensset om u te laten zien hoe u modellen traint met uw eigen gegevens.

Screenshot that shows the modified sample pipeline with a box highlighting the Import Data component

Een pijplijnparameter maken

Pijplijnparameters worden gebruikt om veelzijdige pijplijnen te bouwen die later opnieuw kunnen worden ingediend met verschillende parameterwaarden. Sommige veelvoorkomende scenario's zijn het bijwerken van gegevenssets of sommige hyperparameters voor het opnieuw trainen. Maak pijplijnparameters voor het dynamisch instellen van variabelen tijdens runtime.

Pijplijnparameters kunnen worden toegevoegd aan gegevensbron- of onderdeelparameters in een pijplijn. Wanneer de pijplijn opnieuw wordt verzonden, kunnen de waarden van deze parameters worden opgegeven.

In dit voorbeeld wijzigt u het trainingsgegevenspad van een vaste waarde in een parameter, zodat u uw model opnieuw kunt trainen op verschillende gegevens. U kunt ook andere onderdeelparameters toevoegen als pijplijnparameters op basis van uw use-case.

Selecteer het onderdeel Gegevens importeren.

Notitie

In dit voorbeeld wordt het onderdeel Gegevens importeren gebruikt voor toegang tot gegevens in een geregistreerd gegevensarchief. U kunt echter vergelijkbare stappen volgen als u alternatieve patronen voor gegevenstoegang gebruikt.
Selecteer uw gegevensbron in het detailvenster van het onderdeel rechts van het canvas.
Voer het pad naar uw gegevens in. U kunt ook Bladeren selecteren om door de bestandsstructuur te bladeren.
Beweeg de muis over het padveld en selecteer het beletselteken boven het veld Pad dat wordt weergegeven.
Selecteer Toevoegen aan pijplijnparameter.
Geef een parameternaam en een standaardwaarde op.
Selecteer Opslaan.
Notitie

U kunt ook een onderdeelparameter loskoppelen van de pijplijnparameter in het detailvenster van het onderdeel, vergelijkbaar met het toevoegen van pijplijnparameters.

U kunt de pijplijnparameters controleren en bewerken door het tandwielpictogram Instellingen naast de titel van uw pijplijnconcept te selecteren.
- Na het loskoppelen kunt u de pijplijnparameter verwijderen in het deelvenster Setings .
- U kunt ook een pijplijnparameter toevoegen in het deelvenster Instellingen en deze vervolgens toepassen op een onderdeelparameter.
Verzend de pijplijntaak.

Een trainingspijplijn publiceren

Publiceer een pijplijn naar een pijplijneindpunt om uw pijplijnen in de toekomst eenvoudig opnieuw te gebruiken. Een pijplijneindpunt maakt een REST-eindpunt om de pijplijn in de toekomst aan te roepen. In dit voorbeeld kunt u met uw pijplijneindpunt uw pijplijn opnieuw gebruiken om een model opnieuw te trainen op verschillende gegevens.

Selecteer Publiceren boven het ontwerpcanvas.
Selecteer of maak een pijplijneindpunt.

Notitie

U kunt meerdere pijplijnen publiceren naar één eindpunt. Elke pijplijn in een bepaald eindpunt krijgt een versienummer, dat u kunt opgeven wanneer u het pijplijneindpunt aanroept.
Selecteer Publiceren.

Uw model opnieuw trainen

Nu u een gepubliceerde trainingspijplijn hebt, kunt u het gebruiken om uw model opnieuw te trainen op nieuwe gegevens. U kunt taken verzenden vanaf een pijplijneindpunt vanuit de studiowerkruimte of programmatisch.

Taken verzenden met behulp van de studioportal

Gebruik de volgende stappen om een geparameteriseerde pijplijneindpunttaak te verzenden vanuit de studioportal:

Ga naar de pagina Eindpunten in uw studio-werkruimte.
Selecteer het tabblad Pijplijneindpunten . Selecteer vervolgens uw pijplijneindpunt.
Selecteer het tabblad Gepubliceerde pijplijnen . Selecteer vervolgens de pijplijnversie die u wilt uitvoeren.
Selecteer Indienen.
In het dialoogvenster Setup kunt u de parameters voor de taak opgeven. In dit voorbeeld werkt u het gegevenspad bij om uw model te trainen met behulp van een niet-Amerikaanse gegevensset.

Screenshot that shows how to set up a parameterized pipeline job in the designer

Taken verzenden met behulp van code

U vindt het REST-eindpunt van een gepubliceerde pijplijn in het overzichtsvenster. Door het eindpunt aan te roepen, kunt u de gepubliceerde pijplijn opnieuw trainen.

Als u een REST-aanroep wilt maken, hebt u een OAuth 2.0 bearer-type verificatieheader nodig. Zie REST gebruiken voor het beheren van resources voor informatie over het instellen van verificatie voor uw werkruimte en het maken van een geparameteriseerde REST-aanroep.

Volgende stappen

In dit artikel hebt u geleerd hoe u een geparameteriseerd trainingspijplijneindpunt maakt met behulp van de ontwerpfunctie.

Voor een volledig overzicht van hoe u een model kunt implementeren om voorspellingen te doen, raadpleegt u de ontwerpfunctiezelfstudie voor het trainen en implementeren van een regressiemodel.

Zie Pijplijnen publiceren voor informatie over het publiceren en verzenden van een taak naar een pijplijneindpunt met behulp van de SDK v1.