Delen via


Python-code uitvoeren in Azure Machine Learning Designer

In dit artikel leert u hoe u het onderdeel Python-script uitvoeren gebruikt om aangepaste logica toe te voegen aan de Azure Machine Learning-ontwerpfunctie. In deze procedure gebruikt u de Pandas-bibliotheek om eenvoudige functie-engineering uit te voeren.

U kunt de ingebouwde code-editor gebruiken om snel eenvoudige Python-logica toe te voegen. U moet de zip-bestandsmethode gebruiken om complexere code toe te voegen of om extra Python-bibliotheken te uploaden.

De standaarduitvoeringsomgeving maakt gebruik van de Anacondas-distributie van Python. Zie de referentiepagina voor python-scriptonderdelen uitvoeren voor een volledige lijst met vooraf geïnstalleerde pakketten.

Python-invoertoewijzing uitvoeren

Belangrijk

Als u grafische elementen die in dit document worden vermeld, zoals knoppen in Studio of Designer, niet ziet, hebt u mogelijk niet het juiste machtigingsniveau voor de werkruimte. Neem contact op met de beheerder van uw Azure-abonnement om te controleren of u het juiste toegangsniveau hebt gekregen. Zie Gebruikers en rollen beherenvoor meer informatie.

Python uitvoeren die is geschreven in de ontwerpfunctie

Het python-scriptonderdeel Uitvoeren toevoegen

  1. Zoek het python-scriptonderdeel Uitvoeren in het ontwerppalet. Deze vindt u in de sectie Python-taal .

  2. Sleep het onderdeel naar het pijplijncanvas en zet het neer.

Invoergegevenssets verbinden

In dit artikel wordt de voorbeeldgegevensset Automobile price data (Raw) gebruikt.

  1. Sleep uw gegevensset naar het pijplijncanvas en zet deze neer.

  2. Verbind de uitvoerpoort van de gegevensset met de invoerpoort linksboven van het python-scriptonderdeel Uitvoeren. De ontwerpfunctie maakt de invoer beschikbaar als een parameter voor het invoerpuntscript.

    De juiste invoerpoort is gereserveerd voor gezipte Python-bibliotheken.

    Verbinding maken met gegevenssets

  3. Noteer zorgvuldig de specifieke invoerpoort die u gebruikt. De ontwerpfunctie wijst de linkerinvoerpoort toe aan de variabele dataset1en de middelste invoerpoort aan dataset2.

Invoeronderdelen zijn optioneel, omdat u gegevens rechtstreeks in het onderdeel Python-script uitvoeren kunt genereren of importeren.

Uw Python-code schrijven

De ontwerpfunctie biedt een eerste invoerpuntscript dat u kunt bewerken en uw eigen Python-code kunt invoeren.

In dit voorbeeld gebruikt u Pandas om twee kolommen voor autogegevenssets ( Price en Horsepower ) te combineren om een nieuwe kolom te maken, Dollars per paardenkracht. Deze kolom geeft aan hoeveel u betaalt voor elke pk-eenheid, wat een nuttig informatiepunt kan worden om te bepalen of een specifieke auto een goede prijs is.

  1. Selecteer het onderdeel Python-script uitvoeren.

  2. Selecteer in het deelvenster dat rechts van het canvas wordt weergegeven het tekstvak voor het Python-script .

  3. Kopieer en plak de volgende code in het tekstvak:

    import pandas as pd
    
    def azureml_main(dataframe1 = None, dataframe2 = None):
        dataframe1['Dollar/HP'] = dataframe1.price / dataframe1.horsepower
        return dataframe1
    

    Uw pijplijn moet er als volgt uitzien:

    Python-pijplijn uitvoeren

    Het invoerpuntscript moet de functie azureml_mainbevatten. De functie heeft twee functieparameters die zijn toegewezen aan de twee invoerpoorten voor het onderdeel Python-script uitvoeren.

    De retourwaarde moet een Pandas Dataframe zijn. U kunt maximaal twee dataframes retourneren als onderdeeluitvoer.

  4. Verzend de pijplijn.

U hebt nu een gegevensset met een nieuwe functie Dollars/HP . Deze nieuwe functie kan helpen bij het trainen van een auto-aanbeveling. In dit voorbeeld ziet u functieextractie en dimensionaliteitsvermindering.

Volgende stappen

Meer informatie over het importeren van uw eigen gegevens in Azure Machine Learning Designer.