Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Wichtig
Dieser Artikel enthält Informationen zur Verwendung des Azure Machine Learning SDK v1. Das SDK v1 wird ab dem 31. März 2025 nicht mehr unterstützt und endet am 30. Juni 2026. Sie können das SDK v1 bis zu diesem Datum installieren und verwenden.
Es wird empfohlen, vor dem 30. Juni 2026 zum SDK v2 zu wechseln. Weitere Informationen zum SDK v2 finden Sie unter What is the Azure Machine Learning Python SDK v2 and the SDK v2 reference.
In diesem Artikel wird erläutert, wie Sie die Execute Python Script-Komponente verwenden, um dem Azure Machine Learning-Designer benutzerdefinierte Logik hinzuzufügen. In diesem Leitfaden verwenden Sie die Pandas-Bibliothek, um einfache Features zu entwickeln.
Sie können den integrierten Code-Editor verwenden, um schnell einfache Python-Logik hinzuzufügen. Sie sollten die ZIP-Dateimethode verwenden, um komplexeren Code hinzuzufügen oder weitere Python-Bibliotheken hochzuladen.
Die standardmäßige Ausführungsumgebung verwendet die Anacondas-Distribution von Python. Eine vollständige Liste der vorinstallierten Pakete finden Sie in der Referenz zur Execute Python Script-Komponente .
Wichtig
Falls die in diesem Dokument erwähnten grafischen Elemente bei Ihnen nicht angezeigt werden, z. B. Schaltflächen in Studio oder im Designer, verfügen Sie unter Umständen nicht über die richtige Berechtigungsebene für den Arbeitsbereich. Wenden Sie sich an Ihren Azure-Abonnementadministrator, um sich zu vergewissern, dass Ihnen die richtige Zugriffsebene gewährt wurde. Weitere Informationen finden Sie unter Verwalten von Benutzern und Rollen.
Ausführen von Python-Code im Designer
Hinzufügen der „Execute Python Script“-Komponente
Melden Sie sich beim Azure Machine Learning Studio an, und wählen Sie den Arbeitsbereich aus, den Sie verwenden möchten.
Wählen Sie im Randleistenmenü "Designer" aus. Wählen Sie unter "Classic prebuilt" die Option "Neue Pipeline erstellen" mit klassischen vordefinierten Komponenten aus.
Wählen Sie links neben dem Pipeline-Zeichenbereich „Komponente"aus.
Suchen Sie im Abschnitt "Python Language " die Execute Python Script-Komponente . Ziehen Sie die Komponente per Drag & Drop auf den Pipelinecanvas.
Verbinden von Eingabedatasets
Suchen Sie im Abschnitt "Beispieldaten" das Beispieldatenset "Automobilpreisdaten(Raw)". Ziehen Sie den Dataset per Drag & Drop auf die Pipelinecanvas.
Verbinden Sie den Ausgabeport des Datasets mit dem oben links befindlichen Eingabeport der Execute Python Script-Komponente. Der Designer stellt die Eingabe dem Einstiegspunktskript als Parameter zur Verfügung.
Der rechte Eingabeport ist für gezippte Python-Bibliotheken reserviert.
Notieren Sie sich sorgfältig den Eingangsport, den Sie verwenden. Der Designer weist den linken Eingangsport der Variablen
dataset1
und den mittleren Eingangsport der Variablendataset2
zu.
Eingabekomponenten sind optional, da Sie Daten direkt in der Execute Python Script-Komponente generieren oder importieren können.
Schreiben Sie Ihren Python-Code
Der Designer stellt Ihnen ein erstes Einstiegspunktskript zur Verfügung, mit dem Sie Ihren eigenen Python-Code bearbeiten und eingeben können.
In diesem Beispiel verwenden Sie Pandas, um zwei Spalten des Automobile-Datensatzes, Price und Horsepower, zu kombinieren, um eine neue Spalte namens Dollars pro Pferdestärke zu erstellen. Diese Spalte gibt den Preis pro PS an. Diese Information kann praktisch sein, um das Preis-Leistungs-Verhältnis des Fahrzeugs zu bewerten.
Doppelklicken Sie auf die Execute Python Script-Komponente .
Wählen Sie im Bereich rechts neben der Canvas das Textfeld Python-Skript aus.
Kopieren Sie den folgenden Code, und fügen Sie ihn in das Textfeld ein:
import pandas as pd def azureml_main(dataframe1 = None, dataframe2 = None): dataframe1['Dollar/HP'] = dataframe1.price / dataframe1.horsepower return dataframe1
Ihre Pipeline sollte wie dieses Bild aussehen:
Das Einstiegspunktskript muss die Funktion
azureml_main
enthalten. Die Funktion hat zwei Funktionsparameter, die den beiden Eingangsports für die Execute Python Script-Komponente zugeordnet sind.Der Rückgabewert muss ein Pandas-Dataframe sein. Sie können maximal zwei Datenrahmen als Komponentenausgaben zurückgeben.
Übermitteln Sie die Pipeline.
Jetzt verfügen Sie über ein Dataset, das über ein neues Dollar/PS-Feature verfügt. Dieses neue Feature kann helfen, ein Autoempfehlungsmodul zu trainieren. Dies ist ein Beispiel für die Featureextraktion und Verringerung der Dimensionalität.