Erstellen und Ausführen von Machine Learning-Pipelines mit Komponenten und Azure Machine Learning Studio

GILT FÜRAzure CLI ML-Erweiterung v2 (aktuell)

In diesem Artikel erfahren Sie, wie Sie Machine Learning-Pipelines mit Azure Machine Learning Studio und Komponenten erstellen und ausführen. Sie können Pipelines ohne Komponenten erstellen, aber Komponenten bieten eine höhere Flexibilität und bessere Möglichkeiten zur Wiederverwendung. Azure Machine Learning-Pipelines können in YAML definiert und über die Befehlszeilenschnittstelle (CLI) ausgeführt oder in Python geschrieben bzw. im Azure Machine Learning Studio Designer mit einer Benutzeroberfläche per Drag & Drop erstellt werden. Dieses Dokument konzentriert sich auf die Designer-Benutzeroberfläche von Azure Machine Learning Studio.

Voraussetzungen

Hinweis

Designer unterstützt zwei Arten von Komponenten, die klassischen vordefinierten Komponenten und die benutzerdefinierten Komponenten. Diese beiden Arten von Komponenten sind nicht kompatibel.

Klassische vordefinierte Komponenten bieten vordefinierte Komponenten vor allem für die Datenverarbeitung und traditionelle Machine Learning-Aufgaben wie Regression und Klassifizierung. Dieser Komponententyp wird weiterhin unterstützt, aber es werden keine neuen Komponenten hinzugefügt.

Benutzerdefinierte Komponenten ermöglichen es Ihnen, Ihren eigenen Code als Komponente bereitzustellen. Sie unterstützen die arbeitsbereichsübergreifende Freigabe und die reibungslose Erstellung über Studio-, CLI- und SDK-Schnittstellen.

Dieser Artikel bezieht sich auf benutzerdefinierte Komponenten.

Registrieren der Komponente in Ihrem Arbeitsbereich

Um eine Pipeline mit Komponenten der Benutzeroberfläche zu erstellen, müssen Sie zunächst Komponenten in Ihrem Arbeitsbereich registrieren. Sie können die Benutzeroberfläche, die CLI oder das SDK verwenden, um Komponenten in Ihrem Arbeitsbereich zu registrieren, sodass Sie die Komponente innerhalb des Arbeitsbereichs freigeben und wiederverwenden können. Registrierte Komponenten unterstützen die automatische Versionierung. Dadurch können Sie die Komponente aktualisieren und gleichzeitig sicherstellen, dass Pipelines, die eine ältere Version erfordern, weiterhin funktionieren.

Im folgenden Beispiel wird die Benutzeroberfläche verwendet, um Komponenten zu registrieren, und die Quelldateien der Komponente befinden sich im Verzeichnis cli/jobs/pipelines-with-components/basics/1b_e2e_registered_components des azureml-examples-Repositorys. Zunächst müssen Sie das Repository lokal klonen.

  1. Navigieren Sie in Ihrem Azure Machine Learning-Arbeitsbereich zur Seite Komponenten, und wählen Sie Neue Komponente aus.

Screenshot der Schaltfläche „Registrierungseintrag“ auf der Seite „Komponenten“

  1. In diesem Beispiel wird train.yml im Verzeichnis verwendet. Die YAML-Datei definiert Namen, Typ, Schnittstelle einschließlich Eingaben und Ausgaben, Code, Umgebung und Befehl dieser Komponente. Der Code dieser Komponente train.py befindet sich im Ordner ./train_src, in dem die Ausführungslogik dieser Komponente beschrieben wird. Weitere Informationen zum Komponentenschema finden Sie in der YAML-Schemareferenz der Befehlskomponente.

Hinweis

Beim Registrieren von Komponenten in der Benutzeroberfläche kann der in der YAML-Komponentendatei definierte code nur auf den aktuellen Ordner verweisen, in dem sich die YAML-Datei oder die Unterordner befinden. Dies bedeutet, dass Sie ../ nicht für code angeben können, da die Benutzeroberfläche das übergeordnete Verzeichnis nicht erkennen kann. additional_includes kann nur auf den aktuellen Ordner oder den Unterordner verweisen.

  1. Wählen Sie „Aus Ordner hochladen“ aus, und wählen Sie den Ordner 1b_e2e_registered_components aus, aus dem Sie etwas hochladen möchten. Wählen Sie train.yml in der Dropdownliste unten aus.

Screenshot: Hochladen aus lokalem Ordner

  1. Wählen Sie am unteren Rand Weiter aus. Daraufhin können Sie die Details dieser Komponente bestätigen. Nachdem Sie dies bestätigt haben, wählen Sie Erstellen aus, um den Registrierungsvorgang abzuschließen.

  2. Wiederholen Sie die obigen Schritte, um die Komponente „Score and Eval“ mithilfe von score.yml und eval.yml zu registrieren.

  3. Nachdem Sie die drei Komponenten erfolgreich registriert haben, werden sie in der Studio-Benutzeroberfläche angezeigt.

Screenshot: Registrierte Komponente auf Komponentenseite.

Erstellen einer Pipeline mit einer registrierten Komponente

  1. Erstellen Sie eine neue Pipeline im Designer.

    Screenshot: Erstellen einer neuen Pipeline auf Designer-Homepage.

  2. Legen Sie das Standardcomputeziel der Pipeline fest.

    Wählen Sie das ZahnradsymbolScreenshot des Zahnradsymbols, das sich auf der Benutzeroberfläche befindet. oben rechts auf der Canvas aus, um den Bereich Einstellungen zu öffnen. Wählen Sie das Standardcomputeziel für Ihre Pipeline aus.

    Screenshot: Einstellung von Standardcompute für die Pipeline.

    Wichtig

    Angefügte Computeressourcen werden nicht unterstützt. Verwenden Sie stattdessen Compute-Instanzen oder -cluster.

  3. In der Objektbibliothek finden Sie die Registerkarten Datenressourcen und Komponenten. Wechseln Sie zur Registerkarte Komponenten, auf der Sie die im vorherigen Abschnitt registrierten Komponenten sehen können.

    Screenshot; registrierte Komponente in Ressourcenbibliothek.

    Ziehen Sie die Komponenten, und legen Sie sie auf der Canvas ab. Standardmäßig wird die Standardversion der Komponente verwendet, und Sie können im rechten Bereich der Komponente zu einer bestimmten Version wechseln, wenn Ihre Komponente mehrere Versionen aufweist.

    Screenshot: sich ändernde Version von Komponente.

  4. Verbinden Sie die Ausgabeports der Upstreamkomponente mit den Eingabeports der Downstreamkomponente.

  5. Wählen Sie eine Komponente aus, und Sie erkennen einen rechten Bereich, in dem Sie die Komponente konfigurieren können.

    Bei Komponenten mit einfachen Eingaben wie Zahlen, ganzen Zahlen, Zeichenfolgen und booleschen Werten können Sie die Werte solcher Eingaben in der Detailansicht der Komponente ändern.

    Sie können auch die Ausgabeeinstellungen und das Computeziel, auf dem diese Komponente ausgeführt wird, im rechten Bereich ändern.

    Screenshot: Komponentenparametereinstellung

Hinweis

Derzeit registrierte Komponenten und die vom Designer integrierten Komponenten können nicht zusammen verwendet werden.

Übermitteln der Pipeline

  1. Wählen Sie „Übermitteln“ aus, und geben Sie die erforderlichen Informationen für Ihren Pipelineauftrag ein.

    Screenshot: Einrichtung von Pipelineauftrag mit hervorgehobener Schaltfläche „Senden“

  2. Nach der erfolgreichen Übermittlung wird ein Link zur Auftragsdetailseite auf der linken Seite angezeigt. Wählen Sie Auftragsdetails aus, um die Detailseite des Pipelineauftrags zur Überprüfung des Status und zum Debuggen aufzurufen.

    Screenshot: die gesendete Auftragsliste.

    Hinweis

    Die Liste Übermittelte Aufträge enthält nur Pipelineaufträge, die während einer aktiven Sitzung übermittelt wurden. Wenn Sie die Seite neu laden, wird der Inhalt gelöscht.

Nächste Schritte