Was ist der Azure Machine Learning-Designer (v1)?

Azure Machine Learning-Designer ist eine Drag & Drop-Schnittstelle, die zum Trainieren und Bereitstellen von Modellen in Azure Machine Learning verwendet wird. In diesem Artikel werden die Aufgaben beschrieben, die Sie im Designer ausführen können.

Hinweis

Der Designer unterstützt zwei Komponententypen: klassisch vorkonfigurierte Komponenten (v1) und benutzerdefinierten Komponenten (v2). Diese beiden Komponententypen sind NICHT kompatibel.

Klassische vorkonfigurierte Komponenten bieten vordefinierte Komponenten, die vor allem für die Datenverarbeitung und für herkömmliche Machine Learning-Aufgaben wie Regression und Klassifizierung genutzt werden. Dieser Komponententyp wird weiterhin unterstützt, aber es werden keine neuen Komponenten hinzugefügt.

Benutzerdefinierte Komponenten ermöglichen es Ihnen, Ihren eigenen Code als Komponente bereitzustellen. Sie unterstützen die arbeitsbereichübergreifende Freigabe und die reibungslose Erstellung über Studio-, CLI (v2)- und SDK (v2)-Schnittstellen.

Für neue Projekte wird dringend empfohlen, eine benutzerdefinierte Komponente zu verwenden, die mit AzureML V2 kompatibel ist und weiterhin neue Updates erhält.

Dieser Artikel gilt für klassische vordefinierte Komponenten und ist nicht mit CLI v2 und SDK v2 kompatibel.

GIF of a building a pipeline in the designer.

Der Designer verwendet Ihren Azure Machine Learning-Arbeitsbereich, um gemeinsame Ressourcen wie die folgenden zu organisieren:

Trainieren und Bereitstellen des Modells

Verwenden Sie eine visuelle Canvas, um einen End-to-End-Machine Learning-Workflow zu erstellen. Trainieren, Testen und Bereitstellen von Modellen im Designer:

  • Ziehen von Datenressourcen und Komponenten auf die Canvas
  • Verbinden Sie die Komponenten, um einen Pipelineentwurf zu erstellen.
  • Übermitteln einer Pipelineausführung mithilfe der Computeressourcen in Ihrem Azure Machine Learning-Arbeitsbereich
  • Konvertieren Ihrer Trainingspipelines in die Rückschlusspipelines
  • Veröffentlichen Ihrer Pipelines an einem REST-basierten Pipelineendpunkt, um eine neue Pipeline zu übermitteln, die mit anderen Parametern und Datenressourcen ausgeführt wird
    • Veröffentlichen einer Trainingspipeline, um beim Ändern von Parametern und Datenressourcen eine einzelnen Pipeline zum Trainieren mehrerer Modelle nochmal zu verwenden
    • Veröffentlichen einer Batchrückschlusspipeline, um Vorhersage zu neuen Daten zu treffen, indem ein zuvor trainiertes Modell verwendet wird
  • Bereitstellen einer Echtzeit-Rückschlusspipeline an einem Onlineendpunkt, um in Echtzeit Vorhersagen zu neuen Daten zu treffen.

Workflow diagram for training, batch inference, and real-time inference in the designer.

Pipeline

Eine Pipeline besteht aus Datenressourcen und analytischen Komponenten, die Sie miteinander verbinden. Pipelines haben viele Verwendungsmöglichkeiten: Sie können eine Pipeline erstellen, die ein einzelnes Modell trainiert, oder eine, die mehrere Modelle trainiert. Sie können eine Pipeline erstellen, die Vorhersagen in Echtzeit oder im Batch erstellt, oder eine, die nur Daten bereinigt. Mit Pipelines können Sie Ihre Arbeit wiederverwenden und Ihre Projekte organisieren.

Pipelineentwurf

Wenn Sie eine Pipeline im Designer bearbeiten, wird der Fortschritt als Pipelineentwurfgespeichert. Sie können einen Pipeline-Entwurf jederzeit bearbeiten, indem Sie Komponenten hinzufügen oder entfernen, Berechnungsziele konfigurieren, Parameter erstellen und so weiter.

Eine gültige Pipeline weist diese Merkmale auf:

  • Datenressourcen können nur mit Komponenten verbunden werden.
  • Komponenten können nur entweder mit Datenressourcen oder anderen Komponenten verbunden werden.
  • Alle Eingangsanschlüsse für Komponenten müssen in irgendeiner Weise mit dem Datenfluss verbunden sein.
  • Alle erforderlichen Parameter für jede Komponente müssen eingestellt werden.

Wenn Sie bereit sind, den Pipelineentwurf auszuführen, übermitteln Sie einen Pipelineauftrag.

Pipelineauftrag

Jedes Mal, wenn Sie eine Pipeline ausführen, werden die Konfiguration der Pipeline und ihre Ergebnisse in Ihrem Arbeitsbereich als Pipelineauftrag gespeichert. Sie können zu jedem Pipelineauftrag zurückkehren, um ihn zur Problembehandlung oder Überwachung zu überprüfen. Klonen Sie einen Pipelineauftrag, um einen neuen Pipelineentwurf zu erstellen, den Sie bearbeiten können.

Pipelineaufträge werden in Experimenten gruppiert, um den Auftragsverlauf zu organisieren. Sie können das Experiment für jeden Pipelineauftrag festlegen.

Daten

Eine Datenressource für maschinelles Lernen erleichtert Ihnen den Zugriff auf Ihre Daten und die Arbeit damit. Im Designer sind mehrere Beispieldatenressourcen enthalten, mit denen Sie experimentieren können. Sie können bei Bedarf weitere Datenressourcen registrieren.

Komponente

Eine Komponente ist ein Algorithmus, den Sie auf Ihre Daten anwenden können. Der Designer besteht aus mehreren Komponenten, die von Dateneingabefunktionen bis hin zu Trainings-, Scoring- und Validierungsprozessen reichen.

Eine Komponente kann über eine Reihe von Parametern verfügen, die Sie zur Konfiguration der internen Algorithmen der Komponente verwenden können. Wenn Sie eine Komponente auf der Arbeitsfläche auswählen, werden die Parameter der Komponente in der Eigenschaftsleiste rechts von der Arbeitsfläche angezeigt. Sie können die Parameter in diesem Bereich zur Abstimmung Ihres Modells verändern. Sie können die Kompute ressourcen für einzelne Komponenten im Designer festlegen.

Screenshot showing the component properties.

Hilfe bei der Navigation durch die Bibliothek der verfügbaren Algorithmen für maschinelles Lernen finden Sie unter Algorithmus- und Komponentenreferenzübersicht. Hilfe bei der Auswahl eines Algorithmus finden Sie unter Azure Machine Learning – Cheat Sheet für Algorithmen.

Computeressourcen

Verwenden Sie Computeressourcen aus Ihrem Arbeitsbereich, um Ihre Pipeline auszuführen und Ihre bereitgestellten Modelle als Onlineendpunkte oder Pipelineendpunkte (für Batchrückschlüsse) zu hosten. Die unterstützten Computeziele lauten:

Computeziel Training Bereitstellung
Azure Machine Learning Compute
Azure Kubernetes Service

Computeziele sind an Ihren Azure Machine Learning-Arbeitsbereich angefügt. Ihre Computeziele verwalten Sie in Ihrem Arbeitsbereich im Azure Machine Learning-Studio.

Bereitstellen

Zum Ausführen von Rückschlüssen in Echtzeit müssen Sie eine Pipeline als Onlineendpunkt bereitstellen. Der Onlineendpunkt erstellt eine Schnittstelle zwischen einer externen Anwendung und Ihrem Bewertungsmodell. Durch den Aufruf eines Onlineendpunkts werden Vorhersageergebnisse in Echtzeit an die Anwendung zurückgegeben. Für einen Aufruf eines Onlineendpunkts übergeben Sie den API-Schlüssel, der beim Bereitstellen des Endpunkts erstellt wurde. Der Endpunkt basiert auf REST, einer gängigen Architektur für Webprogrammierungsprojekte.

Onlineendpunkte müssen in einem Azure Kubernetes Service-Cluster bereitgestellt werden.

Informationen dazu, wie Sie Ihr Modell bereitstellen, finden Sie unter Tutorial: Bereitstellen eines Machine Learning-Modells mit dem Designer.

Veröffentlichen

Sie können eine Pipeline auch in einem Pipelineendpunkt veröffentlichen. Ähnlich wie bei einem Onlineendpunkt ermöglicht Ihnen ein Pipelineendpunkt das Übermitteln von neuen Pipelineaufträgen aus externen Anwendungen mithilfe von REST-Aufrufen. Es ist jedoch nicht möglich, Daten in Echtzeit mithilfe eines Pipelineendpunkts zu senden oder zu empfangen.

Veröffentlichte Pipelines sind flexibel und können zum Trainieren oder erneuten Trainieren von Modellen, zum Ausführen von Batchrückschlüssen, Verarbeiten neuer Daten und vieles mehr verwendet werden. Sie können mehrere Pipelines in einem einzigen Pipelineendpunkt veröffentlichen und angeben, welche Pipelineversion ausgeführt werden soll.

Eine veröffentlichte Pipeline wird auf den Rechenressourcen ausgeführt, die Sie im Pipeline-Entwurf für jede Komponente definieren.

Der Designer erstellt dasselbe PublishedPipeline-Objekt wie das SDK.

Nächste Schritte