Freigeben über


AutoMLStep Klasse

Erstellt einen Azure ML-Pipelineschritt, der eine automatisierte ML-Ausführung kapselt.

Ein Beispiel für die Verwendung von AutoMLStep finden Sie im Notebook https://aka.ms/pl-automl.

Initialisieren Sie autoMLStep.

Vererbung
AutoMLStep

Konstruktor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parameter

name
str
Erforderlich

Der Name des Schritts.

automl_config
AutoMLConfig
Erforderlich

Ein AutoMLConfig-Objekt, das die Konfiguration für diese AutoML-Ausführung definiert.

inputs
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
Standardwert: None

Eine Liste mit Eingabeportbindungen.

outputs
list[Union[PipelineData, OutputPortBinding]]
Standardwert: None

Eine Liste mit Ausgabeportbindungen.

script_repl_params
dict
Standardwert: None

Optionale Parameter, die in einem Skript ersetzt werden sollen. Beispiel: {'Parameter1': 'Wert1', 'Parameter2': 'Wert2'}.

allow_reuse
bool
Standardwert: True

Gibt an, ob bei dem Schritt vorherige Ergebnisse wiederverwendet werden sollen, wenn er mit den gleichen Einstellungen erneut ausgeführt wird.

Die Wiederverwendung ist standardmäßig aktiviert. Wenn der Schrittinhalt (Skripts/Abhängigkeiten) sowie die Eingaben und Parameter unverändert bleiben, wird die Ausgabe der vorherigen Ausführung dieses Schritts wiederverwendet. Wenn Sie den Schritt wiederverwenden, anstatt den Auftrag zum Berechnen zu übermitteln, werden die Ergebnisse der vorherigen Ausführung sofort für alle nachfolgenden Schritte verfügbar gemacht. Wenn Sie Azure Machine Learning-Datasets als Eingaben verwenden, hängt die Wiederverwendung nicht davon ab, ob sich die zugrunde liegenden Daten geändert haben, sondern davon, ob sich die Definition des Datasets geändert hat.

version
str
Standardwert: None

Eine Version, die dem Schritt zugewiesen werden soll.

hash_paths
list
Standardwert: None

VERALTET. Eine Liste der Pfade, die bei der Überprüfung auf Inhaltsänderungen bei Pipelineschritten gehasht werden soll.

Standardmäßig wird für alle Dateien unter dem path-Parameter in AutoMLConfig ein Hashwert verwendet – mit Ausnahme von Dateien, die in „.amlignore“ oder „.gitignore“ unter path aufgeführt sind. Wurden keine Änderungen erkannt, werden die Schrittinhalte einer vorherigen Ausführung wiederverwendet.

enable_default_model_output
bool
Standardwert: True

Gibt an, ob das beste Modell als Standardausgabe hinzugefügt werden soll. Kann verwendet werden, um nach Abschluss der Ausführung unter Verwendung der AutoMLStepRun-Klasse das beste Modell abzurufen. Hinweis: Wenn die Standardmodellausgabe nicht benötigt wird, empfiehlt es sich, diesen Parameter auf False festzulegen.

enable_default_metrics_output
bool
Standardwert: True

Gibt an, ob alle untergeordneten Ausführungsmetriken als Standardausgabe hinzugefügt werden sollen. Kann verwendet werden, um nach Abschluss der Ausführung unter Verwendung der AutoMLStepRun-Klasse die untergeordneten Ausführungsmetriken abzurufen. Hinweis: Wenn die Standardmetrikausgabe nicht benötigt wird, empfiehlt es sich, diesen Parameter auf False festzulegen.

name
str
Erforderlich

Der Name des Schritts.

automl_config
AutoMLConfig
Erforderlich

Eine AutoMLConfig,die die Konfiguration für diese AutoML-Ausführung definiert.

inputs
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
Erforderlich

Eine Liste mit Eingabeportbindungen.

outputs
list[Union[PipelineData, OutputPortBinding]]
Erforderlich

Eine Liste mit Ausgabeportbindungen.

script_repl_params
dict
Erforderlich

Optionale Parameter, die in einem Skript ersetzt werden sollen. Beispiel: {'Parameter1': 'Wert1', 'Parameter2': 'Wert2'}.

script_repl_params
Erforderlich

Optionale Parameter, die in einem Skript ersetzt werden sollen.

allow_reuse
bool
Erforderlich

Gibt an, ob bei dem Schritt vorherige Ergebnisse wiederverwendet werden sollen, wenn er mit den gleichen Einstellungen erneut ausgeführt wird.

Die Wiederverwendung ist standardmäßig aktiviert. Wenn der Schrittinhalt (Skripts/Abhängigkeiten) sowie die Eingaben und Parameter unverändert bleiben, wird die Ausgabe der vorherigen Ausführung dieses Schritts wiederverwendet. Wenn Sie den Schritt wiederverwenden, anstatt den Auftrag zum Berechnen zu übermitteln, werden die Ergebnisse der vorherigen Ausführung sofort für alle nachfolgenden Schritte verfügbar gemacht. Wenn Sie Azure Machine Learning-Datasets als Eingaben verwenden, hängt die Wiederverwendung nicht davon ab, ob sich die zugrunde liegenden Daten geändert haben, sondern davon, ob sich die Definition des Datasets geändert hat.

version
str
Erforderlich

Eine Version, die dem Schritt zugewiesen werden soll.

hash_paths
list
Erforderlich

VERALTET. Eine Liste der Pfade, die bei der Überprüfung auf Inhaltsänderungen bei Pipelineschritten gehasht werden soll.

Standardmäßig wird für alle Dateien unter dem path-Parameter in AutoMLConfig ein Hashwert verwendet – mit Ausnahme von Dateien, die in „.amlignore“ oder „.gitignore“ unter path aufgeführt sind. Wurden keine Änderungen erkannt, werden die Schrittinhalte einer vorherigen Ausführung wiederverwendet.

enable_default_model_output
bool
Erforderlich

Gibt an, ob das beste Modell als Standardausgabe hinzugefügt werden soll. Kann verwendet werden, um nach Abschluss der Ausführung unter Verwendung der AutoMLStepRun-Klasse das beste Modell abzurufen. Hinweis: Wenn die Standardmodellausgabe nicht benötigt wird, empfiehlt es sich, diesen Parameter auf False festzulegen.

enable_default_metrics_output
bool
Erforderlich

Gibt an, ob alle untergeordneten Ausführungsmetriken als Standardausgabe hinzugefügt werden sollen. Kann verwendet werden, um nach Abschluss der Ausführung unter Verwendung der AutoMLStepRun-Klasse die untergeordneten Ausführungsmetriken abzurufen. Hinweis: Wenn die Standardmetrikausgabe nicht benötigt wird, empfiehlt es sich, diesen Parameter auf False festzulegen.

Hinweise

Mit der AutoMLStep-Klasse können Sie Ihren automatisierten ML-Workflow in einer Azure Machine Learning-Pipeline ausführen. Pipelines bieten Vorteile wie Wiederholbarkeit, unbeaufsichtigte Ausführung, Versionsverwaltung und Nachverfolgung sowie Modularität für Ihren automatisierten ML-Workflow. Weitere Informationen finden Sie in der Beschreibung von Azure Machine Learning-Pipelines.

Wenn sich Ihr automatisierter ML-Workflow in einer Pipeline befindet, können Sie die Ausführung der Pipeline nach einem zeitbasierten oder nach einem änderungsbasierten Plan planen. Zeitbasierte Pläne eignen sich für Routineaufgaben wie das Überwachen von Datendrift. Änderungsbasierte Pläne eignen sich dagegen für unregelmäßige oder unvorhersehbare Änderungen (etwa, wenn sich Daten ändern). Ihr Plan kann beispielsweise einen Blobspeicher, in den die Daten hochgeladen werden, abfragen und die Pipeline erneut ausführen, wenn sich Daten ändern, sowie nach Abschluss der Ausführung eine neue Version des Modells registrieren. Weitere Informationen finden Sie unter Planen von Machine Learning-Pipeline sowie unter Auslösen von Machine Learning-Pipelines.

Im folgenden Beispiel wird eine AutoMLStep-Erstellung gezeigt:


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

Das vollständige Beispiel finden Sie unter https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb.

Im folgenden Beispiel wird die Verwendung des AutoMLStep-Objekts in einer Pipeline gezeigt:


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

Das vollständige Beispiel finden Sie unter https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb.

Das obige Beispiel zeigt einen einzelnen Schritt in der Pipeline. Wenn Sie AutoMLStep in einem echten automatisierten ML-Workflow verwenden, verfügen Sie jedoch über mindestens einen Pipelineschritt für die Datenaufbereitung vor AutoMLStep sowie über einen weiteren Pipelineschritt danach für die Modellregistrierung. Ein Beispiel für diesen Workflowtyp finden Sie im Notebook https://aka.ms/automl-retrain-pipeline.

Zum Verwalten, zum Überprüfen des Status und zum Abrufen von Ausführungsdetails aus der Pipelineausführung kann die AutoMLStepRun-Klasse verwendet werden.

Weitere Informationen zum automatisierten maschinellen Lernen in Azure finden Sie im Artikel Was ist automatisiertes maschinelles Lernen (AutoML)?. Weitere Informationen zum Einrichten eines automatisierten ML-Experiments ohne Pipeline finden Sie im Artikel Einrichten von AutoML-Training mit Python.

Methoden

create_node

Erstellen eines Knotens aus diesem AutoML-Schritt und Hinzufügen dieses Knotens zum angegebenen Graphen.

Diese Methode ist nicht für die direkte Nutzung vorgesehen. Wenn eine Pipeline mit diesem Schritt instanziiert wird, werden von Azure ML automatisch die für diese Methode erforderlichen Parameter übergeben, damit der Schritt einem Pipelinegraphen hinzugefügt werden kann, der den Workflow darstellt.

create_node

Erstellen eines Knotens aus diesem AutoML-Schritt und Hinzufügen dieses Knotens zum angegebenen Graphen.

Diese Methode ist nicht für die direkte Nutzung vorgesehen. Wenn eine Pipeline mit diesem Schritt instanziiert wird, werden von Azure ML automatisch die für diese Methode erforderlichen Parameter übergeben, damit der Schritt einem Pipelinegraphen hinzugefügt werden kann, der den Workflow darstellt.

create_node(graph, default_datastore, context)

Parameter

graph
Graph
Erforderlich

Das Graphobjekt, dem der Knoten hinzugefügt werden soll.

default_datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Erforderlich

Der Standarddatenspeicher.

context
<xref:azureml.pipeline.core._GraphContext>
Erforderlich

Der Graphkontext.

Gibt zurück

Der erstellte Knoten.

Rückgabetyp

Attribute

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'