Delen via


AutoMLStep Klas

Hiermee maakt u een Azure ML-pijplijnstap die een geautomatiseerde ML-uitvoering omvat.

Zie het notebook https://aka.ms/pl-automlvoor een voorbeeld van het gebruik van AutoMLStep.

Initialiseer een AutoMLStep.

Overname
AutoMLStep

Constructor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parameters

Name Description
name
Vereist
str

De naam van de stap.

automl_config
Vereist

Een AutoMLConfig-object dat de configuratie voor deze AutoML-uitvoering definieert.

inputs

Een lijst met invoerpoortbindingen.

Default value: None
outputs

Een lijst met uitvoerpoortbindingen.

Default value: None
script_repl_params

Optionele parameters die moeten worden vervangen in een script, bijvoorbeeld {'param1': 'value1', 'param2': 'value2'}.

Default value: None
allow_reuse

Hiermee wordt aangegeven of de vorige resultaten opnieuw moeten worden gebruikt wanneer de stap opnieuw wordt uitgevoerd met dezelfde instellingen.

Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld voor eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd.

Default value: True
version
str

Een versie die aan de stap moet worden toegewezen.

Default value: None
hash_paths

AFGEKEURD. Een lijst met paden naar hash bij het controleren op wijzigingen in de inhoud van de pijplijnstap.

Standaard worden alle bestanden onder de path parameter in AutoMLConfig gehasht, behalve bestanden die worden vermeld in .amlignore of .gitignore onder path. Als er geen wijzigingen zijn gedetecteerd, wordt de inhoud van de stap uit een vorige uitvoering opnieuw gebruikt.

Default value: None
enable_default_model_output

Hiermee wordt aangegeven of het beste model als standaarduitvoer wordt toegevoegd. Dit kan worden gebruikt om het beste model op te halen nadat de uitvoering is voltooid met behulp van de AutoMLStepRun klasse. Opmerking: als de standaardmodeluitvoer niet vereist is, wordt aanbevolen om deze parameter in te stellen op False.

Default value: True
enable_default_metrics_output

Hiermee wordt aangegeven of alle metrische gegevens voor onderliggende uitvoeringen als standaarduitvoer worden toegevoegd. Dit kan worden gebruikt om de metrische gegevens van de onderliggende uitvoering op te halen nadat de uitvoering is voltooid met behulp van de AutoMLStepRun klasse. Opmerking: als de standaarduitvoer van metrische gegevens niet vereist is, is het raadzaam om deze parameter in te stellen op False.

Default value: True
name
Vereist
str

De naam van de stap.

automl_config
Vereist

Een AutoMLConfig die de configuratie voor deze AutoML-uitvoering definieert.

inputs
Vereist

Een lijst met invoerpoortbindingen.

outputs
Vereist

Een lijst met uitvoerpoortbindingen.

script_repl_params
Vereist

Optionele parameters die moeten worden vervangen in een script, bijvoorbeeld {'param1': 'value1', 'param2': 'value2'}.

script_repl_params
Vereist

Optionele parameters die moeten worden vervangen in een script.

allow_reuse
Vereist

Hiermee wordt aangegeven of de vorige resultaten opnieuw moeten worden gebruikt wanneer de stap opnieuw wordt uitgevoerd met dezelfde instellingen.

Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld voor eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd.

version
Vereist
str

Een versie die aan de stap moet worden toegewezen.

hash_paths
Vereist

AFGEKEURD. Een lijst met paden naar hash bij het controleren op wijzigingen in de inhoud van de pijplijnstap.

Standaard worden alle bestanden onder de path parameter in AutoMLConfig gehasht, behalve bestanden die worden vermeld in .amlignore of .gitignore onder path. Als er geen wijzigingen zijn gedetecteerd, wordt de inhoud van de stap uit een vorige uitvoering opnieuw gebruikt.

enable_default_model_output
Vereist

Hiermee wordt aangegeven of het beste model als standaarduitvoer wordt toegevoegd. Dit kan worden gebruikt om het beste model op te halen nadat de uitvoering is voltooid met behulp van de AutoMLStepRun klasse. Opmerking: als de standaardmodeluitvoer niet vereist is, wordt aanbevolen om deze parameter in te stellen op False.

enable_default_metrics_output
Vereist

Hiermee wordt aangegeven of alle metrische gegevens voor onderliggende uitvoeringen als standaarduitvoer worden toegevoegd. Dit kan worden gebruikt om de metrische gegevens van de onderliggende uitvoering op te halen nadat de uitvoering is voltooid met behulp van de AutoMLStepRun klasse. Opmerking: als de standaarduitvoer van metrische gegevens niet vereist is, is het raadzaam om deze parameter in te stellen op False.

Opmerkingen

Met de autoMLStep-klasse kunt u uw geautomatiseerde ML-werkstroom uitvoeren in een Azure Machine Learning-pijplijn. Pijplijnen bieden voordelen zoals herhaalbaarheid, uitvoeringen zonder toezicht, versiebeheer en tracering en modulariteit voor uw geautomatiseerde ML-werkstroom. Zie Wat zijn Azure Machine Learning-pijplijnen? voor meer informatie.

Wanneer uw geautomatiseerde ML-werkstroom zich in een pijplijn bevindt, kunt u plannen dat de pijplijn wordt uitgevoerd volgens een op tijd gebaseerd schema of volgens een schema op basis van wijzigingen. Planningen op basis van tijd zijn handig voor routinetaken zoals het bewaken van gegevensdrift, terwijl schema's op basis van wijzigingen nuttig zijn voor onregelmatige of onvoorspelbare wijzigingen, zoals wanneer gegevens worden gewijzigd. Uw planning kan bijvoorbeeld een blobarchief peilen waar de gegevens worden geüpload en de pijplijn opnieuw uitvoeren als de gegevens worden gewijzigd en vervolgens een nieuwe versie van het model registreren zodra de uitvoering is voltooid. Zie Machine Learning-pijplijnen plannen en Een uitvoering van een Machine Learning-pijplijn activeren vanuit een logische app voor meer informatie.

In het volgende voorbeeld ziet u hoe u een AutoMLStep maakt.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

Het volledige voorbeeld is beschikbaar via https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

In het volgende voorbeeld ziet u hoe u het AutoMLStep-object gebruikt in een Pipeline.


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

Het volledige voorbeeld is beschikbaar via https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

In het bovenstaande voorbeeld ziet u één stap in de pijplijn. Wanneer u AutoMLStep echter gebruikt in een echte geautomatiseerde ML-werkstroom, hebt u ten minste één pijplijnstap die gegevensvoorbereiding uitvoert vóór de AutoMLStep en een andere pijplijnstap daarna wordt het model geregistreerd. Zie het notebook https://aka.ms/automl-retrain-pipelinevoor een voorbeeld van dit type werkstroom.

Gebruik de klasse om de AutoMLStepRun status te beheren, te controleren en uitvoeringsdetails van de pijplijnuitvoering op te halen.

Zie het artikel Wat is geautomatiseerde machine learning? voor meer informatie over geautomatiseerde machine learning in Azure. Zie het artikel Geautomatiseerd ML-experiment configureren in Python voor meer informatie over het instellen van een geautomatiseerd ML-experiment zonder het gebruik van een pijplijn.

Methoden

create_node

Maak een knooppunt op basis van deze AutoML-stap en voeg toe aan de opgegeven grafiek.

Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn wordt geïnstantieerd met deze stap, geeft Azure ML automatisch de vereiste parameters door via deze methode, zodat deze stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.

create_node

Maak een knooppunt op basis van deze AutoML-stap en voeg toe aan de opgegeven grafiek.

Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn wordt geïnstantieerd met deze stap, geeft Azure ML automatisch de vereiste parameters door via deze methode, zodat deze stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.

create_node(graph, default_datastore, context)

Parameters

Name Description
graph
Vereist

Het grafiekobject waaraan u het knooppunt wilt toevoegen.

default_datastore
Vereist

Het standaardgegevensarchief.

context
Vereist
<xref:azureml.pipeline.core._GraphContext>

De grafiekcontext.

Retouren

Type Description

Het gemaakte knooppunt.

Kenmerken

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'