AutoMLStep Klas
Hiermee maakt u een Azure ML-pijplijnstap die een geautomatiseerde ML-uitvoering omvat.
Zie het notebook https://aka.ms/pl-automlvoor een voorbeeld van het gebruik van AutoMLStep.
Initialiseer een AutoMLStep.
- Overname
-
AutoMLStep
Constructor
AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)
Parameters
Name | Description |
---|---|
name
Vereist
|
De naam van de stap. |
automl_config
Vereist
|
Een AutoMLConfig-object dat de configuratie voor deze AutoML-uitvoering definieert. |
inputs
|
Een lijst met invoerpoortbindingen. Default value: None
|
outputs
|
Een lijst met uitvoerpoortbindingen. Default value: None
|
script_repl_params
|
Optionele parameters die moeten worden vervangen in een script, bijvoorbeeld {'param1': 'value1', 'param2': 'value2'}. Default value: None
|
allow_reuse
|
Hiermee wordt aangegeven of de vorige resultaten opnieuw moeten worden gebruikt wanneer de stap opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld voor eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd. Default value: True
|
version
|
Een versie die aan de stap moet worden toegewezen. Default value: None
|
hash_paths
|
AFGEKEURD. Een lijst met paden naar hash bij het controleren op wijzigingen in de inhoud van de pijplijnstap. Standaard worden alle bestanden onder de Default value: None
|
enable_default_model_output
|
Hiermee wordt aangegeven of het beste model als standaarduitvoer wordt toegevoegd. Dit kan worden gebruikt om het beste model op te halen nadat de uitvoering is voltooid met behulp van de AutoMLStepRun klasse.
Opmerking: als de standaardmodeluitvoer niet vereist is, wordt aanbevolen om deze parameter in te stellen op Default value: True
|
enable_default_metrics_output
|
Hiermee wordt aangegeven of alle metrische gegevens voor onderliggende uitvoeringen als standaarduitvoer worden toegevoegd. Dit kan worden gebruikt om de metrische gegevens van de onderliggende uitvoering op te halen nadat de uitvoering is voltooid met behulp van de AutoMLStepRun klasse.
Opmerking: als de standaarduitvoer van metrische gegevens niet vereist is, is het raadzaam om deze parameter in te stellen op Default value: True
|
name
Vereist
|
De naam van de stap. |
automl_config
Vereist
|
Een AutoMLConfig die de configuratie voor deze AutoML-uitvoering definieert. |
inputs
Vereist
|
Een lijst met invoerpoortbindingen. |
outputs
Vereist
|
Een lijst met uitvoerpoortbindingen. |
script_repl_params
Vereist
|
Optionele parameters die moeten worden vervangen in een script, bijvoorbeeld {'param1': 'value1', 'param2': 'value2'}. |
script_repl_params
Vereist
|
Optionele parameters die moeten worden vervangen in een script. |
allow_reuse
Vereist
|
Hiermee wordt aangegeven of de vorige resultaten opnieuw moeten worden gebruikt wanneer de stap opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld voor eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd. |
version
Vereist
|
Een versie die aan de stap moet worden toegewezen. |
hash_paths
Vereist
|
AFGEKEURD. Een lijst met paden naar hash bij het controleren op wijzigingen in de inhoud van de pijplijnstap. Standaard worden alle bestanden onder de |
enable_default_model_output
Vereist
|
Hiermee wordt aangegeven of het beste model als standaarduitvoer wordt toegevoegd. Dit kan worden gebruikt om het beste model op te halen nadat de uitvoering is voltooid met behulp van de AutoMLStepRun klasse.
Opmerking: als de standaardmodeluitvoer niet vereist is, wordt aanbevolen om deze parameter in te stellen op |
enable_default_metrics_output
Vereist
|
Hiermee wordt aangegeven of alle metrische gegevens voor onderliggende uitvoeringen als standaarduitvoer worden toegevoegd. Dit kan worden gebruikt om de metrische gegevens van de onderliggende uitvoering op te halen nadat de uitvoering is voltooid met behulp van de AutoMLStepRun klasse.
Opmerking: als de standaarduitvoer van metrische gegevens niet vereist is, is het raadzaam om deze parameter in te stellen op |
Opmerkingen
Met de autoMLStep-klasse kunt u uw geautomatiseerde ML-werkstroom uitvoeren in een Azure Machine Learning-pijplijn. Pijplijnen bieden voordelen zoals herhaalbaarheid, uitvoeringen zonder toezicht, versiebeheer en tracering en modulariteit voor uw geautomatiseerde ML-werkstroom. Zie Wat zijn Azure Machine Learning-pijplijnen? voor meer informatie.
Wanneer uw geautomatiseerde ML-werkstroom zich in een pijplijn bevindt, kunt u plannen dat de pijplijn wordt uitgevoerd volgens een op tijd gebaseerd schema of volgens een schema op basis van wijzigingen. Planningen op basis van tijd zijn handig voor routinetaken zoals het bewaken van gegevensdrift, terwijl schema's op basis van wijzigingen nuttig zijn voor onregelmatige of onvoorspelbare wijzigingen, zoals wanneer gegevens worden gewijzigd. Uw planning kan bijvoorbeeld een blobarchief peilen waar de gegevens worden geüpload en de pijplijn opnieuw uitvoeren als de gegevens worden gewijzigd en vervolgens een nieuwe versie van het model registreren zodra de uitvoering is voltooid. Zie Machine Learning-pijplijnen plannen en Een uitvoering van een Machine Learning-pijplijn activeren vanuit een logische app voor meer informatie.
In het volgende voorbeeld ziet u hoe u een AutoMLStep maakt.
automl_step = AutoMLStep(
name='automl_module',
automl_config=automl_config,
outputs=[metrics_data, model_data],
allow_reuse=True)
Het volledige voorbeeld is beschikbaar via https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb
In het volgende voorbeeld ziet u hoe u het AutoMLStep-object gebruikt in een Pipeline.
from azureml.pipeline.core import Pipeline
pipeline = Pipeline(
description="pipeline_with_automlstep",
workspace=ws,
steps=[automl_step])
Het volledige voorbeeld is beschikbaar via https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb
In het bovenstaande voorbeeld ziet u één stap in de pijplijn. Wanneer u AutoMLStep echter gebruikt in een echte geautomatiseerde ML-werkstroom, hebt u ten minste één pijplijnstap die gegevensvoorbereiding uitvoert vóór de AutoMLStep en een andere pijplijnstap daarna wordt het model geregistreerd. Zie het notebook https://aka.ms/automl-retrain-pipelinevoor een voorbeeld van dit type werkstroom.
Gebruik de klasse om de AutoMLStepRun status te beheren, te controleren en uitvoeringsdetails van de pijplijnuitvoering op te halen.
Zie het artikel Wat is geautomatiseerde machine learning? voor meer informatie over geautomatiseerde machine learning in Azure. Zie het artikel Geautomatiseerd ML-experiment configureren in Python voor meer informatie over het instellen van een geautomatiseerd ML-experiment zonder het gebruik van een pijplijn.
Methoden
create_node |
Maak een knooppunt op basis van deze AutoML-stap en voeg toe aan de opgegeven grafiek. Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn wordt geïnstantieerd met deze stap, geeft Azure ML automatisch de vereiste parameters door via deze methode, zodat deze stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt. |
create_node
Maak een knooppunt op basis van deze AutoML-stap en voeg toe aan de opgegeven grafiek.
Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn wordt geïnstantieerd met deze stap, geeft Azure ML automatisch de vereiste parameters door via deze methode, zodat deze stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.
create_node(graph, default_datastore, context)
Parameters
Name | Description |
---|---|
graph
Vereist
|
Het grafiekobject waaraan u het knooppunt wilt toevoegen. |
default_datastore
Vereist
|
Het standaardgegevensarchief. |
context
Vereist
|
<xref:azureml.pipeline.core._GraphContext>
De grafiekcontext. |
Retouren
Type | Description |
---|---|
Het gemaakte knooppunt. |
Kenmerken
AUTOML_CONFIG_PARAM_NAME
AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'
DEFAULT_METRIC_PREFIX
DEFAULT_METRIC_PREFIX = 'default_metrics_'
DEFAULT_MODEL_PREFIX
DEFAULT_MODEL_PREFIX = 'default_model_'