Dela via


AutoMLStep Klass

Skapar ett Azure ML Pipeline-steg som kapslar in en automatiserad ML-körning.

Ett exempel på hur du använder AutoMLStep finns i notebook-filen https://aka.ms/pl-automl.

Initiera en AutoMLStep.

Arv
AutoMLStep

Konstruktor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parametrar

Name Description
name
Obligatorisk
str

Namnet på steget.

automl_config
Obligatorisk

Ett AutoMLConfig-objekt som definierar konfigurationen för den här AutoML-körningen.

inputs

En lista över indataportbindningar.

Standardvärde: None
outputs

En lista över portbindningar för utdata.

Standardvärde: None
script_repl_params

Valfria parametrar som ska ersättas i ett skript, till exempel {'param1': 'value1', 'param2': 'value2'}.

Standardvärde: None
allow_reuse

Anger om steget ska återanvända tidigare resultat när det körs igen med samma inställningar.

Återanvändning är aktiverat som standard. Om steginnehållet (skript/beroenden) samt indata och parametrar förblir oförändrade återanvänds utdata från föregående körning av det här steget. När du återanvänder steget, i stället för att skicka jobbet för beräkning, görs resultaten från den föregående körningen omedelbart tillgängliga för efterföljande steg. Om du använder Azure Machine Learning-datauppsättningar som indata bestäms återanvändningen av om datauppsättningens definition har ändrats, inte av om underliggande data har ändrats.

Standardvärde: True
version
str

En version som ska tilldelas till steget.

Standardvärde: None
hash_paths

DEPRECATED. En lista över sökvägar till hash när du söker efter ändringar i pipelinesteginnehållet.

Som standard hashas alla filer under parametern path i AutoMLConfig förutom filer som anges i .amlignore eller .gitignore under path. Om inga ändringar har identifierats återanvänder pipelinen steginnehållet från en tidigare körning.

Standardvärde: None
enable_default_model_output

Anger om den bästa modellen ska läggas till som standardutdata. Detta kan användas för att hämta den bästa modellen när körningen har slutförts med hjälp av AutoMLStepRun klassen . Observera att om standardmodellens utdata inte krävs rekommenderar vi att du anger den här parametern till False.

Standardvärde: True
enable_default_metrics_output

Anger om alla underordnade körningsmått ska läggas till som standardutdata. Detta kan användas för att hämta underordnade körningsmått när körningen har slutförts med hjälp av AutoMLStepRun klassen . Observera att om standardmåttutdata inte krävs rekommenderar vi att du anger den här parametern till False.

Standardvärde: True
name
Obligatorisk
str

Namnet på steget.

automl_config
Obligatorisk

En AutoMLConfig som definierar konfigurationen för den här AutoML-körningen.

inputs
Obligatorisk

En lista över indataportbindningar.

outputs
Obligatorisk

En lista över portbindningar för utdata.

script_repl_params
Obligatorisk

Valfria parametrar som ska ersättas i ett skript, till exempel {'param1': 'value1', 'param2': 'value2'}.

script_repl_params
Obligatorisk

Valfria parametrar som ska ersättas i ett skript.

allow_reuse
Obligatorisk

Anger om steget ska återanvända tidigare resultat när det körs igen med samma inställningar.

Återanvändning är aktiverat som standard. Om steginnehållet (skript/beroenden) samt indata och parametrar förblir oförändrade återanvänds utdata från föregående körning av det här steget. När du återanvänder steget, i stället för att skicka jobbet för beräkning, görs resultaten från den föregående körningen omedelbart tillgängliga för efterföljande steg. Om du använder Azure Machine Learning-datauppsättningar som indata bestäms återanvändningen av om datauppsättningens definition har ändrats, inte av om underliggande data har ändrats.

version
Obligatorisk
str

En version som ska tilldelas till steget.

hash_paths
Obligatorisk

DEPRECATED. En lista över sökvägar till hash när du söker efter ändringar i pipelinesteginnehållet.

Som standard hashas alla filer under parametern path i AutoMLConfig förutom filer som anges i .amlignore eller .gitignore under path. Om inga ändringar har identifierats återanvänder pipelinen steginnehållet från en tidigare körning.

enable_default_model_output
Obligatorisk

Anger om den bästa modellen ska läggas till som standardutdata. Detta kan användas för att hämta den bästa modellen när körningen har slutförts med hjälp av AutoMLStepRun klassen . Observera att om standardmodellens utdata inte krävs rekommenderar vi att du anger den här parametern till False.

enable_default_metrics_output
Obligatorisk

Anger om alla underordnade körningsmått ska läggas till som standardutdata. Detta kan användas för att hämta underordnade körningsmått när körningen har slutförts med hjälp av AutoMLStepRun klassen . Observera att om standardmåttutdata inte krävs rekommenderar vi att du anger den här parametern till False.

Kommentarer

Med klassen AutoMLStep kan du köra ditt automatiserade ML-arbetsflöde i en Azure Machine Learning-pipeline. Pipelines ger fördelar som repeterbarhet, obevakade körningar, versionshantering och spårning samt modularitet för ditt automatiserade ML-arbetsflöde. Mer information finns i Vad är Azure Machine Learning-pipelines?.

När ditt automatiserade ML-arbetsflöde är i en pipeline kan du schemalägga pipelinen så att den körs enligt ett tidsbaserat schema eller enligt ett ändringsbaserat schema. Tidsbaserade scheman är användbara för rutinaktiviteter som att övervaka dataavvikelse, medan ändringsbaserade scheman är användbara för oregelbundna eller oförutsägbara ändringar, till exempel när data ändras. Ditt schema kan till exempel avsöka ett bloblager där data laddas upp och sedan köra pipelinen igen om data ändras och sedan registrera en ny version av modellen när körningen är klar. Mer information finns i Schemalägga maskininlärningspipelines och Utlösa en körning av en Machine Learning-pipeline från en logikapp.

I följande exempel visas hur du skapar en AutoMLStep.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

Fullständigt exempel är tillgängligt från https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

I följande exempel visas hur du använder AutoMLStep-objektet i en Pipeline.


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

Fullständigt exempel är tillgängligt från https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

Exemplet ovan visar ett steg i pipelinen. Men när du använder AutoMLStep i ett verkligt automatiserat ML-arbetsflöde har du minst ett pipelinesteg som utför dataförberedelser före AutoMLStep, och ett annat pipelinesteg efter det registrerar modellen. Exempel på den här typen av arbetsflöde finns i notebook-filen https://aka.ms/automl-retrain-pipeline.

Om du vill hantera, kontrollera status och hämta körningsinformation från pipelinekörningen AutoMLStepRun använder du klassen .

Mer information om automatiserad maskininlärning i Azure finns i artikeln Vad är automatiserad maskininlärning?. Mer information om hur du konfigurerar ett automatiserat ML-experiment utan att använda en pipeline finns i artikeln Konfigurera automatiserat ML-experiment i Python.

Metoder

create_node

Skapa en nod från det här AutoML-steget och lägg till i den angivna grafen.

Den här metoden är inte avsedd att användas direkt. När en pipeline instansieras med det här steget skickar Azure ML automatiskt de parametrar som krävs via den här metoden så att steget kan läggas till i ett pipelinediagram som representerar arbetsflödet.

create_node

Skapa en nod från det här AutoML-steget och lägg till i den angivna grafen.

Den här metoden är inte avsedd att användas direkt. När en pipeline instansieras med det här steget skickar Azure ML automatiskt de parametrar som krävs via den här metoden så att steget kan läggas till i ett pipelinediagram som representerar arbetsflödet.

create_node(graph, default_datastore, context)

Parametrar

Name Description
graph
Obligatorisk

Grafobjektet som noden ska läggas till i.

default_datastore
Obligatorisk

Standarddatalagringen.

context
Obligatorisk
<xref:azureml.pipeline.core._GraphContext>

Grafkontexten.

Returer

Typ Description

Den skapade noden.

Attribut

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'