AutoMLStep Classe

Cria um passo do Pipeline do Azure ML que encapsula uma execução de ML automatizada.

Para obter um exemplo de utilização de AutoMLStep, consulte o bloco de notas https://aka.ms/pl-automl.

Inicializar um Passo Automático.

Herança
AutoMLStep

Construtor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parâmetros

name
str
Necessário

O nome do passo.

automl_config
AutoMLConfig
Necessário

Um objeto AutoMLConfig que define a configuração para esta execução de AutoML.

inputs
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
valor predefinido: None

Uma lista de enlaces de portas de entrada.

outputs
list[Union[PipelineData, OutputPortBinding]]
valor predefinido: None

Uma lista de enlaces de portas de saída.

script_repl_params
dict
valor predefinido: None

Parâmetros opcionais a substituir num script, por exemplo {'param1': 'value1', 'param2': 'value2'}.

allow_reuse
bool
valor predefinido: True

Indica se o passo deve reutilizar os resultados anteriores ao executar novamente com as mesmas definições.

A reutilização está ativada por predefinição. Se o conteúdo do passo (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, o resultado da execução anterior deste passo será reutilizado. Ao reutilizar o passo, em vez de submeter a tarefa para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer passos subsequentes. Se utilizar conjuntos de dados do Azure Machine Learning como entradas, a reutilização é determinada se a definição do conjunto de dados foi alterada e não se os dados subjacentes foram alterados.

version
str
valor predefinido: None

Uma versão a atribuir ao passo .

hash_paths
list
valor predefinido: None

PRETERIDO. Uma lista de caminhos para hash ao verificar se existem alterações nos conteúdos do passo de pipeline.

Por predefinição, todos os ficheiros no parâmetro path em AutoMLConfig são transformados em hash, exceto os ficheiros listados em .amlignore ou .gitignore em path. Se não forem detetadas alterações, o pipeline reutiliza os conteúdos dos passos de uma execução anterior.

enable_default_model_output
bool
valor predefinido: True

Indica se o melhor modelo será ou não adicionado como uma saída predefinida. Isto pode ser utilizado para obter o melhor modelo depois de a execução ter sido concluída com a AutoMLStepRun classe . Tenha em atenção que, se a saída do modelo predefinida não for necessária, recomenda-se que defina este parâmetro como False.

enable_default_metrics_output
bool
valor predefinido: True

Indica se todas as métricas de execução subordinadas serão adicionadas como saída predefinida. Isto pode ser utilizado para obter as métricas de execução subordinadas após a execução ser concluída com a AutoMLStepRun classe . Tenha em atenção que, se a saída de métricas predefinida não for necessária, recomenda-se que defina este parâmetro como False.

name
str
Necessário

O nome do passo.

automl_config
AutoMLConfig
Necessário

Uma AutoMLConfig que define a configuração para esta execução de AutoML.

inputs
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
Necessário

Uma lista de enlaces de portas de entrada.

outputs
list[Union[PipelineData, OutputPortBinding]]
Necessário

Uma lista de enlaces de portas de saída.

script_repl_params
dict
Necessário

Parâmetros opcionais a substituir num script, por exemplo {'param1': 'value1', 'param2': 'value2'}.

script_repl_params
Necessário

Parâmetros opcionais a substituir num script.

allow_reuse
bool
Necessário

Indica se o passo deve reutilizar os resultados anteriores ao executar novamente com as mesmas definições.

A reutilização está ativada por predefinição. Se o conteúdo do passo (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, o resultado da execução anterior deste passo será reutilizado. Ao reutilizar o passo, em vez de submeter a tarefa para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer passos subsequentes. Se utilizar conjuntos de dados do Azure Machine Learning como entradas, a reutilização é determinada se a definição do conjunto de dados foi alterada e não se os dados subjacentes foram alterados.

version
str
Necessário

Uma versão a atribuir ao passo .

hash_paths
list
Necessário

PRETERIDO. Uma lista de caminhos para hash ao verificar se existem alterações nos conteúdos do passo de pipeline.

Por predefinição, todos os ficheiros no parâmetro path em AutoMLConfig são transformados em hash, exceto os ficheiros listados em .amlignore ou .gitignore em path. Se não forem detetadas alterações, o pipeline reutiliza os conteúdos dos passos de uma execução anterior.

enable_default_model_output
bool
Necessário

Indica se o melhor modelo será ou não adicionado como uma saída predefinida. Isto pode ser utilizado para obter o melhor modelo depois de a execução ter sido concluída com a AutoMLStepRun classe . Tenha em atenção que, se a saída do modelo predefinida não for necessária, recomenda-se que defina este parâmetro como False.

enable_default_metrics_output
bool
Necessário

Indica se todas as métricas de execução subordinadas serão adicionadas como saída predefinida. Isto pode ser utilizado para obter as métricas de execução subordinadas após a execução ser concluída com a AutoMLStepRun classe . Tenha em atenção que, se a saída de métricas predefinida não for necessária, recomenda-se que defina este parâmetro como False.

Observações

Com a classe AutoMLStep, pode executar o fluxo de trabalho de ML automatizado num pipeline do Azure Machine Learning. Os pipelines proporcionam vantagens como repetibilidade, execuções autónomas, controlo e controlo de versões e modularidade para o fluxo de trabalho de ML automatizado. Para obter mais informações, veja O que são os pipelines do Azure Machine Learning?.

Quando o fluxo de trabalho de ML automatizado estiver num pipeline, pode agendar a execução do pipeline com base num agendamento baseado no tempo ou numa agenda baseada em alterações. As agendas baseadas no tempo são úteis para tarefas de rotina, como monitorizar o desfasamento de dados, enquanto as agendas baseadas em alterações são úteis para alterações irregulares ou imprevisíveis, como quando os dados são alterados. Por exemplo, a sua agenda pode consultar um arquivo de blobs onde os dados estão a ser carregados e, em seguida, executar o pipeline novamente se os dados forem alterados e, em seguida, registar a nova versão do modelo assim que a execução estiver concluída. Para obter mais informações, veja Agendar pipelines de machine learning e Acionar uma execução de um pipeline do Machine Learning a partir de uma Aplicação Lógica.

O exemplo seguinte mostra como criar um AutoMLStep.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

O exemplo completo está disponível a partir de https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

O exemplo seguinte mostra como utilizar o objeto AutoMLStep num Pipeline.


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

O exemplo completo está disponível a partir de https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

O exemplo acima mostra um passo no pipeline. No entanto, ao utilizar o AutoMLStep num fluxo de trabalho de ML automatizado no mundo real, terá pelo menos um passo de pipeline que executa a preparação de dados antes do AutoMLStep e outro passo de pipeline depois disso regista o modelo. Para obter um exemplo deste tipo de fluxo de trabalho, consulte o bloco de notas https://aka.ms/automl-retrain-pipeline.

Para gerir, verificar o estado e obter os detalhes da execução da execução do pipeline, utilize a AutoMLStepRun classe .

Para obter mais informações sobre machine learning automatizado no Azure, veja o artigo O que é o machine learning automatizado?. Para obter mais informações sobre como configurar uma experimentação de ML automatizada sem utilizar um pipeline, veja o artigo Configurar a experimentação de ML automatizado no Python.

Métodos

create_node

Crie um nó a partir deste passo de AutoML e adicione ao gráfico especificado.

Este método não se destina a ser utilizado diretamente. Quando um pipeline é instanciado com este passo, o Azure ML transmite automaticamente os parâmetros necessários através deste método para que esse passo possa ser adicionado a um gráfico de pipeline que representa o fluxo de trabalho.

create_node

Crie um nó a partir deste passo de AutoML e adicione ao gráfico especificado.

Este método não se destina a ser utilizado diretamente. Quando um pipeline é instanciado com este passo, o Azure ML transmite automaticamente os parâmetros necessários através deste método para que esse passo possa ser adicionado a um gráfico de pipeline que representa o fluxo de trabalho.

create_node(graph, default_datastore, context)

Parâmetros

graph
Graph
Necessário

O objeto de gráfico ao que adicionar o nó.

default_datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Necessário

O arquivo de dados predefinido.

context
<xref:azureml.pipeline.core._GraphContext>
Necessário

O contexto do gráfico.

Devoluções

O nó criado.

Tipo de retorno

Atributos

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'