AutoMLStep Classe

Referência

Cria um passo do Pipeline do Azure ML que encapsula uma execução de ML automatizada.

Para obter um exemplo de utilização de AutoMLStep, consulte o bloco de notas https://aka.ms/pl-automl.

Inicializar um Passo Automático.

Herança: PipelineStep

AutoMLStep

Construtor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parâmetros

name: str

Necessário

O nome do passo.

automl_config: AutoMLConfig

Necessário

Um objeto AutoMLConfig que define a configuração para esta execução de AutoML.

inputs: list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]

valor predefinido: None

Uma lista de enlaces de portas de entrada.

outputs: list[Union[PipelineData, OutputPortBinding]]

valor predefinido: None

Uma lista de enlaces de portas de saída.

script_repl_params: dict

valor predefinido: None

Parâmetros opcionais a substituir num script, por exemplo {'param1': 'value1', 'param2': 'value2'}.

allow_reuse: bool

valor predefinido: True

Indica se o passo deve reutilizar os resultados anteriores ao executar novamente com as mesmas definições.

A reutilização está ativada por predefinição. Se o conteúdo do passo (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, o resultado da execução anterior deste passo será reutilizado. Ao reutilizar o passo, em vez de submeter a tarefa para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer passos subsequentes. Se utilizar conjuntos de dados do Azure Machine Learning como entradas, a reutilização é determinada se a definição do conjunto de dados foi alterada e não se os dados subjacentes foram alterados.

version: str

valor predefinido: None

Uma versão a atribuir ao passo .

hash_paths: list

valor predefinido: None

PRETERIDO. Uma lista de caminhos para hash ao verificar se existem alterações nos conteúdos do passo de pipeline.

Por predefinição, todos os ficheiros no parâmetro path em AutoMLConfig são transformados em hash, exceto os ficheiros listados em .amlignore ou .gitignore em path. Se não forem detetadas alterações, o pipeline reutiliza os conteúdos dos passos de uma execução anterior.

enable_default_model_output: bool

valor predefinido: True

Indica se o melhor modelo será ou não adicionado como uma saída predefinida. Isto pode ser utilizado para obter o melhor modelo depois de a execução ter sido concluída com a AutoMLStepRun classe . Tenha em atenção que, se a saída do modelo predefinida não for necessária, recomenda-se que defina este parâmetro como False.

enable_default_metrics_output: bool

valor predefinido: True

Indica se todas as métricas de execução subordinadas serão adicionadas como saída predefinida. Isto pode ser utilizado para obter as métricas de execução subordinadas após a execução ser concluída com a AutoMLStepRun classe . Tenha em atenção que, se a saída de métricas predefinida não for necessária, recomenda-se que defina este parâmetro como False.

name: str

Necessário

O nome do passo.

automl_config: AutoMLConfig

Necessário

Uma AutoMLConfig que define a configuração para esta execução de AutoML.

inputs: list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]

Necessário

Uma lista de enlaces de portas de entrada.

outputs: list[Union[PipelineData, OutputPortBinding]]

Necessário

Uma lista de enlaces de portas de saída.

script_repl_params: dict

Necessário

Parâmetros opcionais a substituir num script, por exemplo {'param1': 'value1', 'param2': 'value2'}.

script_repl_params

Necessário

Parâmetros opcionais a substituir num script.

allow_reuse: bool

Necessário

Indica se o passo deve reutilizar os resultados anteriores ao executar novamente com as mesmas definições.

version: str

Necessário

Uma versão a atribuir ao passo .

hash_paths: list

Necessário

PRETERIDO. Uma lista de caminhos para hash ao verificar se existem alterações nos conteúdos do passo de pipeline.

enable_default_model_output: bool

Necessário

enable_default_metrics_output: bool

Necessário

Observações

Com a classe AutoMLStep, pode executar o fluxo de trabalho de ML automatizado num pipeline do Azure Machine Learning. Os pipelines proporcionam vantagens como repetibilidade, execuções autónomas, controlo e controlo de versões e modularidade para o fluxo de trabalho de ML automatizado. Para obter mais informações, veja O que são os pipelines do Azure Machine Learning?.

Quando o fluxo de trabalho de ML automatizado estiver num pipeline, pode agendar a execução do pipeline com base num agendamento baseado no tempo ou numa agenda baseada em alterações. As agendas baseadas no tempo são úteis para tarefas de rotina, como monitorizar o desfasamento de dados, enquanto as agendas baseadas em alterações são úteis para alterações irregulares ou imprevisíveis, como quando os dados são alterados. Por exemplo, a sua agenda pode consultar um arquivo de blobs onde os dados estão a ser carregados e, em seguida, executar o pipeline novamente se os dados forem alterados e, em seguida, registar a nova versão do modelo assim que a execução estiver concluída. Para obter mais informações, veja Agendar pipelines de machine learning e Acionar uma execução de um pipeline do Machine Learning a partir de uma Aplicação Lógica.

O exemplo seguinte mostra como criar um AutoMLStep.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

O exemplo completo está disponível a partir de https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

O exemplo seguinte mostra como utilizar o objeto AutoMLStep num Pipeline.


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

O exemplo acima mostra um passo no pipeline. No entanto, ao utilizar o AutoMLStep num fluxo de trabalho de ML automatizado no mundo real, terá pelo menos um passo de pipeline que executa a preparação de dados antes do AutoMLStep e outro passo de pipeline depois disso regista o modelo. Para obter um exemplo deste tipo de fluxo de trabalho, consulte o bloco de notas https://aka.ms/automl-retrain-pipeline.

Para gerir, verificar o estado e obter os detalhes da execução da execução do pipeline, utilize a AutoMLStepRun classe .

Para obter mais informações sobre machine learning automatizado no Azure, veja o artigo O que é o machine learning automatizado?. Para obter mais informações sobre como configurar uma experimentação de ML automatizada sem utilizar um pipeline, veja o artigo Configurar a experimentação de ML automatizado no Python.

Métodos

create_node

Crie um nó a partir deste passo de AutoML e adicione ao gráfico especificado.

Este método não se destina a ser utilizado diretamente. Quando um pipeline é instanciado com este passo, o Azure ML transmite automaticamente os parâmetros necessários através deste método para que esse passo possa ser adicionado a um gráfico de pipeline que representa o fluxo de trabalho.

create_node

Crie um nó a partir deste passo de AutoML e adicione ao gráfico especificado.

create_node(graph, default_datastore, context)

Parâmetros

graph: Graph

Necessário

O objeto de gráfico ao que adicionar o nó.

default_datastore: Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]

Necessário

O arquivo de dados predefinido.

context: <xref:azureml.pipeline.core._GraphContext>

Necessário

O contexto do gráfico.

Devoluções

O nó criado.

Tipo de retorno

Node

Atributos

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'

AutoMLStep Classe

Construtor

Parâmetros

Observações

Métodos

create_node

Parâmetros

Devoluções

Tipo de retorno

Atributos

AUTOML_CONFIG_PARAM_NAME

DEFAULT_METRIC_PREFIX

DEFAULT_MODEL_PREFIX

Comentários

Comentários

Recursos adicionais