Share via


AutoMLStep 클래스

자동화된 ML 실행을 캡슐화하는 Azure ML 파이프라인 단계를 만듭니다.

AutoMLStep 사용 예제는 Notebook https://aka.ms/pl-automl을 참조하세요.

AutoMLStep을 초기화합니다.

상속
AutoMLStep

생성자

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

매개 변수

name
str
필수

단계의 이름입니다.

automl_config
AutoMLConfig
필수

이 AutoML 실행에 대한 구성을 정의하는 AutoMLConfig 개체입니다.

inputs
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
기본값: None

입력 포트 바인딩 목록입니다.

outputs
list[Union[PipelineData, OutputPortBinding]]
기본값: None

출력 포트 바인딩 목록입니다.

script_repl_params
dict
기본값: None

스크립트에서 대체할 선택적 매개 변수(예: {‘param1’: ‘value1’, ‘param2’: ‘value2’})입니다.

allow_reuse
bool
기본값: True

동일한 설정으로 다시 실행할 때 단계에서 이전 결과를 재사용해야 하는지 여부를 나타냅니다.

기본적으로 재사용하도록 설정됩니다. 단계 내용(스크립트/종속성)과 입력 및 매개 변수가 변경되지 않은 상태로 유지되면 이 단계의 이전 실행 결과가 재사용됩니다. 단계를 재사용할 때, 컴퓨팅할 작업을 제출하는 대신 이전 실행의 결과를 후속 단계에 즉시 사용할 수 있습니다. Azure Machine Learning 데이터 세트를 입력으로 사용하는 경우 재사용은 기본 데이터가 변경되었는지 여부가 아니라 데이터 세트의 정의가 변경되었는지 여부에 따라 결정됩니다.

version
str
기본값: None

단계에 할당할 버전입니다.

hash_paths
list
기본값: None

사용되지 않습니다. 파이프라인 단계 내용의 변경 내용을 확인할 때 해시할 경로 목록입니다.

기본적으로 AutoMLConfigpath 매개 변수 아래에 있는 모든 파일은 path 아래의 .amlignore 또는 .gitignore에 나열된 파일을 제외하고 해시됩니다. 검색된 변경 내용이 없으면 파이프라인은 이전 실행의 단계 내용을 재사용합니다.

enable_default_model_output
bool
기본값: True

최상의 모델을 기본 출력으로 추가할지 여부를 나타냅니다. 이는 AutoMLStepRun 클래스를 사용하여 실행이 완료된 후 최상의 모델을 검색하는 데 사용할 수 있습니다. 기본 모델 출력이 필요하지 않은 경우 이 매개 변수를 False로 설정하는 것이 좋습니다.

enable_default_metrics_output
bool
기본값: True

모든 자식 실행 메트릭이 기본 출력으로 추가되는지 여부를 나타냅니다. 이는 AutoMLStepRun 클래스를 사용하여 실행이 완료된 후 자식 실행 메트릭을 검색하는 데 사용할 수 있습니다. 기본 메트릭 출력이 필요하지 않은 경우 이 매개 변수를 False로 설정하는 것이 좋습니다.

name
str
필수

단계의 이름입니다.

automl_config
AutoMLConfig
필수

이 AutoML 실행에 대한 구성을 정의하는 AutoMLConfig입니다.

inputs
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
필수

입력 포트 바인딩 목록입니다.

outputs
list[Union[PipelineData, OutputPortBinding]]
필수

출력 포트 바인딩 목록입니다.

script_repl_params
dict
필수

스크립트에서 대체할 선택적 매개 변수(예: {‘param1’: ‘value1’, ‘param2’: ‘value2’})입니다.

script_repl_params
필수

스크립트에서 바꿀 선택적 매개 변수입니다.

allow_reuse
bool
필수

동일한 설정으로 다시 실행할 때 단계에서 이전 결과를 재사용해야 하는지 여부를 나타냅니다.

기본적으로 재사용하도록 설정됩니다. 단계 내용(스크립트/종속성)과 입력 및 매개 변수가 변경되지 않은 상태로 유지되면 이 단계의 이전 실행 결과가 재사용됩니다. 단계를 재사용할 때, 컴퓨팅할 작업을 제출하는 대신 이전 실행의 결과를 후속 단계에 즉시 사용할 수 있습니다. Azure Machine Learning 데이터 세트를 입력으로 사용하는 경우 재사용은 기본 데이터가 변경되었는지 여부가 아니라 데이터 세트의 정의가 변경되었는지 여부에 따라 결정됩니다.

version
str
필수

단계에 할당할 버전입니다.

hash_paths
list
필수

사용되지 않습니다. 파이프라인 단계 내용의 변경 내용을 확인할 때 해시할 경로 목록입니다.

기본적으로 AutoMLConfigpath 매개 변수 아래에 있는 모든 파일은 path 아래의 .amlignore 또는 .gitignore에 나열된 파일을 제외하고 해시됩니다. 검색된 변경 내용이 없으면 파이프라인은 이전 실행의 단계 내용을 재사용합니다.

enable_default_model_output
bool
필수

최상의 모델을 기본 출력으로 추가할지 여부를 나타냅니다. 이는 AutoMLStepRun 클래스를 사용하여 실행이 완료된 후 최상의 모델을 검색하는 데 사용할 수 있습니다. 기본 모델 출력이 필요하지 않은 경우 이 매개 변수를 False로 설정하는 것이 좋습니다.

enable_default_metrics_output
bool
필수

모든 자식 실행 메트릭이 기본 출력으로 추가되는지 여부를 나타냅니다. 이는 AutoMLStepRun 클래스를 사용하여 실행이 완료된 후 자식 실행 메트릭을 검색하는 데 사용할 수 있습니다. 기본 메트릭 출력이 필요하지 않은 경우 이 매개 변수를 False로 설정하는 것이 좋습니다.

설명

AutoMLStep 클래스를 사용하면 Azure Machine Learning 파이프라인에서 자동화된 ML 워크플로를 실행할 수 있습니다. 파이프라인은 자동화된 ML 워크플로를 위한 반복성, 무인 실행, 버전 관리 및 추적, 모듈성과 같은 이점을 제공합니다. 자세한 내용은 Azure Machine Learning 파이프라인이란?을 참조하세요.

자동화된 ML 워크플로가 파이프라인에 있는 경우 시간 기반 일정 또는 변경 기반 일정에 따라 실행되도록 파이프라인을 예약할 수 있습니다. 시간 기반 일정은 데이터 드리프트 모니터링과 같은 일상적인 작업에 유용하고 변경 기반 일정은 데이터가 변경되는 경우와 같이 불규칙하거나 예측할 수 없는 변경에 유용합니다. 예를 들어 일정은 데이터가 업로드되는 Blob 저장소를 폴링한 다음, 데이터가 변경되면 파이프라인을 다시 실행한 다음, 실행이 완료되면 모델의 새 버전을 등록할 수 있습니다. 자세한 내용은 기계 학습 파이프라인 예약논리 앱에서 Machine Learning 파이프라인 실행 트리거를 참조하세요.

다음 예는 AutoMLStep을 만드는 방법을 보여 줍니다.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

전체 샘플은 https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb에서 사용할 수 있습니다.

다음 예는 Pipeline에서 AutoMLStep 개체를 사용하는 방법을 보여 줍니다.


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

전체 샘플은 https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb에서 사용할 수 있습니다.

위의 예는 파이프라인의 한 단계를 보여 줍니다. 그러나 실제 자동화된 ML 워크플로에서 AutoMLStep을 사용하는 경우 AutoMLStep 이전에 데이터 준비를 수행하는 파이프라인 단계가 하나 이상 있고 그 이후에 모델을 등록하는 또 다른 파이프라인 단계가 있습니다. 이러한 형식의 워크플로에 대한 예는 Notebook https://aka.ms/automl-retrain-pipeline을 참조하세요.

파이프라인 실행을 관리하고 상태를 확인하고 실행 세부 정보를 가져오려면 AutoMLStepRun 클래스를 사용합니다.

Azure의 자동화된 Machine Learning에 대한 자세한 내용은 자동화된 Machine Learning이란? 문서를 참조하세요. 파이프라인을 사용하지 않고 자동화된 ML 실험을 설정하는 방법에 대한 자세한 내용은 Python에서 자동화된 ML 실험 구성 문서를 참조하세요.

메서드

create_node

이 AutoML 단계에서 노드를 만들고 주어진 그래프에 추가합니다.

이 메서드는 직접 사용할 수 없습니다. 이 단계에서 파이프라인이 인스턴스화되면 Azure ML은 이 메서드를 통해 필요한 매개 변수를 자동으로 전달하므로 워크플로를 나타내는 파이프라인 그래프에 단계를 추가할 수 있습니다.

create_node

이 AutoML 단계에서 노드를 만들고 주어진 그래프에 추가합니다.

이 메서드는 직접 사용할 수 없습니다. 이 단계에서 파이프라인이 인스턴스화되면 Azure ML은 이 메서드를 통해 필요한 매개 변수를 자동으로 전달하므로 워크플로를 나타내는 파이프라인 그래프에 단계를 추가할 수 있습니다.

create_node(graph, default_datastore, context)

매개 변수

graph
Graph
필수

노드를 추가할 그래프 개체입니다.

default_datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
필수

기본 데이터 저장소입니다.

context
<xref:azureml.pipeline.core._GraphContext>
필수

그래프 컨텍스트입니다.

반환

만들어진 노드입니다.

반환 형식

특성

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'