AutoMLStep クラス

自動 ML 実行をカプセル化する Azure ML パイプラインステップを作成します。

AutoMLStep の使用例については、ノートブックの https://aka.ms/pl-automlを参照してください。

AutoMLStep を初期化します。

コンストラクター

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

パラメーター

名前	説明
name 必須	str ステップの名前。
automl_config 必須	AutoMLConfig この AutoML 実行の構成を定義する AutoMLConfig オブジェクト。
inputs	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] 入力ポートバインドの一覧。規定値: None
outputs	list[Union[PipelineData, OutputPortBinding]] 出力ポートバインドの一覧。規定値: None
script_repl_params	dict スクリプトで置き換える省略可能なパラメーター (例: {'param1': 'value1'、'param2': 'value2'})。規定値: None
allow_reuse	bool 同じ設定で再実行するときに、前の結果をステップで再利用するかどうかを示します。再利用は既定で有効になっています。ステップの内容 (スクリプト/依存関係) と入力とパラメーターが変更されていない場合は、この手順の前の実行からの出力が再利用されます。ステップを再利用すると、ジョブをコンピューティングに送信する代わりに、前の実行の結果が後続のステップですぐに使用できるようになります。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。規定値: True
version	str ステップに割り当てるバージョン。規定値: None
hash_paths	list 廃止。パイプラインステップの内容に対する変更を確認するときにハッシュするパスの一覧。既定では、`path` の AutoMLConfig パラメーターの下にあるすべてのファイルはハッシュされます。ただし、.amlignore または .gitignore にリストされているファイルは、`path`の下にあります。変更が検出されなかった場合、パイプラインは前回の実行のステップの内容を再利用します。規定値: None
enable_default_model_output	bool 最適なモデルを既定の出力として追加するかどうかを示します。これは、 AutoMLStepRun クラスを使用して実行が完了した後に最適なモデルを取得するために使用できます。既定のモデル出力が不要な場合は、このパラメーターを `False` に設定することをお勧めします。規定値: True
enable_default_metrics_output	bool すべての子実行メトリックを既定の出力として追加するかどうかを示します。これは、 AutoMLStepRun クラスを使用して実行が完了した後に子実行メトリックを取得するために使用できます。既定のメトリック出力が不要な場合は、このパラメーターを `False` に設定することをお勧めします。規定値: True
name 必須	str ステップの名前。
automl_config 必須	AutoMLConfig この AutoML 実行の構成を定義する AutoMLConfig。
inputs 必須	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] 入力ポートバインドの一覧。
outputs 必須	list[Union[PipelineData, OutputPortBinding]] 出力ポートバインドの一覧。
script_repl_params 必須	dict スクリプトで置き換える省略可能なパラメーター (例: {'param1': 'value1'、'param2': 'value2'})。
script_repl_params 必須	スクリプトで置き換える省略可能なパラメーター。
allow_reuse 必須	bool 同じ設定で再実行するときに、前の結果をステップで再利用するかどうかを示します。再利用は既定で有効になっています。ステップの内容 (スクリプト/依存関係) と入力とパラメーターが変更されていない場合は、この手順の前の実行からの出力が再利用されます。ステップを再利用すると、ジョブをコンピューティングに送信する代わりに、前の実行の結果が後続のステップですぐに使用できるようになります。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。
version 必須	str ステップに割り当てるバージョン。
hash_paths 必須	list 廃止。パイプラインステップの内容に対する変更を確認するときにハッシュするパスの一覧。既定では、`path` の AutoMLConfig パラメーターの下にあるすべてのファイルはハッシュされます。ただし、.amlignore または .gitignore にリストされているファイルは、`path`の下にあります。変更が検出されなかった場合、パイプラインは前回の実行のステップの内容を再利用します。
enable_default_model_output 必須	bool 最適なモデルを既定の出力として追加するかどうかを示します。これは、 AutoMLStepRun クラスを使用して実行が完了した後に最適なモデルを取得するために使用できます。既定のモデル出力が不要な場合は、このパラメーターを `False` に設定することをお勧めします。
enable_default_metrics_output 必須	bool すべての子実行メトリックを既定の出力として追加するかどうかを示します。これは、 AutoMLStepRun クラスを使用して実行が完了した後に子実行メトリックを取得するために使用できます。既定のメトリック出力が不要な場合は、このパラメーターを `False` に設定することをお勧めします。

注釈

AutoMLStep クラスを使用すると、Azure Machine Learning パイプラインで自動 ML ワークフローを実行できます。パイプラインには、自動化された ML ワークフローの再現性、無人実行、バージョン管理と追跡、モジュール性などの利点があります。詳細については、「 Azure Machine Learning パイプラインとは」を参照してください。

自動 ML ワークフローがパイプライン内にある場合は、時間ベースのスケジュールまたは変更ベースのスケジュールで実行するようにパイプラインをスケジュールできます。時間ベースのスケジュールは、データドリフトの監視などの日常的なタスクに役立ちますが、変更ベースのスケジュールは、データが変更された場合など、不規則または予測不可能な変更に役立ちます。たとえば、スケジュールでは、データがアップロードされている BLOB ストアをポーリングし、データが変更された場合はパイプラインをもう一度実行し、実行が完了したら新しいバージョンのモデルを登録します。詳細については、「機械学習パイプラインをスケジュールする」および「ロジックアプリから Machine Learning パイプラインの実行をトリガーする」を参照してください。

次の例は、AutoMLStep を作成する方法を示しています。


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

完全なサンプルは次から入手できます https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

次の例は、 Pipelineで AutoMLStep オブジェクトを使用する方法を示しています。


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

上記の例は、パイプラインの 1 つのステップを示しています。ただし、実際の自動 ML ワークフローで AutoMLStep を使用する場合は、AutoMLStep の前にデータ準備を実行するパイプラインステップが少なくとも 1 つ、モデルを登録した後に別のパイプラインステップが作成されます。この種類のワークフローの例については、ノートブックの https://aka.ms/automl-retrain-pipelineを参照してください。

パイプラインの実行を管理、状態の確認、および実行の詳細を取得するには、 AutoMLStepRun クラスを使用します。

Azure での自動機械学習の詳細については、自動機械学習の概要に関する記事を参照してください。パイプラインを使用せずに自動 ML 実験を設定する方法の詳細については、 Python での自動 ML 実験の構成に関する記事を参照してください。

メソッド

create_node

この AutoML ステップからノードを作成し、特定のグラフに追加します。

このメソッドは、直接使用するためのものではありません。この手順でパイプラインがインスタンス化されると、Azure ML は、このメソッドに必要なパラメーターを自動的に渡して、そのステップをワークフローを表すパイプライングラフに追加できるようにします。

create_node

この AutoML ステップからノードを作成し、特定のグラフに追加します。

create_node(graph, default_datastore, context)

パラメーター

名前	説明
graph 必須	Graph ノードを追加するグラフオブジェクト。
default_datastore 必須	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] 既定のデータストア。
context 必須	<xref:azureml.pipeline.core._GraphContext> グラフコンテキスト。

戻り値

型	説明
Node	作成されたノード。

属性

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'

次の方法で共有

AutoMLStep クラス

コンストラクター

パラメーター

注釈

メソッド

create_node

パラメーター

戻り値

属性

AUTOML_CONFIG_PARAM_NAME

DEFAULT_METRIC_PREFIX

DEFAULT_MODEL_PREFIX

フィードバック