AzureBatchStep クラス

Azure Batch にジョブを送信するための Azure ML パイプラインステップを作成します。

注: この手順では、ディレクトリとその内容のアップロード/ダウンロードはサポートされていません。

AzureBatchStep の使用例については、ノートブックの https://aka.ms/pl-azbatchを参照してください。

Azure Batch にジョブを送信するための Azure ML パイプラインステップを作成します。

コンストラクター

AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)

パラメーター

名前	説明
name 必須	str [必須]ステップの名前。
create_pool	bool ジョブを実行する前にプールを作成するかどうかを示します。規定値: False
pool_id	str [必須]ジョブが実行されるプールの ID。 ID には、既存のプール、またはジョブの送信時に作成されるプールを指定できます。規定値: None
delete_batch_job_after_finish	bool 完了した後に Batch アカウントからジョブを削除するかどうかを示します。規定値: True
delete_batch_pool_after_finish	bool ジョブの完了後にプールを削除するかどうかを示します。規定値: False
is_positive_exit_code_failure	bool タスクが正のコードで存在する場合にジョブが失敗するかどうかを示します。規定値: True
vm_image_urn	str `create_pool`が True の場合、VM は VirtualMachineConfiguration を使用します。値の形式: `urn:publisher:offer:sku`。例: `urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter`。規定値: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
run_task_as_admin	bool タスクを管理者特権で実行するかどうかを示します。規定値: False
target_compute_nodes	int `create_pool`が True の場合は、プールに追加されるコンピューティングノードの数を示します。規定値: 1
vm_size	str `create_pool`が True の場合は、コンピューティングノードの仮想マシンのサイズを示します。規定値: standard_d1_v2
source_directory	str モジュールバイナリ、実行可能ファイル、アセンブリなどを含むローカルフォルダー。規定値: None
executable	str [必須]ジョブの一部として実行されるコマンド/実行可能ファイルの名前。規定値: None
arguments	str コマンド/実行可能ファイルの引数。規定値: None
inputs	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] 入力ポートバインドの一覧。ジョブを実行する前に、入力ごとにフォルダーが作成されます。各入力のファイルは、ストレージからコンピューティングノード上のそれぞれのフォルダーにコピーされます。たとえば、入力名が input1 で、ストレージの相対パスが一部/相対/パス/その/できる/実際に/長い/inputfile.txtである場合、コンピューティング上のファイルパスは ./input1/inputfile.txtになります。入力名が 32 文字を超えると、切り捨てられ、一意のサフィックスが付加されるため、コンピューティング先でフォルダー名を正常に作成できます。規定値: None
outputs	list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]] 出力ポートバインドの一覧。入力と同様に、ジョブを実行する前に、出力ごとにフォルダーが作成されます。フォルダー名は出力名と同じになります。ジョブがそのフォルダーに出力を配置することを前提とします。規定値: None
allow_reuse	bool 同じ設定で再実行するときに、前の結果をステップで再利用するかどうかを示します。再利用は既定で有効になっています。ステップの内容 (スクリプト/依存関係) と入力とパラメーターが変更されていない場合は、この手順の前の実行からの出力が再利用されます。ステップを再利用すると、ジョブをコンピューティングに送信する代わりに、前の実行の結果が後続のステップですぐに使用できるようになります。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。規定値: True
compute_target	BatchCompute, str [必須]ジョブが実行される BatchCompute コンピューティング。規定値: None
version	str モジュールの機能の変更を示すオプションのバージョンタグ。規定値: None
name 必須	str [必須]ステップの名前。
create_pool 必須	bool ジョブを実行する前にプールを作成するかどうかを示します。
pool_id 必須	str [必須]ジョブが実行されるプールの ID。 ID には、既存のプール、またはジョブの送信時に作成されるプールを指定できます。
delete_batch_job_after_finish 必須	bool 完了した後に Batch アカウントからジョブを削除するかどうかを示します。
delete_batch_pool_after_finish 必須	bool ジョブの完了後にプールを削除するかどうかを示します。
is_positive_exit_code_failure 必須	bool タスクが正のコードで存在する場合にジョブが失敗するかどうかを示します。
vm_image_urn 必須	str `create_pool`が True の場合、VM は VirtualMachineConfiguration を使用します。値の形式: `urn:publisher:offer:sku`。例: `urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter`。
run_task_as_admin 必須	bool タスクを管理者特権で実行するかどうかを示します。
target_compute_nodes 必須	int `create_pool`が True の場合は、プールに追加されるコンピューティングノードの数を示します。
vm_size 必須	str `create_pool`が True の場合は、コンピューティングノードの仮想マシンのサイズを示します。
source_directory 必須	str モジュールバイナリ、実行可能ファイル、アセンブリなどを含むローカルフォルダー。
executable 必須	str [必須]ジョブの一部として実行されるコマンド/実行可能ファイルの名前。
arguments 必須	list コマンド/実行可能ファイルの引数。
inputs 必須	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] 入力ポートバインドの一覧。ジョブを実行する前に、入力ごとにフォルダーが作成されます。各入力のファイルは、ストレージからコンピューティングノード上のそれぞれのフォルダーにコピーされます。たとえば、入力名が input1 で、ストレージの相対パスが一部/相対/パス/その/できる/実際に/長い/inputfile.txtである場合、コンピューティング上のファイルパスは ./input1/inputfile.txtになります。入力名が 32 文字を超える場合は、切り捨てられ、一意のサフィックスが付加されるため、コンピューティングでフォルダー名が正常に作成される可能性があります。
outputs 必須	list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]] 出力ポートバインドの一覧。入力と同様に、ジョブを実行する前に、出力ごとにフォルダーが作成されます。フォルダー名は出力名と同じになります。ジョブがそのフォルダーに出力されることを前提とします。
allow_reuse 必須	bool 同じ設定で再実行するときに、前の結果をステップで再利用するかどうかを示します。再利用は既定で有効になっています。ステップの内容 (スクリプト/依存関係) と入力とパラメーターが変更されていない場合は、この手順の前の実行からの出力が再利用されます。ステップを再利用すると、ジョブをコンピューティングに送信する代わりに、前の実行の結果が後続のステップですぐに使用できるようになります。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。
compute_target 必須	BatchCompute, str [必須]ジョブが実行される BatchCompute コンピューティング。
version 必須	str モジュールの機能の変更を示すオプションのバージョンタグ。

注釈

次の例は、Azure Machine Learning パイプラインで AzureBatchStep を使用する方法を示しています。


   step = AzureBatchStep(
               name="Azure Batch Job",
               pool_id="MyPoolName", # Replace this with the pool name of your choice
               inputs=[testdata],
               outputs=[outputdata],
               executable="azurebatch.cmd",
               arguments=[testdata, outputdata],
               compute_target=batch_compute,
               source_directory=binaries_folder,
   )

完全なサンプルは次から入手できます https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-azurebatch-to-run-a-windows-executable.ipynb

メソッド

create_node

AzureBatch ステップからノードを作成し、指定したグラフに追加します。

このメソッドは、直接使用するためのものではありません。この手順でパイプラインがインスタンス化されると、Azure ML は、このメソッドに必要なパラメーターを自動的に渡して、そのステップをワークフローを表すパイプライングラフに追加できるようにします。

create_node

AzureBatch ステップからノードを作成し、指定したグラフに追加します。

create_node(graph, default_datastore, context)

パラメーター

名前	説明
graph 必須	Graph ノードを追加するグラフオブジェクト。
default_datastore 必須	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] 既定のデータストア。
context 必須	<xref:azureml.pipeline.core._GraphContext> グラフコンテキスト。

戻り値

型	説明
Node	作成されたノード。

次の方法で共有

AzureBatchStep クラス

コンストラクター

パラメーター

注釈

メソッド

create_node

パラメーター

戻り値

フィードバック