AzureBatchStep クラス
Azure Batch にジョブを送信するための Azure ML パイプライン ステップを作成します。
注: この手順は、ディレクトリとその内容のアップロード/ダウンロードには対応していません。
AzureBatchStep の使用例については、ノートブック https://aka.ms/pl-azbatch を参照してください。
ジョブをAzure Batchに送信するための Azure ML パイプライン ステップを作成します。
- 継承
-
azureml.pipeline.core._azurebatch_step_base._AzureBatchStepBaseAzureBatchStep
コンストラクター
AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)
パラメーター
- vm_image_urn
- str
create_pool
が True で、VM が VirtualMachineConfiguration を使用する場合。
値の形式: urn:publisher:offer:sku
。
例: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
.
- inputs
- list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
入力ポート バインドのリスト。 ジョブを実行する前に、入力ごとにフォルダーが作成されます。 各入力のファイルは、ストレージから計算ノード上のそれぞれのフォルダーにコピーされます。 たとえば、入力名が input1 で、ストレージ上の相対パスが some/relative/path/that/can/be/really/long/inputfile.txt の場合、コンピューティング上のファイル パスは ./input1/inputfile.txt となります。 入力名が 32 文字を超える場合は、フォルダー名がコンピューティング先に正常に作成されるように、文字が切り捨てられ、一意のサフィックスが名前に追加されます。
出力ポート バインドのリスト。 入力と同様に、ジョブを実行する前に、出力ごとにフォルダーが作成されます。 フォルダー名は出力名と同じになります。 ジョブによって出力がそのフォルダーに保存されることが前提となります。
- allow_reuse
- bool
同じ設定で再実行されたときに、ステップで前の結果を再利用するかどうかを示します。 再利用は既定で有効になっています。 ステップの内容 (スクリプトや依存関係) だけでなく、入力とパラメーターも変更されていない場合は、このステップの前の実行からの出力が再利用されます。 ステップを再利用する場合、計算するジョブを送信する代わりに、前の実行の結果を後続のステップですぐに利用できるようにします。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。
- vm_image_urn
- str
create_pool
が True で、VM が VirtualMachineConfiguration を使用する場合。
値の形式: urn:publisher:offer:sku
。
例: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
.
- inputs
- list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
入力ポート バインドのリスト。 ジョブを実行する前に、入力ごとにフォルダーが作成されます。 各入力のファイルは、ストレージから計算ノード上のそれぞれのフォルダーにコピーされます。 たとえば、入力名が input1 で、ストレージ上の相対パスが some/relative/path/that/can/be/really/long/inputfile.txt の場合、コンピューティング上のファイル パスは ./input1/inputfile.txt となります。 入力名が 32 文字を超える場合は、切り捨てられ、一意のサフィックスが付加されるため、コンピューティングでフォルダー名を正常に作成できます。
出力ポート バインドのリスト。 入力と同様に、ジョブを実行する前に、出力ごとにフォルダーが作成されます。 フォルダー名は出力名と同じになります。 ジョブがそのフォルダーに出力されることを前提とします。
- allow_reuse
- bool
同じ設定で再実行されたときに、ステップで前の結果を再利用するかどうかを示します。 再利用は既定で有効になっています。 ステップの内容 (スクリプトや依存関係) だけでなく、入力とパラメーターも変更されていない場合は、このステップの前の実行からの出力が再利用されます。 ステップを再利用する場合、計算するジョブを送信する代わりに、前の実行の結果を後続のステップですぐに利用できるようにします。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。
注釈
次の例は、Azure Machine Learning パイプライン内で AzureBatchStep を使用する方法を示しています。
step = AzureBatchStep(
name="Azure Batch Job",
pool_id="MyPoolName", # Replace this with the pool name of your choice
inputs=[testdata],
outputs=[outputdata],
executable="azurebatch.cmd",
arguments=[testdata, outputdata],
compute_target=batch_compute,
source_directory=binaries_folder,
)
メソッド
create_node |
AzureBatch ステップからノードを作成し、指定されたグラフに追加します。 このメソッドは直接使用するためのものではありません。 このステップでパイプラインがインスタンス化されると、Azure ML は、ワークフローを表すパイプライン グラフにステップを追加できるように、このメソッドで必要なパラメーターを自動的に渡します。 |
create_node
AzureBatch ステップからノードを作成し、指定されたグラフに追加します。
このメソッドは直接使用するためのものではありません。 このステップでパイプラインがインスタンス化されると、Azure ML は、ワークフローを表すパイプライン グラフにステップを追加できるように、このメソッドで必要なパラメーターを自動的に渡します。
create_node(graph, default_datastore, context)
パラメーター
- context
- <xref:azureml.pipeline.core._GraphContext>
グラフ コンテキスト。
戻り値
作成されたノード。
の戻り値の型 :
フィードバック
https://aka.ms/ContentUserFeedback」を参照してください。
以下は間もなく提供いたします。2024 年を通じて、コンテンツのフィードバック メカニズムとして GitHub の issue を段階的に廃止し、新しいフィードバック システムに置き換えます。 詳細については、「フィードバックの送信と表示