databricks_step モジュール

DBFS で Databricks ノートブックまたは Python スクリプトを実行する Azure ML パイプラインステップを作成する機能が含まれています。

クラス

DatabricksStep

DataBricks ノートブック、Python スクリプト、または JAR をノードとして追加する Azure ML パイプラインステップを作成します。

DatabricksStep の使用例については、ノートブックの https://aka.ms/pl-databricksを参照してください。

DataBricks ノートブック、Python スクリプト、または JAR をノードとして追加する Azure ML パイプラインステップを作成します。

DatabricksStep の使用例については、ノートブックの https://aka.ms/pl-databricksを参照してください。

:p aram python_script_name:[必須] source_directoryを基準とした Python スクリプトの名前。スクリプトが入力と出力を受け取る場合、それらはパラメーターとしてスクリプトに渡されます。 python_script_nameを指定する場合は、source_directoryも指定する必要があります。

notebook_path、python_script_path、python_script_name、またはmain_class_nameのいずれかを指定します。

data_reference_name=input1 の入力として DataReference オブジェクトを指定し、name=output1 の出力として PipelineData オブジェクトを指定した場合、入力と出力はパラメーターとしてスクリプトに渡されます。次のように表示され、スクリプト内の引数を解析して、各入力と出力のパスにアクセスする必要があります。 "-input1"、"wasbs://test@storagename.blob.core.windows.net/test"、"-output1"、"wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

さらに、スクリプト内で次のパラメーターを使用できます。

AZUREML_RUN_TOKEN: Azure Machine Learning で認証するための AML トークン。
AZUREML_RUN_TOKEN_EXPIRY: AML トークンの有効期限。
AZUREML_RUN_ID: この実行の Azure Machine Learning 実行 ID。
AZUREML_ARM_SUBSCRIPTION: AML ワークスペースの Azure サブスクリプション。
AZUREML_ARM_RESOURCEGROUP: Azure Machine Learning ワークスペースの Azure リソースグループ。
AZUREML_ARM_WORKSPACE_NAME: Azure Machine Learning ワークスペースの名前。
AZUREML_ARM_PROJECT_NAME: Azure Machine Learning 実験の名前。
AZUREML_SERVICE_ENDPOINT: AML サービスのエンドポイント URL。
AZUREML_WORKSPACE_ID: Azure Machine Learning ワークスペースの ID。
AZUREML_EXPERIMENT_ID: Azure Machine Learning 実験の ID。
AZUREML_SCRIPT_DIRECTORY_NAME: source_directoryがコピーされた DBFS のディレクトリパス。

  (This parameter is only populated when `python_script_name` is used.  See more details below.)

DatabricksStep パラメーター source_directory と python_script_nameを使用して Databricks 上のローカルコンピューターから Python スクリプトを実行する場合、source_directoryは DBFS にコピーされ、DBFS のディレクトリパスは実行を開始するときにパラメーターとしてスクリプトに渡されます。このパラメーターには、-AZUREML_SCRIPT_DIRECTORY_NAME というラベルが付けられます。 DBFS 内のディレクトリにアクセスするには、文字列 "dbfs:/" または "/dbfs/" のプレフィックスを付ける必要があります。

次の方法で共有

databricks_step モジュール

クラス

フィードバック