databricks_step Modül

DBFS'de Databricks not defteri veya Python betiği çalıştırmak için Azure ML işlem hattı adımı oluşturma işlevselliği içerir.

Sınıflar

DatabricksStep

DataBricks not defteri, Python betiği veya JAR'ı düğüm olarak eklemek için bir Azure ML İşlem Hattı adımı oluşturur.

DatabricksStep kullanma örneği için not defterine https://aka.ms/pl-databricksbakın.

DataBricks not defteri, Python betiği veya JAR'ı düğüm olarak eklemek için bir Azure ML İşlem Hattı adımı oluşturun.

DatabricksStep kullanma örneği için not defterine https://aka.ms/pl-databricksbakın.

:p aram python_script_name:[Gerekli] ile ilgili source_directorybir Python betiğinin adı. Betik girişleri ve çıkışları alırsa, bunlar betike parametre olarak geçirilir. belirtilirse python_script_name , o zaman source_directory da olmalıdır.

, , python_script_pathpython_script_nameveya main_class_nametam notebook_patholarak birini belirtin.

data_reference_name=input1 ile giriş olarak bir DataReference nesnesi ve name=output1 çıkış olarak bir PipelineData nesnesi belirtirseniz, girişler ve çıkışlar betiklere parametre olarak geçirilir. Bu şekilde görünürler ve her giriş ve çıkışın yollarına erişmek için betiğinizdeki bağımsız değişkenleri ayrıştırmanız gerekir: "-input1","wasbs://test@storagename.blob.core.windows.net/test","-output1", "wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

Ayrıca, betikte aşağıdaki parametreler kullanılabilir olacaktır:

  • AZUREML_RUN_TOKEN: Azure Machine Learning ile kimlik doğrulaması için AML belirteci.
  • AZUREML_RUN_TOKEN_EXPIRY: AML belirteci süre sonu süresi.
  • AZUREML_RUN_ID: Bu çalıştırma için Azure Machine Learning Çalıştırma Kimliği.
  • AZUREML_ARM_SUBSCRIPTION: AML çalışma alanınız için Azure aboneliği.
  • AZUREML_ARM_RESOURCEGROUP: Azure Machine Learning çalışma alanınız için Azure kaynak grubu.
  • AZUREML_ARM_WORKSPACE_NAME: Azure Machine Learning çalışma alanınızın adı.
  • AZUREML_ARM_PROJECT_NAME: Azure Machine Learning denemenizin adı.
  • AZUREML_SERVICE_ENDPOINT: AML hizmetlerinin uç nokta URL'si.
  • AZUREML_WORKSPACE_ID: Azure Machine Learning çalışma alanınızın kimliği.
  • AZUREML_EXPERIMENT_ID: Azure Machine Learning denemenizin kimliği.
  • AZUREML_SCRIPT_DIRECTORY_NAME: DBFS'de source_directory kopyalandığı dizin yolu.
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

DatabricksStep parametrelerini source_directory ve python_script_namekullanarak Databricks'te yerel makinenizden bir Python betiği yürütürken, source_directory DBFS'ye kopyalanır ve DBFS'de dizin yolu yürütülmeye başladığında betiğinize parametre olarak geçirilir. Bu parametre –AZUREML_SCRIPT_DIRECTORY_NAME olarak etiketlenir. "dbfs:/" dizesini önek olarak eklemeniz gerekir veya DBFS dizinine erişmek için "/dbfs/" yazın.