Sdílet prostřednictvím


steps Balíček

Obsahuje předem připravené kroky, které je možné spustit v kanálu služby Azure Machine Learning.

Kroky kanálu Azure ML je možné nakonfigurovat společně tak, aby vytvořily kanál, který představuje sdíletelný a opakovaně použitelný pracovní postup služby Azure Machine Learning. Každý krok kanálu je možné nakonfigurovat tak, aby umožňoval opakované použití předchozích výsledků spuštění, pokud obsah kroku (skripty a závislosti) i vstupy a parametry zůstanou beze změny.

Třídy v tomto balíčku se obvykle používají společně s třídami v core balíčku. Základní balíček obsahuje třídy pro konfiguraci dat (PipelineData), plánování (Schedule) a správu výstupu kroků (StepRun).

Předdefinované kroky v tomto balíčku pokrývají řadu běžných scénářů, ke kterým došlo v pracovních postupech strojového učení. Pokud chcete začít s předem připravenými kroky kanálu, přečtěte si téma:

Moduly

adla_step

Obsahuje funkce pro vytvoření kroku kanálu Azure ML pro spuštění skriptu U-SQL pomocí Azure Data Lake Analytics.

automl_step

Obsahuje funkce pro přidání a správu kroku automatizovaného kanálu ML ve službě Azure Machine Learning.

azurebatch_step

Obsahuje funkce pro vytvoření kroku kanálu Azure ML, který spouští spustitelný soubor Windows ve službě Azure Batch.

command_step

Obsahuje funkce pro vytvoření kroku kanálu Azure ML, který spouští příkazy.

data_transfer_step

Obsahuje funkce pro vytvoření kroku kanálu Azure ML, který přenáší data mezi možnostmi úložiště.

databricks_step

Obsahuje funkce pro vytvoření kroku kanálu Azure ML pro spuštění poznámkového bloku Databricks nebo skriptu Pythonu v DBFS.

estimator_step

Obsahuje funkce pro vytvoření kroku kanálu, který spustí nástroj pro odhad pro trénování modelu Machine Learning.

hyper_drive_step

Obsahuje funtionalitu pro vytváření a správu kroků kanálu Azure ML, které spouští ladění hyperparametrů.

kusto_step

Obsahuje funkce pro vytvoření kroku kanálu Azure ML pro spuštění poznámkového bloku Kusto.

module_step

Obsahuje funkce pro přidání kroku kanálu služby Azure Machine Learning pomocí existující verze modulu.

mpi_step

Obsahuje funkce pro přidání kroku kanálu Azure ML pro spuštění úlohy MPI pro trénování modelu Machine Learning.

parallel_run_config

Obsahuje funkce pro konfiguraci objektu ParallelRunStep.

parallel_run_step

Obsahuje funkce pro přidání kroku pro spuštění uživatelského skriptu v paralelním režimu u více cílů AmlCompute.

python_script_step

Obsahuje funkce pro vytvoření kroku kanálu Azure ML, který spouští skript Pythonu.

r_script_step

Obsahuje funkce pro vytvoření kroku kanálu Azure ML, který spouští skript jazyka R.

synapse_spark_step

Obsahuje funkce pro vytvoření kroku Synapse Azure ML, který spouští skript Pythonu.

Třídy

AdlaStep

Vytvoří krok kanálu Azure ML pro spuštění skriptu U-SQL pomocí Azure Data Lake Analytics.

Příklad použití tohoto AdlaStepu najdete v poznámkovém bloku https://aka.ms/pl-adla.

Vytvořte krok kanálu Azure ML pro spuštění skriptu U-SQL pomocí Azure Data Lake Analytics.

AutoMLStep

Vytvoří krok kanálu Azure ML, který zapouzdřuje automatizované spuštění ML.

Příklad použití funkce AutoMLStep najdete v poznámkovém bloku https://aka.ms/pl-automl.

Inicializace kroku AutoMLStep

AutoMLStepRun

Poskytuje informace o spuštění a metodách automatizovaného experimentu ML pro načtení výchozích výstupů.

Třída AutoMLStepRun slouží ke správě, kontrole stavu a načítání podrobností o spuštění po odeslání automatizovaného spuštění ML v kanálu. Kromě toho lze tuto třídu použít k získání výchozích AutoMLStep výstupů prostřednictvím StepRun třídy.

Inicializace spuštění kroku automl

AzureBatchStep

Vytvoří krok kanálu Azure ML pro odesílání úloh do služby Azure Batch.

Poznámka: Tento krok nepodporuje nahrávání a stahování adresářů a jejich obsahu.

Příklad použití azureBatchStep najdete v poznámkovém bloku https://aka.ms/pl-azbatch.

Vytvořte krok kanálu Azure ML pro odesílání úloh do služby Azure Batch.

CommandStep

Vytvořte krok kanálu Azure ML, který spustí příkaz.

Vytvořte krok kanálu Azure ML, který spustí příkaz.

DataTransferStep

Vytvoří krok kanálu Azure ML, který přenáší data mezi možnostmi úložiště.

DataTransferStep podporuje běžné typy úložiště, jako jsou Azure Blob Storage a Azure Data Lake jako zdroje a jímky. Další informace najdete v části Poznámky .

Příklad použití dataTransferStep naleznete v poznámkovém bloku https://aka.ms/pl-data-trans.

Vytvořte krok kanálu Azure ML, který přenáší data mezi možnostmi úložiště.

DatabricksStep

Vytvoří krok kanálu Azure ML pro přidání poznámkového bloku DataBricks, skriptu Pythonu nebo souboru JAR jako uzlu.

Příklad použití DatabricksStep najdete v poznámkovém bloku https://aka.ms/pl-databricks.

Vytvořte krok kanálu Azure ML pro přidání poznámkového bloku DataBricks, skriptu Pythonu nebo souboru JAR jako uzlu.

Příklad použití DatabricksStep najdete v poznámkovém bloku https://aka.ms/pl-databricks.

:p aram python_script_name:[Povinný argument] Název skriptu Pythonu vzhledem k source_directory. Pokud skript přebírá vstupy a výstupy, předá se skriptu jako parametry. Pokud python_script_name je zadána, source_directory musí být také.

Zadejte přesně jednu z hodnot notebook_path, python_script_path, python_script_namenebo main_class_name.

Pokud jako vstup zadáte objekt DataReference s data_reference_name=input1 a objekt PipelineData jako výstup s názvem=output1, předá se vstupy a výstupy skriptu jako parametry. Takto budou vypadat a budete muset analyzovat argumenty ve skriptu, abyste získali přístup k cestám jednotlivých vstupů a výstupů: "-input1","wasbs://test@storagename.blob.core.windows.net/test","-output1", "wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

Kromě toho budou ve skriptu k dispozici následující parametry:

  • AZUREML_RUN_TOKEN: Token AML pro ověřování ve službě Azure Machine Learning.
  • AZUREML_RUN_TOKEN_EXPIRY: Čas vypršení platnosti tokenu AML.
  • AZUREML_RUN_ID: ID spuštění služby Azure Machine Learning pro toto spuštění
  • AZUREML_ARM_SUBSCRIPTION: Předplatné Azure pro váš pracovní prostor AML.
  • AZUREML_ARM_RESOURCEGROUP: Skupina prostředků Azure pro váš pracovní prostor Azure Machine Learning.
  • AZUREML_ARM_WORKSPACE_NAME: Název pracovního prostoru služby Azure Machine Learning.
  • AZUREML_ARM_PROJECT_NAME: Název experimentu služby Azure Machine Learning
  • AZUREML_SERVICE_ENDPOINT: Adresa URL koncového bodu pro služby AML.
  • AZUREML_WORKSPACE_ID: ID pracovního prostoru služby Azure Machine Learning.
  • AZUREML_EXPERIMENT_ID: ID experimentu služby Azure Machine Learning
  • AZUREML_SCRIPT_DIRECTORY_NAME: Cesta k adresáři v DBFS, kde source_directory byla zkopírována.
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

Při spouštění skriptu Pythonu z místního počítače v Databricks pomocí parametrů source_directory DatabricksStep a python_script_namesource_directory se zkopíruje do DBFS a cesta k adresáři ve službě DBFS se předá jako parametr skriptu při zahájení provádění. Tento parametr je označený jako –AZUREML_SCRIPT_DIRECTORY_NAME. Abyste mohli získat přístup k adresáři v DBFS, musíte ho předponovat řetězcem dbfs:/nebo /dbfs/.

EstimatorStep

ZAVRHOVANÝ. Vytvoří krok kanálu ke spuštění Estimator pro trénování modelu Azure ML.

Vytvořte krok kanálu Azure ML pro spuštění estimátoru pro trénování modelu Machine Learning.

ZAVRHOVANÝ. Použijte místo toho CommandStep . Příklad najdete v tématu Jak spustit trénování ML v kanálech pomocí CommandStep.

HyperDriveStep

Vytvoří krok kanálu Azure ML pro spuštění hyperparametrů pro trénování modelu Machine Learning.

Příklad použití funkce HyperDriveStep najdete v poznámkovém bloku https://aka.ms/pl-hyperdrive.

Vytvořte krok kanálu Azure ML pro spuštění hyperparametrů pro trénování modelu Machine Learning.

HyperDriveStepRun

Umožňuje spravovat, kontrolovat stav a načítat podrobnosti HyperDriveStep o spuštění kroku kanálu.

HyperDriveStepRun poskytuje funkce HyperDriveRun s další podporou StepRun. Třída HyperDriveStepRun umožňuje spravovat, kontrolovat stav a načítat podrobnosti o spuštění pro spuštění HyperDrivu a každé z vygenerovaných podřízených spuštění. Třída StepRun umožňuje to provést po odeslání nadřazeného spuštění kanálu a kanál odeslal spuštění kroku.

Inicializace HyperDriveStepRun

HyperDriveStepRun poskytuje funkce HyperDriveRun s další podporou StepRun. Třída HyperDriveRun umožňuje spravovat, kontrolovat stav a načítat podrobnosti o spuštění pro spuštění HyperDrivu a každé z vygenerovaných podřízených spuštění. Třída StepRun umožňuje to provést po odeslání nadřazeného spuštění kanálu a kanál odeslal spuštění kroku.

KustoStep

KustoStep umožňuje funkci spouštění dotazů Kusto v cílovém clusteru Kusto v Azure ML Pipelines.

Inicializace KustoStep

ModuleStep

Vytvoří krok kanálu Služby Azure Machine Learning pro spuštění konkrétní verze modulu.

Module objekty definují opakovaně použitelné výpočty, jako jsou skripty nebo spustitelné soubory, které lze použít v různých scénářích strojového učení a pro různé uživatele. Pokud chcete v kanálu použít konkrétní verzi modulu, vytvořte modul ModuleStep. ModuleStep je krok v kanálu, který používá existující ModuleVersion.

Příklad použití ModuleStep najdete v poznámkovém bloku https://aka.ms/pl-modulestep.

Vytvořte krok kanálu Azure ML pro spuštění konkrétní verze modulu.

MpiStep

Vytvoří krok kanálu Azure ML pro spuštění úlohy MPI.

Příklad použití funkce MpiStep najdete v poznámkovém bloku https://aka.ms/pl-style-trans.

Vytvořte krok kanálu Azure ML pro spuštění úlohy MPI.

ZAVRHOVANÝ. Použijte místo toho CommandStep . Příklad najdete v tématu Postup spuštění distribuovaného trénování v kanálech pomocí CommandStep.

ParallelRunConfig

Definuje konfiguraci objektu ParallelRunStep .

Příklad použití ParallelRunStep najdete v poznámkovém bloku https://aka.ms/batch-inference-notebooks.

Průvodce odstraňováním potíží najdete v tématu https://aka.ms/prstsg. Najdete tam další odkazy.

Inicializuje konfigurační objekt.

ParallelRunStep

Vytvoří krok kanálu služby Azure Machine Learning pro asynchronní zpracování velkých objemů dat asynchronně a paralelně.

Příklad použití ParallelRunStep najdete v poznámkovém bloku https://aka.ms/batch-inference-notebooks.

Průvodce odstraňováním potíží najdete v tématu https://aka.ms/prstsg. Najdete tam další odkazy.

Vytvořte krok kanálu Azure ML pro asynchronní a paralelní zpracování velkých objemů dat.

Příklad použití ParallelRunStep najdete v odkazu https://aka.ms/batch-inference-notebookspoznámkového bloku .

PythonScriptStep

Vytvoří krok kanálu Azure ML, který spouští skript Pythonu.

Příklad použití PythonScriptStep najdete v poznámkovém bloku https://aka.ms/pl-get-started.

Vytvořte krok kanálu Azure ML, který spouští skript Pythonu.

RScriptStep

Poznámka:

Jedná se o experimentální třídu a může se kdykoli změnit. Další informace najdete tady: https://aka.ms/acr/connected-registry.

Vytvoří krok kanálu Azure ML, který spouští skript jazyka R.

Vytvořte krok kanálu Azure ML, který spouští skript jazyka R.

ZAVRHOVANÝ. Použijte místo toho CommandStep . Příklad najdete v tématu Spouštění skriptů jazyka R v kanálech pomocí commandStep.

SynapseSparkStep

Poznámka:

Jedná se o experimentální třídu a může se kdykoli změnit. Další informace najdete tady: https://aka.ms/acr/connected-registry.

Vytvoří krok Synapse Azure ML, který odešle a spustí skript Pythonu.

Vytvořte krok kanálu Azure ML, který spouští úlohu Sparku ve fondu synapse Spark.