Dela via


steps Paket

Innehåller fördefinierade steg som kan köras i en Azure Machine Learning-pipeline.

Azure ML Pipeline-steg kan konfigureras tillsammans för att skapa en pipeline, som representerar ett delbart och återanvändbart Azure Machine Learning-arbetsflöde. Varje steg i en pipeline kan konfigureras för att tillåta återanvändning av dess tidigare körningsresultat om steginnehållet (skript och beroenden) samt indata och parametrar förblir oförändrade.

Klasserna i det här paketet används vanligtvis tillsammans med klasserna core i paketet. Kärnpaketet innehåller klasser för att konfigurera data (PipelineData), schemalägga (Schedule) och hantera utdata från steg (StepRun).

De fördefinierade stegen i det här paketet omfattar många vanliga scenarier som påträffas i maskininlärningsarbetsflöden. Information om hur du kommer igång med färdiga pipelinesteg finns i:

Moduler

adla_step

Innehåller funktioner för att skapa ett Azure ML Pipeline-steg för att köra ett U-SQL-skript med Azure Data Lake Analytics.

automl_step

Innehåller funktioner för att lägga till och hantera ett automatiserat ML-pipelinesteg i Azure Machine Learning.

azurebatch_step

Innehåller funktioner för att skapa ett Azure ML Pipeline-steg som kör en Körbar Windows-fil i Azure Batch.

command_step

Innehåller funktioner för att skapa ett Azure ML Pipeline-steg som kör kommandon.

data_transfer_step

Innehåller funktioner för att skapa ett Azure ML Pipeline-steg som överför data mellan lagringsalternativ.

databricks_step

Innehåller funktioner för att skapa ett Azure ML-pipelinesteg för att köra en Databricks-notebook- eller Python-skript på DBFS.

estimator_step

Innehåller funktioner för att skapa ett pipelinesteg som kör en beräkning för maskininlärningsmodellträning.

hyper_drive_step

Innehåller funtionalitet för att skapa och hantera Azure ML Pipeline-steg som kör justering av hyperparametrar.

kusto_step

Innehåller funktioner för att skapa ett Azure ML-pipelinesteg för att köra en Kusto-notebook-fil.

module_step

Innehåller funktioner för att lägga till ett Azure Machine Learning Pipeline-steg med hjälp av en befintlig version av en modul.

mpi_step

Innehåller funktioner för att lägga till ett Azure ML Pipeline-steg för att köra ett MPI-jobb för maskininlärningsmodellträning.

parallel_run_config

Innehåller funktioner för att konfigurera en ParallelRunStep.

parallel_run_step

Innehåller funktioner för att lägga till ett steg för att köra användarskript i parallellt läge på flera AmlCompute-mål.

python_script_step

Innehåller funktioner för att skapa ett Azure ML Pipeline-steg som kör Python-skript.

r_script_step

Innehåller funktioner för att skapa ett Azure ML Pipeline-steg som kör R-skript.

synapse_spark_step

Innehåller funktioner för att skapa ett Azure ML Synapse-steg som kör Python-skript.

Klasser

AdlaStep

Skapar ett Azure ML Pipeline-steg för att köra ett U-SQL-skript med Azure Data Lake Analytics.

Ett exempel på hur du använder det här AdlaStep finns i notebook-filen https://aka.ms/pl-adla.

Skapa ett Azure ML Pipeline-steg för att köra ett U-SQL-skript med Azure Data Lake Analytics.

AutoMLStep

Skapar ett Azure ML Pipeline-steg som kapslar in en automatiserad ML-körning.

Ett exempel på hur du använder AutoMLStep finns i notebook-filen https://aka.ms/pl-automl.

Initiera en AutoMLStep.

AutoMLStepRun

Innehåller information om en automatiserad ML-experimentkörning och metoder för att hämta standardutdata.

Klassen AutoMLStepRun används för att hantera, kontrollera status och hämta körningsinformation när en automatiserad ML-körning skickas i en pipeline. Dessutom kan den här klassen användas för att hämta standardutdata för AutoMLStep via StepRun -klassen.

Initiera en automl-stegkörning.

AzureBatchStep

Skapar ett Azure ML Pipeline-steg för att skicka jobb till Azure Batch.

Obs! Det här steget stöder inte uppladdning/nedladdning av kataloger och deras innehåll.

Ett exempel på hur du använder AzureBatchStep finns i notebook-filen https://aka.ms/pl-azbatch.

Skapa ett Azure ML Pipeline-steg för att skicka jobb till Azure Batch.

CommandStep

Skapa ett Azure ML Pipeline-steg som kör ett kommando.

Skapa ett Azure ML Pipeline-steg som kör ett kommando.

DataTransferStep

Skapar ett Azure ML Pipeline-steg som överför data mellan lagringsalternativ.

DataTransferStep stöder vanliga lagringstyper som Azure Blob Storage och Azure Data Lake som källor och mottagare. Mer information finns i avsnittet Kommentarer .

Ett exempel på hur du använder DataTransferStep finns i notebook-filen https://aka.ms/pl-data-trans.

Skapa ett Azure ML Pipeline-steg som överför data mellan lagringsalternativ.

DatabricksStep

Skapar ett Azure ML Pipeline-steg för att lägga till en DataBricks-notebook-fil, Python-skript eller JAR som en nod.

Ett exempel på hur du använder DatabricksStep finns i notebook-filen https://aka.ms/pl-databricks.

Skapa ett Azure ML Pipeline-steg för att lägga till en DataBricks-notebook-fil, Python-skript eller JAR som en nod.

Ett exempel på hur du använder DatabricksStep finns i notebook-filen https://aka.ms/pl-databricks.

:p aram python_script_name:[Required] Namnet på ett Python-skript i förhållande till source_directory. Om skriptet tar indata och utdata skickas de till skriptet som parametrar. Om python_script_name anges måste det source_directory också vara det.

Ange exakt en av notebook_path, python_script_path, python_script_nameeller main_class_name.

Om du anger ett DataReference-objekt som indata med data_reference_name=input1 och ett PipelineData-objekt som utdata med namn=output1, skickas indata och utdata till skriptet som parametrar. Så här ser de ut och du måste parsa argumenten i skriptet för att komma åt sökvägarna för varje indata och utdata: "-input1","wasbs://test@storagename.blob.core.windows.net/test","-output1", "wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

Dessutom är följande parametrar tillgängliga i skriptet:

  • AZUREML_RUN_TOKEN: AML-token för autentisering med Azure Machine Learning.
  • AZUREML_RUN_TOKEN_EXPIRY: Förfallotid för AML-token.
  • AZUREML_RUN_ID: Kör-ID för Azure Machine Learning för den här körningen.
  • AZUREML_ARM_SUBSCRIPTION: Azure-prenumeration för din AML-arbetsyta.
  • AZUREML_ARM_RESOURCEGROUP: Azure-resursgrupp för din Azure Machine Learning-arbetsyta.
  • AZUREML_ARM_WORKSPACE_NAME: Namnet på din Azure Machine Learning-arbetsyta.
  • AZUREML_ARM_PROJECT_NAME: Namnet på ditt Azure Machine Learning-experiment.
  • AZUREML_SERVICE_ENDPOINT: Slutpunkts-URL för AML-tjänster.
  • AZUREML_WORKSPACE_ID: ID för din Azure Machine Learning-arbetsyta.
  • AZUREML_EXPERIMENT_ID: ID för ditt Azure Machine Learning-experiment.
  • AZUREML_SCRIPT_DIRECTORY_NAME: Katalogsökväg i DBFS där source_directory har kopierats.
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

När du kör ett Python-skript från den lokala datorn på Databricks med hjälp av DatabricksStep-parametrar och source_directorypython_script_namekopieras source_directory över till DBFS och katalogsökvägen i DBFS skickas som en parameter till skriptet när körningen påbörjas. Den här parametern är märkt med –AZUREML_SCRIPT_DIRECTORY_NAME. Du måste prefixet med strängen "dbfs:/" eller "/dbfs/" för att få åtkomst till katalogen i DBFS.

EstimatorStep

DEPRECATED. Skapar ett pipelinesteg som ska köras Estimator för Azure ML-modellträning.

Skapa ett Azure ML Pipeline-steg för att köra Estimator for Machine Learning-modellträning.

DEPRECATED. CommandStep Använd i stället. Ett exempel finns i Köra ML-träning i pipelines med CommandStep.

HyperDriveStep

Skapar ett Azure ML Pipeline-steg för att köra hyperparameter tunning för maskininlärningsmodellträning.

Ett exempel på hur du använder HyperDriveStep finns i notebook-filen https://aka.ms/pl-hyperdrive.

Skapa ett Azure ML Pipeline-steg för att köra hyperparameter tunning för maskininlärningsmodellträning.

HyperDriveStepRun

Hantera, kontrollera status och hämta körningsinformation för ett HyperDriveStep pipelinesteg.

HyperDriveStepRun tillhandahåller funktionerna HyperDriveRun i med ytterligare stöd för StepRun. Med klassen HyperDriveStepRun kan du hantera, kontrollera status och hämta körningsinformation för HyperDrive-körningen och var och en av dess genererade underordnade körningar. Med klassen StepRun kan du göra detta när den överordnade pipelinekörningen har skickats och pipelinen har skickat stegkörningen.

Initiera en HyperDriveStepRun.

HyperDriveStepRun tillhandahåller funktionerna HyperDriveRun i med ytterligare stöd för StepRun. Med klassen HyperDriveRun kan du hantera, kontrollera status och hämta körningsinformation för HyperDrive-körningen och var och en av dess genererade underordnade körningar. Med klassen StepRun kan du göra detta när den överordnade pipelinekörningen har skickats och pipelinen har skickat stegkörningen.

KustoStep

KustoStep gör det möjligt att köra Kusto-frågor på ett Kusto-målkluster i Azure ML-pipelines.

Initiera KustoStep.

ModuleStep

Skapar ett Azure Machine Learning-pipelinesteg för att köra en specifik version av en modul.

Module -objekt definierar återanvändbara beräkningar, till exempel skript eller körbara filer, som kan användas i olika maskininlärningsscenarier och av olika användare. Om du vill använda en specifik version av en modul i en pipeline skapar du en ModuleStep. En ModuleStep är ett steg i pipelinen som använder en befintlig ModuleVersion.

Ett exempel på hur du använder ModuleStep finns i notebook-filen https://aka.ms/pl-modulestep.

Skapa ett Azure ML-pipelinesteg för att köra en specifik version av en modul.

MpiStep

Skapar ett Azure ML-pipelinesteg för att köra ett MPI-jobb.

Ett exempel på hur du använder MpiStep finns i notebook-filen https://aka.ms/pl-style-trans.

Skapa ett Azure ML-pipelinesteg för att köra ett MPI-jobb.

DEPRECATED. CommandStep Använd i stället. Ett exempel finns i Så här kör du distribuerad träning i pipelines med CommandStep.

ParallelRunConfig

Definierar konfigurationen för ett ParallelRunStep objekt.

Ett exempel på hur du använder ParallelRunStep finns i notebook-filen https://aka.ms/batch-inference-notebooks.

Felsökningsguide finns i https://aka.ms/prstsg. Du hittar fler referenser där.

Initiera konfigurationsobjektet.

ParallelRunStep

Skapar ett Azure Machine Learning Pipeline-steg för att bearbeta stora mängder data asynkront och parallellt.

Ett exempel på hur du använder ParallelRunStep finns i notebook-filen https://aka.ms/batch-inference-notebooks.

Felsökningsguide finns i https://aka.ms/prstsg. Du hittar fler referenser där.

Skapa ett Azure ML Pipeline-steg för att bearbeta stora mängder data asynkront och parallellt.

Ett exempel på hur du använder ParallelRunStep finns i notebook-länken https://aka.ms/batch-inference-notebooks.

PythonScriptStep

Skapar ett Azure ML Pipeline-steg som kör Python-skript.

Ett exempel på hur du använder PythonScriptStep finns i notebook-filen https://aka.ms/pl-get-started.

Skapa ett Azure ML Pipeline-steg som kör Python-skript.

RScriptStep

Anteckning

Det här är en experimentell klass och kan ändras när som helst. Mer information finns i https://aka.ms/azuremlexperimental.

Skapar ett Azure ML Pipeline-steg som kör R-skript.

Skapa ett Azure ML Pipeline-steg som kör R-skript.

DEPRECATED. CommandStep Använd i stället. Ett exempel finns i Köra R-skript i pipelines med CommandStep.

SynapseSparkStep

Anteckning

Det här är en experimentell klass och kan ändras när som helst. Mer information finns i https://aka.ms/azuremlexperimental.

Skapar ett Azure ML Synapse-steg som skickar och kör Python-skript.

Skapa ett Azure ML Pipeline-steg som kör Spark-jobb på Synapse Spark-poolen.