Megosztás a következőn keresztül:


PythonScriptStep Osztály

Létrehoz egy Azure ML Pipeline-lépést, amely Python-szkriptet futtat.

A PythonScriptStep használatának példájáért tekintse meg a jegyzetfüzetet https://aka.ms/pl-get-started.

Hozzon létre egy Python-szkriptet futtató Azure ML Pipeline-lépést.

Öröklődés
azureml.pipeline.core._python_script_step_base._PythonScriptStepBase
PythonScriptStep

Konstruktor

PythonScriptStep(script_name, name=None, arguments=None, compute_target=None, runconfig=None, runconfig_pipeline_params=None, inputs=None, outputs=None, params=None, source_directory=None, allow_reuse=True, version=None, hash_paths=None)

Paraméterek

Name Description
script_name
Kötelező
str

[Kötelező] Egy Python-szkript neve a következőhöz source_directoryviszonyítva: .

name
str

A lépés neve. Ha nincs meghatározva, script_name akkor a függvényt használja.

alapértelmezett érték: None
arguments

A Python-szkriptfájl parancssori argumentumai. Az argumentumok a RunConfiguration paraméterével lesznek átadva a arguments számításnak. Az argumentumok, például a speciális szimbólumok kezelésével kapcsolatos további részletekért lásd: RunConfiguration.

alapértelmezett érték: None
compute_target

[Kötelező] A használni kívánt számítási cél. Ha nincs meghatározva, a rendszer a runconfigból származó célértéket fogja használni. Ez a paraméter megadható számítási célobjektumként vagy egy számítási cél sztringneveként a munkaterületen. Ha a számítási cél nem érhető el a folyamat létrehozásakor, megadhat egy rekordot ('számítási cél neve', 'számítási cél típusa'), hogy elkerülje a számítási célobjektum beolvasását (az AmlCompute típusa "AmlCompute", a RemoteCompute típusa pedig VirtualMachine).

alapértelmezett érték: None
runconfig

A nem kötelező RunConfiguration. A RunConfiguration használatával további követelményeket adhat meg a futtatáshoz, például conda-függőségeket és docker-rendszerképeket. Ha nincs meghatározva, létrejön egy alapértelmezett runconfig.

alapértelmezett érték: None
runconfig_pipeline_params

Felülbírálja a futtatókörnyezeti runconfig tulajdonságokat kulcs-érték párok használatával, amelyek mindegyike a runconfig tulajdonság nevével és a PipelineParameter tulajdonsággal rendelkezik.

Támogatott értékek: 'NodeCount', 'MpiProcessCountPerNode', 'TensorflowWorkerCount', 'TensorflowParameterServerCount'

alapértelmezett érték: None
inputs

A bemenetiport-kötések listája.

alapértelmezett érték: None
outputs

A kimeneti portkötések listája.

alapértelmezett érték: None
params

A környezeti változókként regisztrált név-érték párok szótára a "AML_PARAMETER_" kifejezéssel.

alapértelmezett érték: None
source_directory
str

A lépésben használt Python-szkriptet, conda env-t és egyéb erőforrásokat tartalmazó mappa.

alapértelmezett érték: None
allow_reuse

Azt jelzi, hogy a lépés újra felhasználja-e a korábbi eredményeket, amikor ugyanazokkal a beállításokkal fut újra. Az újrafelhasználás alapértelmezés szerint engedélyezve van. Ha a lépés tartalma (szkriptek/függőségek), valamint a bemenetek és paraméterek változatlanok maradnak, a rendszer újra felhasználja a lépés előző futtatásának kimenetét. A lépés újrahasználásakor a feladat számítási feladatként való elküldése helyett az előző futtatás eredményei azonnal elérhetővé válnak a további lépésekhez. Ha az Azure Machine Learning-adatkészleteket használja bemenetként, az újrafelhasználást az határozza meg, hogy az adathalmaz definíciója megváltozott-e, nem pedig az, hogy az alapul szolgáló adatok megváltoztak-e.

alapértelmezett érték: True
version
str

Nem kötelező verziócímke, amely a lépés funkcióváltozását jelzi.

alapértelmezett érték: None
hash_paths

ELAVULT: már nincs rá szükség.

A kivonat elérési útjainak listája a lépés tartalmának módosításakor. Ha nem észlelhető változás, a folyamat újra felhasználja az előző futtatás lépéstartalmat. Alapértelmezés szerint a tartalma source_directory kivonatolva van, kivéve az .amlignore vagy .gitignore fájlokat.

alapértelmezett érték: None
script_name
Kötelező
str

[Kötelező] Egy Python-szkript neve a következőhöz source_directoryviszonyítva: .

name
Kötelező
str

A lépés neve. Ha nincs meghatározva, script_name akkor a függvényt használja.

arguments
Kötelező
[str]

A Python-szkriptfájl parancssori argumentumai. Az argumentumok a RunConfiguration paraméterével lesznek átadva a arguments számításnak. Az argumentumok, például a speciális szimbólumok kezelésével kapcsolatos további részletekért lásd: RunConfiguration.

compute_target
Kötelező

[Kötelező] A használni kívánt számítási cél. Ha nincs meghatározva, a rendszer a runconfigból származó célértéket fogja használni. Ez a paraméter megadható számítási célobjektumként vagy egy számítási cél sztringneveként a munkaterületen. Ha a számítási cél nem érhető el a folyamat létrehozásakor, megadhat egy rekordot ('számítási cél neve', 'számítási cél típusa'), hogy elkerülje a számítási célobjektum beolvasását (az AmlCompute típusa "AmlCompute", a RemoteCompute típusa pedig VirtualMachine).

runconfig
Kötelező

A nem kötelező RunConfiguration. A RunConfiguration használatával további követelményeket adhat meg a futtatáshoz, például conda-függőségeket és docker-rendszerképeket. Ha nincs meghatározva, létrejön egy alapértelmezett runconfig.

runconfig_pipeline_params
Kötelező

Felülbírálja a futtatókörnyezeti runconfig tulajdonságokat kulcs-érték párok használatával, amelyek mindegyike a runconfig tulajdonság nevével és a PipelineParameter tulajdonsággal rendelkezik.

Támogatott értékek: 'NodeCount', 'MpiProcessCountPerNode', 'TensorflowWorkerCount', 'TensorflowParameterServerCount'

inputs
Kötelező

A bemenetiport-kötések listája.

outputs
Kötelező

A kimeneti portkötések listája.

params
Kötelező
<xref:<xref:{str: str}>>

Név-érték párok szótára. Környezeti változókként regisztrálva a ">>AML_PARAMETER_" használatával<<.

source_directory
Kötelező
str

A lépésben használt Python-szkriptet, conda env-t és egyéb erőforrásokat tartalmazó mappa.

allow_reuse
Kötelező

Azt jelzi, hogy a lépés újra felhasználja-e a korábbi eredményeket, amikor ugyanazokkal a beállításokkal fut újra. Az újrafelhasználás alapértelmezés szerint engedélyezve van. Ha a lépés tartalma (szkriptek/függőségek), valamint a bemenetek és paraméterek változatlanok maradnak, a rendszer újra felhasználja a lépés előző futtatásának kimenetét. A lépés újrahasználásakor a feladat számítási feladatként való elküldése helyett az előző futtatás eredményei azonnal elérhetővé válnak a további lépésekhez. Ha az Azure Machine Learning-adatkészleteket használja bemenetként, az újrafelhasználást az határozza meg, hogy az adathalmaz definíciója megváltozott-e, nem pedig az, hogy az alapul szolgáló adatok megváltoztak-e.

version
Kötelező
str

Nem kötelező verziócímke, amely a lépés funkcióváltozását jelzi.

hash_paths
Kötelező

ELAVULT: már nincs rá szükség.

A kivonat elérési útjainak listája a lépés tartalmának módosításakor. Ha nem észlelhető változás, a folyamat újra felhasználja az előző futtatás lépéstartalmat. Alapértelmezés szerint a tartalma source_directory kivonatolva van, kivéve az .amlignore vagy .gitignore fájlokat.

Megjegyzések

A PythonScriptStep egy alapszintű, beépített lépés egy Python-szkript számítási célon való futtatásához. A szkript nevét és egyéb opcionális paramétereket (például a szkript, a számítási cél, a bemenetek és kimenetek argumentumait) használja. Ha nincs megadva számítási cél, a rendszer a munkaterület alapértelmezett számítási célját használja. A használatával RunConfiguration követelményeket is megadhat a PythonScriptStep számára, például conda-függőségeket és docker-rendszerképeket.

A PythonScriptStep használatához ajánlott egy külön mappát használni a szkriptekhez és a lépéshez társított függő fájlokhoz, és meg kell adni a mappát a source_directory paraméterrel. Ennek az ajánlott eljárásnak a követése két előnnyel jár. Először is segít csökkenteni a lépéshez létrehozott pillanatkép méretét, mert csak a lépéshez szükséges pillanatkép készül. Másodszor, a lépés előző futtatásból származó kimenete újra felhasználható, ha nincsenek olyan módosítások, source_directory amelyek elindítanák a pillanatkép újrafeltöltését.

Az alábbi példakód egy PythonScriptStep használatát mutatja be egy gépi tanulási betanítási forgatókönyvben. A példával kapcsolatos további részletekért lásd: https://aka.ms/pl-first-pipeline.


   from azureml.pipeline.steps import PythonScriptStep

   trainStep = PythonScriptStep(
       script_name="train.py",
       arguments=["--input", blob_input_data, "--output", output_data1],
       inputs=[blob_input_data],
       outputs=[output_data1],
       compute_target=compute_target,
       source_directory=project_folder
   )

A PythonScriptSteps számos bemeneti és kimeneti típust támogat. Ezek közé tartoznak DatasetConsumptionConfig a bemenetek és OutputDatasetConfiga , PipelineOutputAbstractDatasetés PipelineData a bemenetek és kimenetek.

Az alábbiakban egy példa látható arra, hogyan használhatja Dataset lépésként a bemenetet és a kimenetet:


   from azureml.core import Dataset
   from azureml.pipeline.steps import PythonScriptStep
   from azureml.pipeline.core import Pipeline, PipelineData

   # get input dataset
   input_ds = Dataset.get_by_name(workspace, 'weather_ds')

   # register pipeline output as dataset
   output_ds = PipelineData('prepared_weather_ds', datastore=datastore).as_dataset()
   output_ds = output_ds.register(name='prepared_weather_ds', create_new_version=True)

   # configure pipeline step to use dataset as the input and output
   prep_step = PythonScriptStep(script_name="prepare.py",
                                inputs=[input_ds.as_named_input('weather_ds')],
                                outputs=[output_ds],
                                compute_target=compute_target,
                                source_directory=project_folder)

Hivatkozzon a megfelelő dokumentációs oldalakra más bemeneti/kimeneti típusok használatára.

Metódusok

create_node

Hozzon létre egy csomópontot a PythonScriptStep számára, és adja hozzá a megadott gráfhoz.

Ezt a módszert nem közvetlenül kell használni. Ha ezzel a lépéssel példányosít egy folyamatot, az Azure ML automatikusan átadja a szükséges paramétereket ezen a módszeren keresztül, hogy a lépés hozzáadható legyen a munkafolyamatot képviselő folyamatgráfhoz.

create_node

Hozzon létre egy csomópontot a PythonScriptStep számára, és adja hozzá a megadott gráfhoz.

Ezt a módszert nem közvetlenül kell használni. Ha ezzel a lépéssel példányosít egy folyamatot, az Azure ML automatikusan átadja a szükséges paramétereket ezen a módszeren keresztül, hogy a lépés hozzáadható legyen a munkafolyamatot képviselő folyamatgráfhoz.

create_node(graph, default_datastore, context)

Paraméterek

Name Description
graph
Kötelező

A csomópontot hozzáadni kívánt gráfobjektum.

default_datastore
Kötelező

Az alapértelmezett adattár.

context
Kötelező
<xref:azureml.pipeline.core._GraphContext>

A gráfkörnyezet.

Válaszok

Típus Description

A létrehozott csomópont.