SynapseSparkStep Osztály
Megjegyzés
Ez egy kísérleti osztály, és bármikor változhat. További információ: https://aka.ms/azuremlexperimental.
Létrehoz egy Azure ML Synapse-lépést, amely Python-szkriptet küld el és hajt végre.
Hozzon létre egy Azure ML-folyamatlépést, amely Spark-feladatot futtat a Synapse Spark-készleten.
- Öröklődés
-
azureml.pipeline.core._synapse_spark_step_base._SynapseSparkStepBaseSynapseSparkStep
Konstruktor
SynapseSparkStep(file, source_directory, compute_target, driver_memory, driver_cores, executor_memory, executor_cores, num_executors, name=None, app_name=None, environment=None, arguments=None, inputs=None, outputs=None, conf=None, py_files=None, jars=None, files=None, allow_reuse=True, version=None)
Paraméterek
- source_directory
- str
A lépésben használt Python-szkriptet, conda env-t és egyéb erőforrásokat tartalmazó mappa.
- allow_reuse
- bool
Azt jelzi, hogy a lépésnek újra fel kell-e használnia a korábbi eredményeket, amikor ugyanazokkal a beállításokkal fut újra.
- source_directory
- str
A lépésben használt Python-szkriptet, conda env-t és egyéb erőforrásokat tartalmazó mappa.
- allow_reuse
- bool
Azt jelzi, hogy a lépésnek újra fel kell-e használnia a korábbi eredményeket, amikor ugyanazokkal a beállításokkal fut újra.
Megjegyzések
A SynapseSparkStep egy alapszintű, beépített lépés egy Python Spark-feladat synapse Spark-készleteken való futtatásához. A fő fájlnevet és egyéb választható paramétereket, például a szkript argumentumait, a számítási célt, a bemeneteket és a kimeneteket veszi figyelembe.
A SynapseSparkStep használatához ajánlott egy külön mappát használni a szkriptekhez és a lépéshez társított függő fájlokhoz, és meg kell adni a mappát a source_directory
paraméterrel.
Ennek az ajánlott eljárásnak a követése két előnnyel jár. Először is segít csökkenteni a lépéshez létrehozott pillanatkép méretét, mert csak a lépéshez szükséges pillanatkép készül. Másodszor, a lépés előző futtatásból származó kimenete újra felhasználható, ha nincsenek olyan módosítások, source_directory
amelyek elindítanák a pillanatkép újrafeltöltését.
from azureml.core import Dataset
from azureml.pipeline.steps import SynapseSparkStep
from azureml.data import HDFSOutputDatasetConfig
# get input dataset
input_ds = Dataset.get_by_name(workspace, "weather_ds").as_named_input("weather_ds")
# register pipeline output as dataset
output_ds = HDFSOutputDatasetConfig("synapse_step_output",
destination=(ws.datastores['datastore'],"dir")
).register_on_complete(name="registered_dataset")
step_1 = SynapseSparkStep(
name = "synapse_step",
file = "pyspark_job.py",
source_directory="./script",
inputs=[input_ds],
outputs=[output_ds],
compute_target = "synapse",
driver_memory = "7g",
driver_cores = 4,
executor_memory = "7g",
executor_cores = 2,
num_executors = 1,
conf = {})
A SynapseSparkStep csak a DatasetConsumptionConfig bemenetként és a HDFSOutputDatasetConfig kimenetként való használatát támogatja.
Metódusok
create_node |
Hozzon létre egy csomópontot a Synapse-szkriptlépéshez. Ezt a módszert nem közvetlenül kell használni. Ha ezzel a lépéssel példányosít egy folyamatot, az Azure ML automatikusan átadja a szükséges paramétereket ezen a módszeren keresztül, hogy a lépés hozzáadható legyen a munkafolyamatot képviselő folyamatgráfhoz. |
create_node
Hozzon létre egy csomópontot a Synapse-szkriptlépéshez.
Ezt a módszert nem közvetlenül kell használni. Ha ezzel a lépéssel példányosít egy folyamatot, az Azure ML automatikusan átadja a szükséges paramétereket ezen a módszeren keresztül, hogy a lépés hozzáadható legyen a munkafolyamatot képviselő folyamatgráfhoz.
create_node(graph, default_datastore, context)
Paraméterek
- default_datastore
- Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Az alapértelmezett adattár.
- context
- <xref:azureml.pipeline.core._GraphContext>
A gráfkörnyezet.
Válaszok
A létrehozott csomópont.
Visszatérési típus
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: