MpiStep Classe

Riferimento

Crea un passaggio della pipeline di Azure ML per eseguire un processo MPI.

Per un esempio di uso di MpiStep, vedere il notebook https://aka.ms/pl-style-trans.

Creare un passaggio della pipeline di Azure ML per eseguire un processo MPI.

DEPRECATO. Usare invece .CommandStep Per un esempio, vedere Come eseguire il training distribuito nelle pipeline con CommandStep.

Ereditarietà: PythonScriptStep

MpiStep

Costruttore

MpiStep(name=None, source_directory=None, script_name=None, arguments=None, compute_target=None, node_count=None, process_count_per_node=None, inputs=None, outputs=None, allow_reuse=True, version=None, hash_paths=None, **kwargs)

Parametri

Nome	Descrizione
name	str [Obbligatorio] Nome del modulo. Valore predefinito: None
source_directory	str [Obbligatorio] Cartella contenente script Python, conda env e altre risorse usate nel passaggio. Valore predefinito: None
script_name	str [Obbligatorio] Nome di uno script Python relativo a `source_directory`. Valore predefinito: None
arguments	list [Obbligatorio] Elenco di argomenti della riga di comando. Valore predefinito: None
compute_target	AmlCompute, str [Obbligatorio] Destinazione di calcolo da usare. Valore predefinito: None
node_count	int [Obbligatorio] Numero di nodi nella destinazione di calcolo usata per il training. Se maggiore di 1, verrà eseguito un processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati. Valore predefinito: None
process_count_per_node	int [Obbligatorio] Numero di processi per nodo. Se maggiore di 1, verrà eseguito un processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati. Valore predefinito: None
inputs	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputAbstractDataset, DatasetConsumptionConfig]] Elenco di associazioni di porte di input. Valore predefinito: None
outputs	list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]] Elenco di associazioni di porte di output. Valore predefinito: None
params Necessario	dict Dizionario delle coppie nome-valore registrate come variabili di ambiente con "AML_PARAMETER_".
allow_reuse	bool Indica se il passaggio deve riutilizzare i risultati precedenti quando si esegue di nuovo con le stesse impostazioni. Il riutilizzo è abilitato per impostazione predefinita. Se il contenuto del passaggio (script/dipendenze) e gli input e i parametri rimangono invariati, l'output dell'esecuzione precedente di questo passaggio viene riutilizzato. Quando si riutilizza il passaggio, anziché inviare il processo al calcolo, i risultati dell'esecuzione precedente vengono immediatamente resi disponibili per tutti i passaggi successivi. Se si usano set di dati di Azure Machine Learning come input, il riutilizzo è determinato dal fatto che la definizione del set di dati sia stata modificata, non dal fatto che i dati sottostanti siano stati modificati. Valore predefinito: True
version	str Un tag di versione facoltativo per indicare una modifica della funzionalità per il modulo. Valore predefinito: None
hash_paths	list DEPRECATO: non più necessario. Elenco di percorsi da hash durante il controllo delle modifiche apportate al contenuto del passaggio. Se non sono state rilevate modifiche, la pipeline ririuserà il contenuto del passaggio da un'esecuzione precedente. Per impostazione predefinita, il contenuto di è hash, ad eccezione dei `source_directory` file elencati in .amlignore o .gitignore. Valore predefinito: None
use_gpu Necessario	bool Indica se l'ambiente da eseguire l'esperimento deve supportare GPU. Se True, nell'ambiente verrà usata un'immagine Docker predefinita basata su GPU. Se False, verrà usata un'immagine basata sulla CPU. Le immagini docker predefinite (CPU o GPU) verranno usate solo se il `custom_docker_image` parametro non è impostato. Questa impostazione viene usata solo nelle destinazioni di calcolo abilitate per Docker.
use_docker Necessario	bool Indica se l'ambiente da eseguire l'esperimento deve essere basato su Docker.
custom_docker_image Necessario	str Nome dell'immagine Docker da cui verrà compilata l'immagine da usare per il training. In caso contrario, un'immagine basata sulla CPU predefinita verrà usata come immagine di base.
image_registry_details Necessario	ContainerRegistry Dettagli del Registro immagini Docker.
user_managed Necessario	bool Indica se Azure ML riutilizza un ambiente Python esistente; False significa che Azure ML creerà un ambiente Python in base alla specifica delle dipendenze conda.
conda_packages Necessario	list Elenco di stringhe che rappresentano pacchetti conda da aggiungere all'ambiente Python.
pip_packages Necessario	list Elenco di stringhe che rappresentano pacchetti pip da aggiungere all'ambiente Python.
pip_requirements_file_path Necessario	str Percorso relativo del file di testo dei requisiti pip. Questo parametro può essere specificato in combinazione con il `pip_packages` parametro .
environment_definition Necessario	EnvironmentDefinition EnvironmentDefinition per l'esperimento. Include Le variabili di ambiente e PythonSection e DockerSection. Qualsiasi opzione di ambiente non esposta direttamente tramite altri parametri alla costruzione mpiStep può essere impostata usando environment_definition parametro. Se questo parametro viene specificato, avrà la precedenza su altri parametri correlati all'ambiente, ad esempio use_gpu, custom_docker_image, conda_packages o pip_packages e gli errori verranno segnalati su queste combinazioni non valide.
name Necessario	str [Obbligatorio] Nome del modulo.
source_directory Necessario	str [Obbligatorio] Cartella contenente script Python, conda env e altre risorse usate nel passaggio.
script_name Necessario	str [Obbligatorio] Nome di uno script Python relativo a `source_directory`.
arguments Necessario	list [Obbligatorio] Elenco di argomenti della riga di comando.
compute_target Necessario	<xref:azureml.core.compute.AmlComputeCompute>, str [Obbligatorio] Destinazione di calcolo da usare.
node_count Necessario	int [Obbligatorio] Numero di nodi nella destinazione di calcolo usata per il training. Se maggiore di 1, verrà eseguito il processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati.
process_count_per_node Necessario	int [Obbligatorio] Numero di processi per nodo. Se maggiore di 1, verrà eseguito il processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati.
inputs Necessario	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputAbstractDataset, DatasetConsumptionConfig]] Elenco di associazioni di porte di input.
outputs Necessario	list[Union[PipelineData, OutputDatasetConfig, PipelineOutputAbstractDataset, OutputPortBinding]] Elenco di associazioni di porte di output.
params Necessario	dict Dizionario delle coppie nome-valore registrate come variabili di ambiente con ">>AML_PARAMETER_<<".
allow_reuse Necessario	bool Indica se il passaggio deve riutilizzare i risultati precedenti quando si esegue di nuovo con gli stessi parametri rimangono invariati, l'output dell'esecuzione precedente di questo passaggio viene riutilizzato. Quando si riutilizza il passaggio, anziché inviare il processo al calcolo, i risultati dell'esecuzione precedente vengono immediatamente resi disponibili per tutti i passaggi successivi. Se si usano set di dati di Azure Machine Learning come input, il riutilizzo è determinato dal fatto che la definizione del set di dati sia stata modificata, non dal fatto che i dati sottostanti siano stati modificati.
version Necessario	str Tag di versione facoltativo per indicare una modifica della funzionalità per il modulo
hash_paths Necessario	list DEPRECATO: non più necessario. Elenco di percorsi da hash durante il controllo delle modifiche apportate al contenuto del passaggio. Se non sono state rilevate modifiche, la pipeline ririuserà il contenuto del passaggio da un'esecuzione precedente. Per impostazione predefinita, il contenuto di è hash, ad eccezione dei `source_directory` file elencati in .amlignore o .gitignore.
use_gpu Necessario	bool Indica se l'ambiente da eseguire l'esperimento deve supportare GPU. Se True, nell'ambiente verrà usata un'immagine Docker predefinita basata su GPU. Se False, verrà usata un'immagine basata sulla CPU. Le immagini docker predefinite (CPU o GPU) verranno usate solo se il `custom_docker_image` parametro non è impostato. Questa impostazione viene usata solo nelle destinazioni di calcolo abilitate per Docker.
use_docker Necessario	bool Indica se l'ambiente da eseguire l'esperimento deve essere basato su Docker. custom_docker_image (str): il nome dell'immagine docker da cui verrà usata l'immagine per il processo mpi. In caso contrario, verrà usata un'immagine predefinita basata sulla CPU come immagine di base.
custom_docker_image Necessario	str Nome dell'immagine Docker da cui verrà compilata l'immagine da usare per il training. Se non impostato, come immagine di base verrà usata un'immagine predefinita basata sulla CPU.
image_registry_details Necessario	ContainerRegistry Dettagli del registro immagini Docker.
user_managed Necessario	bool Indica se Azure ML riutilizza un ambiente Python esistente; False significa che Azure ML creerà un ambiente Python basato sulla specifica delle dipendenze conda.
conda_packages Necessario	list Elenco di stringhe che rappresentano i pacchetti conda da aggiungere all'ambiente Python.
pip_packages Necessario	list Elenco di stringhe che rappresentano i pacchetti pip da aggiungere all'ambiente Python.
pip_requirements_file_path Necessario	str Percorso relativo del file di testo dei requisiti pip. Questo parametro può essere specificato in combinazione con il `pip_packages` parametro .
environment_definition Necessario	EnvironmentDefinition EnvironmentDefinition per l'esperimento. Include PythonSection e DockerSection e variabili di ambiente. Qualsiasi opzione di ambiente non esposta direttamente tramite altri parametri alla costruzione MpiStep può essere impostata usando environment_definition parametro . Se questo parametro viene specificato, avrà la precedenza su altri parametri correlati all'ambiente, ad esempio use_gpu, custom_docker_image, conda_packages o pip_packages e gli errori verranno segnalati in queste combinazioni non valide.

Condividi tramite

MpiStep Classe

Costruttore

Parametri

Commenti e suggerimenti

Risorse aggiuntive