Condividi tramite


MpiStep Classe

Crea un passaggio della pipeline di Azure ML per eseguire un processo MPI.

Per un esempio di uso di MpiStep, vedere il notebook https://aka.ms/pl-style-trans.

Creare un passaggio della pipeline di Azure ML per eseguire un processo MPI.

DEPRECATO. Usare invece .CommandStep Per un esempio, vedere Come eseguire il training distribuito nelle pipeline con CommandStep.

Ereditarietà

Costruttore

MpiStep(name=None, source_directory=None, script_name=None, arguments=None, compute_target=None, node_count=None, process_count_per_node=None, inputs=None, outputs=None, allow_reuse=True, version=None, hash_paths=None, **kwargs)

Parametri

Nome Descrizione
name
str

[Obbligatorio] Nome del modulo.

Valore predefinito: None
source_directory
str

[Obbligatorio] Cartella contenente script Python, conda env e altre risorse usate nel passaggio.

Valore predefinito: None
script_name
str

[Obbligatorio] Nome di uno script Python relativo a source_directory.

Valore predefinito: None
arguments

[Obbligatorio] Elenco di argomenti della riga di comando.

Valore predefinito: None
compute_target

[Obbligatorio] Destinazione di calcolo da usare.

Valore predefinito: None
node_count
int

[Obbligatorio] Numero di nodi nella destinazione di calcolo usata per il training. Se maggiore di 1, verrà eseguito un processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati.

Valore predefinito: None
process_count_per_node
int

[Obbligatorio] Numero di processi per nodo. Se maggiore di 1, verrà eseguito un processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati.

Valore predefinito: None
inputs

Elenco di associazioni di porte di input.

Valore predefinito: None
outputs

Elenco di associazioni di porte di output.

Valore predefinito: None
params
Necessario

Dizionario delle coppie nome-valore registrate come variabili di ambiente con "AML_PARAMETER_".

allow_reuse

Indica se il passaggio deve riutilizzare i risultati precedenti quando si esegue di nuovo con le stesse impostazioni. Il riutilizzo è abilitato per impostazione predefinita. Se il contenuto del passaggio (script/dipendenze) e gli input e i parametri rimangono invariati, l'output dell'esecuzione precedente di questo passaggio viene riutilizzato. Quando si riutilizza il passaggio, anziché inviare il processo al calcolo, i risultati dell'esecuzione precedente vengono immediatamente resi disponibili per tutti i passaggi successivi. Se si usano set di dati di Azure Machine Learning come input, il riutilizzo è determinato dal fatto che la definizione del set di dati sia stata modificata, non dal fatto che i dati sottostanti siano stati modificati.

Valore predefinito: True
version
str

Un tag di versione facoltativo per indicare una modifica della funzionalità per il modulo.

Valore predefinito: None
hash_paths

DEPRECATO: non più necessario.

Elenco di percorsi da hash durante il controllo delle modifiche apportate al contenuto del passaggio. Se non sono state rilevate modifiche, la pipeline ririuserà il contenuto del passaggio da un'esecuzione precedente. Per impostazione predefinita, il contenuto di è hash, ad eccezione dei source_directory file elencati in .amlignore o .gitignore.

Valore predefinito: None
use_gpu
Necessario

Indica se l'ambiente da eseguire l'esperimento deve supportare GPU. Se True, nell'ambiente verrà usata un'immagine Docker predefinita basata su GPU. Se False, verrà usata un'immagine basata sulla CPU. Le immagini docker predefinite (CPU o GPU) verranno usate solo se il custom_docker_image parametro non è impostato. Questa impostazione viene usata solo nelle destinazioni di calcolo abilitate per Docker.

use_docker
Necessario

Indica se l'ambiente da eseguire l'esperimento deve essere basato su Docker.

custom_docker_image
Necessario
str

Nome dell'immagine Docker da cui verrà compilata l'immagine da usare per il training. In caso contrario, un'immagine basata sulla CPU predefinita verrà usata come immagine di base.

image_registry_details
Necessario

Dettagli del Registro immagini Docker.

user_managed
Necessario

Indica se Azure ML riutilizza un ambiente Python esistente; False significa che Azure ML creerà un ambiente Python in base alla specifica delle dipendenze conda.

conda_packages
Necessario

Elenco di stringhe che rappresentano pacchetti conda da aggiungere all'ambiente Python.

pip_packages
Necessario

Elenco di stringhe che rappresentano pacchetti pip da aggiungere all'ambiente Python.

pip_requirements_file_path
Necessario
str

Percorso relativo del file di testo dei requisiti pip. Questo parametro può essere specificato in combinazione con il pip_packages parametro .

environment_definition
Necessario

EnvironmentDefinition per l'esperimento. Include Le variabili di ambiente e PythonSection e DockerSection. Qualsiasi opzione di ambiente non esposta direttamente tramite altri parametri alla costruzione mpiStep può essere impostata usando environment_definition parametro. Se questo parametro viene specificato, avrà la precedenza su altri parametri correlati all'ambiente, ad esempio use_gpu, custom_docker_image, conda_packages o pip_packages e gli errori verranno segnalati su queste combinazioni non valide.

name
Necessario
str

[Obbligatorio] Nome del modulo.

source_directory
Necessario
str

[Obbligatorio] Cartella contenente script Python, conda env e altre risorse usate nel passaggio.

script_name
Necessario
str

[Obbligatorio] Nome di uno script Python relativo a source_directory.

arguments
Necessario

[Obbligatorio] Elenco di argomenti della riga di comando.

compute_target
Necessario
<xref:azureml.core.compute.AmlComputeCompute>, str

[Obbligatorio] Destinazione di calcolo da usare.

node_count
Necessario
int

[Obbligatorio] Numero di nodi nella destinazione di calcolo usata per il training. Se maggiore di 1, verrà eseguito il processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati.

process_count_per_node
Necessario
int

[Obbligatorio] Numero di processi per nodo. Se maggiore di 1, verrà eseguito il processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati.

inputs
Necessario

Elenco di associazioni di porte di input.

outputs
Necessario

Elenco di associazioni di porte di output.

params
Necessario

Dizionario delle coppie nome-valore registrate come variabili di ambiente con ">>AML_PARAMETER_<<".

allow_reuse
Necessario

Indica se il passaggio deve riutilizzare i risultati precedenti quando si esegue di nuovo con gli stessi parametri rimangono invariati, l'output dell'esecuzione precedente di questo passaggio viene riutilizzato. Quando si riutilizza il passaggio, anziché inviare il processo al calcolo, i risultati dell'esecuzione precedente vengono immediatamente resi disponibili per tutti i passaggi successivi. Se si usano set di dati di Azure Machine Learning come input, il riutilizzo è determinato dal fatto che la definizione del set di dati sia stata modificata, non dal fatto che i dati sottostanti siano stati modificati.

version
Necessario
str

Tag di versione facoltativo per indicare una modifica della funzionalità per il modulo

hash_paths
Necessario

DEPRECATO: non più necessario.

Elenco di percorsi da hash durante il controllo delle modifiche apportate al contenuto del passaggio. Se non sono state rilevate modifiche, la pipeline ririuserà il contenuto del passaggio da un'esecuzione precedente. Per impostazione predefinita, il contenuto di è hash, ad eccezione dei source_directory file elencati in .amlignore o .gitignore.

use_gpu
Necessario

Indica se l'ambiente da eseguire l'esperimento deve supportare GPU. Se True, nell'ambiente verrà usata un'immagine Docker predefinita basata su GPU. Se False, verrà usata un'immagine basata sulla CPU. Le immagini docker predefinite (CPU o GPU) verranno usate solo se il custom_docker_image parametro non è impostato. Questa impostazione viene usata solo nelle destinazioni di calcolo abilitate per Docker.

use_docker
Necessario

Indica se l'ambiente da eseguire l'esperimento deve essere basato su Docker. custom_docker_image (str): il nome dell'immagine docker da cui verrà usata l'immagine per il processo mpi. In caso contrario, verrà usata un'immagine predefinita basata sulla CPU come immagine di base.

custom_docker_image
Necessario
str

Nome dell'immagine Docker da cui verrà compilata l'immagine da usare per il training. In caso contrario, un'immagine basata sulla CPU predefinita verrà usata come immagine di base.

image_registry_details
Necessario

Dettagli del Registro immagini Docker.

user_managed
Necessario

Indica se Azure ML riutilizza un ambiente Python esistente; False significa che Azure ML creerà un ambiente Python in base alla specifica delle dipendenze conda.

conda_packages
Necessario

Elenco di stringhe che rappresentano pacchetti conda da aggiungere all'ambiente Python.

pip_packages
Necessario

Elenco di stringhe che rappresentano pacchetti pip da aggiungere all'ambiente Python.

pip_requirements_file_path
Necessario
str

Percorso relativo del file di testo dei requisiti pip. Questo parametro può essere specificato in combinazione con il pip_packages parametro .

environment_definition
Necessario

EnvironmentDefinition per l'esperimento. Include PythonSection e DockerSection e variabili di ambiente. Qualsiasi opzione di ambiente non esposta direttamente tramite altri parametri alla costruzione MpiStep può essere impostata usando environment_definition parametro . Se questo parametro viene specificato, avrà la precedenza su altri parametri correlati all'ambiente, ad esempio use_gpu, custom_docker_image, conda_packages o pip_packages e gli errori verranno segnalati in queste combinazioni non valide.