MpiStep Classe
Crea un passaggio della pipeline di Azure ML per eseguire un processo MPI.
Per un esempio di uso di MpiStep, vedere il notebook https://aka.ms/pl-style-trans.
Creare un passaggio della pipeline di Azure ML per eseguire un processo MPI.
DEPRECATO. Usare invece .CommandStep Per un esempio, vedere Come eseguire il training distribuito nelle pipeline con CommandStep.
- Ereditarietà
-
MpiStep
Costruttore
MpiStep(name=None, source_directory=None, script_name=None, arguments=None, compute_target=None, node_count=None, process_count_per_node=None, inputs=None, outputs=None, allow_reuse=True, version=None, hash_paths=None, **kwargs)
Parametri
Nome | Descrizione |
---|---|
name
|
[Obbligatorio] Nome del modulo. Valore predefinito: None
|
source_directory
|
[Obbligatorio] Cartella contenente script Python, conda env e altre risorse usate nel passaggio. Valore predefinito: None
|
script_name
|
[Obbligatorio] Nome di uno script Python relativo a Valore predefinito: None
|
arguments
|
[Obbligatorio] Elenco di argomenti della riga di comando. Valore predefinito: None
|
compute_target
|
[Obbligatorio] Destinazione di calcolo da usare. Valore predefinito: None
|
node_count
|
[Obbligatorio] Numero di nodi nella destinazione di calcolo usata per il training. Se maggiore di 1, verrà eseguito un processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati. Valore predefinito: None
|
process_count_per_node
|
[Obbligatorio] Numero di processi per nodo. Se maggiore di 1, verrà eseguito un processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati. Valore predefinito: None
|
inputs
|
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputAbstractDataset, DatasetConsumptionConfig]]
Elenco di associazioni di porte di input. Valore predefinito: None
|
outputs
|
Elenco di associazioni di porte di output. Valore predefinito: None
|
params
Necessario
|
Dizionario delle coppie nome-valore registrate come variabili di ambiente con "AML_PARAMETER_". |
allow_reuse
|
Indica se il passaggio deve riutilizzare i risultati precedenti quando si esegue di nuovo con le stesse impostazioni. Il riutilizzo è abilitato per impostazione predefinita. Se il contenuto del passaggio (script/dipendenze) e gli input e i parametri rimangono invariati, l'output dell'esecuzione precedente di questo passaggio viene riutilizzato. Quando si riutilizza il passaggio, anziché inviare il processo al calcolo, i risultati dell'esecuzione precedente vengono immediatamente resi disponibili per tutti i passaggi successivi. Se si usano set di dati di Azure Machine Learning come input, il riutilizzo è determinato dal fatto che la definizione del set di dati sia stata modificata, non dal fatto che i dati sottostanti siano stati modificati. Valore predefinito: True
|
version
|
Un tag di versione facoltativo per indicare una modifica della funzionalità per il modulo. Valore predefinito: None
|
hash_paths
|
DEPRECATO: non più necessario. Elenco di percorsi da hash durante il controllo delle modifiche apportate al contenuto del passaggio. Se non sono state rilevate modifiche, la pipeline ririuserà il contenuto del passaggio da un'esecuzione precedente. Per impostazione predefinita, il contenuto di è hash, ad eccezione dei Valore predefinito: None
|
use_gpu
Necessario
|
Indica se l'ambiente da eseguire l'esperimento deve supportare GPU.
Se True, nell'ambiente verrà usata un'immagine Docker predefinita basata su GPU. Se False, verrà usata un'immagine basata sulla CPU. Le immagini docker predefinite (CPU o GPU) verranno usate solo se il |
use_docker
Necessario
|
Indica se l'ambiente da eseguire l'esperimento deve essere basato su Docker. |
custom_docker_image
Necessario
|
Nome dell'immagine Docker da cui verrà compilata l'immagine da usare per il training. In caso contrario, un'immagine basata sulla CPU predefinita verrà usata come immagine di base. |
image_registry_details
Necessario
|
Dettagli del Registro immagini Docker. |
user_managed
Necessario
|
Indica se Azure ML riutilizza un ambiente Python esistente; False significa che Azure ML creerà un ambiente Python in base alla specifica delle dipendenze conda. |
conda_packages
Necessario
|
Elenco di stringhe che rappresentano pacchetti conda da aggiungere all'ambiente Python. |
pip_packages
Necessario
|
Elenco di stringhe che rappresentano pacchetti pip da aggiungere all'ambiente Python. |
pip_requirements_file_path
Necessario
|
Percorso relativo del file di testo dei requisiti pip.
Questo parametro può essere specificato in combinazione con il |
environment_definition
Necessario
|
EnvironmentDefinition per l'esperimento. Include Le variabili di ambiente e PythonSection e DockerSection. Qualsiasi opzione di ambiente non esposta direttamente tramite altri parametri alla costruzione mpiStep può essere impostata usando environment_definition parametro. Se questo parametro viene specificato, avrà la precedenza su altri parametri correlati all'ambiente, ad esempio use_gpu, custom_docker_image, conda_packages o pip_packages e gli errori verranno segnalati su queste combinazioni non valide. |
name
Necessario
|
[Obbligatorio] Nome del modulo. |
source_directory
Necessario
|
[Obbligatorio] Cartella contenente script Python, conda env e altre risorse usate nel passaggio. |
script_name
Necessario
|
[Obbligatorio] Nome di uno script Python relativo a |
arguments
Necessario
|
[Obbligatorio] Elenco di argomenti della riga di comando. |
compute_target
Necessario
|
<xref:azureml.core.compute.AmlComputeCompute>, str
[Obbligatorio] Destinazione di calcolo da usare. |
node_count
Necessario
|
[Obbligatorio] Numero di nodi nella destinazione di calcolo usata per il training. Se maggiore di 1, verrà eseguito il processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati. |
process_count_per_node
Necessario
|
[Obbligatorio] Numero di processi per nodo. Se maggiore di 1, verrà eseguito il processo distribuito mpi. Solo la destinazione di calcolo AmlCompute è supportata per i processi distribuiti. I valori pipelineParameter sono supportati. |
inputs
Necessario
|
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputAbstractDataset, DatasetConsumptionConfig]]
Elenco di associazioni di porte di input. |
outputs
Necessario
|
Elenco di associazioni di porte di output. |
params
Necessario
|
Dizionario delle coppie nome-valore registrate come variabili di ambiente con ">>AML_PARAMETER_<<". |
allow_reuse
Necessario
|
Indica se il passaggio deve riutilizzare i risultati precedenti quando si esegue di nuovo con gli stessi parametri rimangono invariati, l'output dell'esecuzione precedente di questo passaggio viene riutilizzato. Quando si riutilizza il passaggio, anziché inviare il processo al calcolo, i risultati dell'esecuzione precedente vengono immediatamente resi disponibili per tutti i passaggi successivi. Se si usano set di dati di Azure Machine Learning come input, il riutilizzo è determinato dal fatto che la definizione del set di dati sia stata modificata, non dal fatto che i dati sottostanti siano stati modificati. |
version
Necessario
|
Tag di versione facoltativo per indicare una modifica della funzionalità per il modulo |
hash_paths
Necessario
|
DEPRECATO: non più necessario. Elenco di percorsi da hash durante il controllo delle modifiche apportate al contenuto del passaggio. Se non sono state rilevate modifiche, la pipeline ririuserà il contenuto del passaggio da un'esecuzione precedente. Per impostazione predefinita, il contenuto di è hash, ad eccezione dei |
use_gpu
Necessario
|
Indica se l'ambiente da eseguire l'esperimento deve supportare GPU.
Se True, nell'ambiente verrà usata un'immagine Docker predefinita basata su GPU. Se False, verrà usata un'immagine basata sulla CPU. Le immagini docker predefinite (CPU o GPU) verranno usate solo se il |
use_docker
Necessario
|
Indica se l'ambiente da eseguire l'esperimento deve essere basato su Docker. custom_docker_image (str): il nome dell'immagine docker da cui verrà usata l'immagine per il processo mpi. In caso contrario, verrà usata un'immagine predefinita basata sulla CPU come immagine di base. |
custom_docker_image
Necessario
|
Nome dell'immagine Docker da cui verrà compilata l'immagine da usare per il training. In caso contrario, un'immagine basata sulla CPU predefinita verrà usata come immagine di base. |
image_registry_details
Necessario
|
Dettagli del Registro immagini Docker. |
user_managed
Necessario
|
Indica se Azure ML riutilizza un ambiente Python esistente; False significa che Azure ML creerà un ambiente Python in base alla specifica delle dipendenze conda. |
conda_packages
Necessario
|
Elenco di stringhe che rappresentano pacchetti conda da aggiungere all'ambiente Python. |
pip_packages
Necessario
|
Elenco di stringhe che rappresentano pacchetti pip da aggiungere all'ambiente Python. |
pip_requirements_file_path
Necessario
|
Percorso relativo del file di testo dei requisiti pip.
Questo parametro può essere specificato in combinazione con il |
environment_definition
Necessario
|
EnvironmentDefinition per l'esperimento. Include PythonSection e DockerSection e variabili di ambiente. Qualsiasi opzione di ambiente non esposta direttamente tramite altri parametri alla costruzione MpiStep può essere impostata usando environment_definition parametro . Se questo parametro viene specificato, avrà la precedenza su altri parametri correlati all'ambiente, ad esempio use_gpu, custom_docker_image, conda_packages o pip_packages e gli errori verranno segnalati in queste combinazioni non valide. |