Partilhar via


MpiStep Classe

Cria um passo de pipeline do Azure ML para executar uma tarefa de MPI.

Para obter um exemplo de utilização de MpiStep, consulte o bloco de notas https://aka.ms/pl-style-trans.

Crie um passo do pipeline do Azure ML para executar uma tarefa de MPI.

PRETERIDO. Em vez disso, utilize o CommandStep . Para obter um exemplo, veja Como executar a preparação distribuída em pipelines com CommandStep.

Herança

Construtor

MpiStep(name=None, source_directory=None, script_name=None, arguments=None, compute_target=None, node_count=None, process_count_per_node=None, inputs=None, outputs=None, allow_reuse=True, version=None, hash_paths=None, **kwargs)

Parâmetros

Name Description
name
str

[Obrigatório] O nome do módulo.

valor predefinido: None
source_directory
str

[Obrigatório] Uma pasta que contém script python, env conda e outros recursos utilizados no passo.

valor predefinido: None
script_name
str

[Obrigatório] O nome de um script python relativo a source_directory.

valor predefinido: None
arguments

[Obrigatório] Uma lista de argumentos da linha de comandos.

valor predefinido: None
compute_target

[Obrigatório] Um destino de computação a utilizar.

valor predefinido: None
node_count
int

[Obrigatório] O número de nós no destino de computação utilizado para a preparação. Se for superior a 1, será executada uma tarefa distribuída por mpi. Apenas o destino de computação AmlCompute é suportado para tarefas distribuídas. Os valores pipelineParameter são suportados.

valor predefinido: None
process_count_per_node
int

[Obrigatório] O número de processos por nó. Se for superior a 1, será executada uma tarefa distribuída por mpi. Apenas o destino de computação AmlCompute é suportado para tarefas distribuídas. Os valores pipelineParameter são suportados.

valor predefinido: None
inputs

Uma lista de enlaces de porta de entrada.

valor predefinido: None
outputs

Uma lista de enlaces de portas de saída.

valor predefinido: None
params
Necessário

Um dicionário de pares name-value registados como variáveis de ambiente com "AML_PARAMETER_".

allow_reuse

Indica se o passo deve reutilizar os resultados anteriores ao executar novamente com as mesmas definições. A reutilização está ativada por predefinição. Se o conteúdo do passo (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, o resultado da execução anterior deste passo será reutilizado. Ao reutilizar o passo, em vez de submeter a tarefa para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer passos subsequentes. Se utilizar conjuntos de dados do Azure Machine Learning como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada e não se os dados subjacentes foram alterados.

valor predefinido: True
version
str

Uma etiqueta de versão opcional para denotar uma alteração na funcionalidade do módulo.

valor predefinido: None
hash_paths

PRETERIDO: já não é necessário.

Uma lista de caminhos para hash ao verificar se existem alterações nos conteúdos do passo. Se não forem detetadas alterações, o pipeline reutilizará o conteúdo do passo de uma execução anterior. Por predefinição, os conteúdos de source_directory são transformados em hash, à exceção dos ficheiros listados em .amlignoree ou .gitignore.

valor predefinido: None
use_gpu
Necessário

Indica se o ambiente para executar a experimentação deve suportar GPUs. Se For Verdadeiro, será utilizada uma imagem predefinida do Docker baseada em GPU no ambiente. Se For Falso, será utilizada uma imagem baseada na CPU. As imagens predefinidas do docker (CPU ou GPU) só serão utilizadas se o custom_docker_image parâmetro não estiver definido. Esta definição é utilizada apenas em destinos de computação ativados pelo Docker.

use_docker
Necessário

Indica se o ambiente para executar a experimentação deve ser baseado no Docker.

custom_docker_image
Necessário
str

Será criado o nome da imagem do Docker a partir da qual será criada a imagem a utilizar para preparação. Se não estiver definida, será utilizada uma imagem baseada na CPU predefinida como imagem base.

image_registry_details
Necessário

Os detalhes do registo de imagens do Docker.

user_managed
Necessário

Indica se o Azure ML reutiliza um ambiente Python existente; Falso significa que o Azure ML irá criar um ambiente Python com base na especificação de dependências de conda.

conda_packages
Necessário

Uma lista de cadeias que representam pacotes conda a serem adicionados ao ambiente python.

pip_packages
Necessário

Uma lista de cadeias que representam pacotes pip a serem adicionados ao ambiente python.

pip_requirements_file_path
Necessário
str

O caminho relativo para o ficheiro de texto dos requisitos do pip. Este parâmetro pode ser especificado em combinação com o pip_packages parâmetro .

environment_definition
Necessário

EnvironmentDefinition para a experimentação. Inclui PythonSection e DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente através de outros parâmetros para a construção MpiStep pode ser definida com environment_definition parâmetro. Se este parâmetro for especificado, terá precedência sobre outros parâmetros relacionados com o ambiente, como use_gpu, custom_docker_image, conda_packages ou pip_packages e serão comunicados erros nestas combinações inválidas.

name
Necessário
str

[Obrigatório] O nome do módulo.

source_directory
Necessário
str

[Obrigatório] Uma pasta que contém script python, env conda e outros recursos utilizados no passo.

script_name
Necessário
str

[Obrigatório] O nome de um script python relativo a source_directory.

arguments
Necessário

[Obrigatório] Uma lista de argumentos da linha de comandos.

compute_target
Necessário
<xref:azureml.core.compute.AmlComputeCompute>, str

[Obrigatório] Um destino de computação a utilizar.

node_count
Necessário
int

[Obrigatório] Número de nós no destino de computação utilizado para preparação. Se for superior a 1, a tarefa distribuída por mpi será executada. Apenas o destino de computação AmlCompute é suportado para tarefas distribuídas. Os valores pipelineParameter são suportados.

process_count_per_node
Necessário
int

[Obrigatório] Número de processos por nó. Se for superior a 1, a tarefa distribuída por mpi será executada. Apenas o destino de computação AmlCompute é suportado para tarefas distribuídas. Os valores pipelineParameter são suportados.

inputs
Necessário

Uma lista de enlaces de porta de entrada.

outputs
Necessário

Uma lista de enlaces de portas de saída.

params
Necessário

Um dicionário de pares name-value registados como variáveis de ambiente com ">>AML_PARAMETER_<<".

allow_reuse
Necessário

Indica se o passo deve reutilizar os resultados anteriores quando a nova execução com os mesmos parâmetros permanece inalterada, o resultado da execução anterior deste passo é reutilizado. Ao reutilizar o passo, em vez de submeter a tarefa para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer passos subsequentes. Se utilizar conjuntos de dados do Azure Machine Learning como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada e não se os dados subjacentes foram alterados.

version
Necessário
str

Etiqueta de versão opcional para denotar uma alteração na funcionalidade do módulo

hash_paths
Necessário

PRETERIDO: já não é necessário.

Uma lista de caminhos para hash ao verificar se existem alterações nos conteúdos do passo. Se não forem detetadas alterações, o pipeline reutilizará o conteúdo do passo de uma execução anterior. Por predefinição, os conteúdos de source_directory são transformados em hash, à exceção dos ficheiros listados em .amlignoree ou .gitignore.

use_gpu
Necessário

Indica se o ambiente para executar a experimentação deve suportar GPUs. Se For Verdadeiro, será utilizada uma imagem predefinida do Docker baseada em GPU no ambiente. Se For Falso, será utilizada uma imagem baseada na CPU. As imagens predefinidas do docker (CPU ou GPU) só serão utilizadas se o custom_docker_image parâmetro não estiver definido. Esta definição é utilizada apenas em destinos de computação ativados pelo Docker.

use_docker
Necessário

Indica se o ambiente para executar a experimentação deve ser baseado no Docker. custom_docker_image (str): o nome da imagem do docker a partir da qual será criada a imagem a utilizar para a tarefa mpi. Se não estiver definida, será utilizada uma imagem baseada na CPU predefinida como imagem base.

custom_docker_image
Necessário
str

Será criado o nome da imagem do Docker a partir da qual será criada a imagem a utilizar para preparação. Se não for definida, será utilizada uma imagem baseada na CPU predefinida como imagem de base.

image_registry_details
Necessário

Os detalhes do registo de imagens do Docker.

user_managed
Necessário

Indica se o Azure ML reutiliza um ambiente Python existente; Falso significa que o Azure ML criará um ambiente Python com base na especificação das dependências conda.

conda_packages
Necessário

Uma lista de cadeias que representam pacotes conda a serem adicionados ao ambiente Python.

pip_packages
Necessário

Uma lista de cadeias que representam pacotes pip a serem adicionados ao ambiente Python.

pip_requirements_file_path
Necessário
str

O caminho relativo para o ficheiro de texto dos requisitos do pip. Este parâmetro pode ser especificado em combinação com o pip_packages parâmetro .

environment_definition
Necessário

A EnvironmentDefinition para a experimentação. Inclui PythonSection e DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente através de outros parâmetros para a construção MpiStep pode ser definida com environment_definition parâmetro. Se este parâmetro for especificado, terá precedência sobre outros parâmetros relacionados com o ambiente, como use_gpu, custom_docker_image, conda_packages ou pip_packages e serão comunicados erros nestas combinações inválidas.