PyTorchConfiguration 类

表示分布式 PyTorch 作业的配置信息。

此类在 RunConfiguration 类中使用。

PyTorchConfiguration 类构造函数。

继承
azureml._base_sdk_common.abstract_run_config_element._AbstractRunConfigElement
PyTorchConfiguration

构造函数

PyTorchConfiguration(communication_backend='Nccl', process_count=None, node_count=1)

参数

communication_backend
str
默认值: Nccl

用于 PyTorch 分布式培训的通信后端。 支持的后端为 "Nccl" 和 "Gloo"。 默认为 "Nccl"。

process_count
int
默认值: None

针对作用启动的进程数。 默认情况下,该值将设置为 node_count

node_count
int
默认值: 1

用于作业的节点数。