DML_ELEMENT_WISE_ADD1_OPERATOR_DESC结构 (directml.h)

ATensor 中的每个元素添加到 其 BTensor 中的相应元素,并将结果放入 OutputTensor 的相应元素中,以及用于融合激活的选项。

f(a, b) = FusedActivation(a + b)

融合激活运算符说明(如果提供)对输出执行给定的激活运算符。

此运算符支持就地执行,这意味着 允许 OutputTensor 在绑定期间为一个或多个输入张量添加别名。

语法

struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
  const DML_TENSOR_DESC   *ATensor;
  const DML_TENSOR_DESC   *BTensor;
  const DML_TENSOR_DESC   *OutputTensor;
  const DML_OPERATOR_DESC *FusedActivation;
};

成员

ATensor

类型: const DML_TENSOR_DESC*

包含左侧输入的张量。

BTensor

类型: const DML_TENSOR_DESC*

包含右侧输入的张量。

OutputTensor

类型: const DML_TENSOR_DESC*

要写入结果的输出张量。

FusedActivation

类型:_Maybenull_ const DML_OPERATOR_DESC*

添加后要应用的可选融合激活层。 有关详细信息,请参阅 使用融合运算符提高性能

仅当输出数据类型 为FLOAT16FLOAT32时,才能使用融合激活。

注解

可用性

此运算符是在 中 DML_FEATURE_LEVEL_2_0引入的。

张量约束

ATensorBTensorOutputTensor 必须具有相同的 DataTypeDimensionCountSize

张量支持

DML_FEATURE_LEVEL_3_0 及更高版本

种类 支持的维度计数 支持的数据类型
ATensor 输入 1 到 8 FLOAT32、FLOAT16
BTensor 输入 1 到 8 FLOAT32、FLOAT16
OutputTensor 输出 1 到 8 FLOAT32、FLOAT16

DML_FEATURE_LEVEL_2_0及更高版本

种类 支持的维度计数 支持的数据类型
ATensor 输入 4 到 5 FLOAT32、FLOAT16
BTensor 输入 4 到 5 FLOAT32、FLOAT16
OutputTensor 输出 4 到 5 FLOAT32、FLOAT16

要求

要求
最低受支持的客户端 Windows 10,版本 2004 (10.0;内部版本 19041)
最低受支持的服务器 Windows Server 版本 2004 (10.0;内部版本 19041)
标头 directml.h

另请参阅