DML_ELEMENT_WISE_ADD1_OPERATOR_DESC结构 (directml.h)

项目
03/04/2024

将 ATensor 中的每个元素添加到 其 BTensor 中的相应元素，并将结果放入 OutputTensor 的相应元素中，以及用于融合激活的选项。

f(a, b) = FusedActivation(a + b)

融合激活运算符说明（如果提供）对输出执行给定的激活运算符。

此运算符支持就地执行，这意味着 允许 OutputTensor 在绑定期间为一个或多个输入张量添加别名。

语法

struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
  const DML_TENSOR_DESC   *ATensor;
  const DML_TENSOR_DESC   *BTensor;
  const DML_TENSOR_DESC   *OutputTensor;
  const DML_OPERATOR_DESC *FusedActivation;
};

成员

ATensor

类型： const DML_TENSOR_DESC*

包含左侧输入的张量。

BTensor

类型： const DML_TENSOR_DESC*

包含右侧输入的张量。

OutputTensor

类型： const DML_TENSOR_DESC*

要写入结果的输出张量。

FusedActivation

类型：_Maybenull_ const DML_OPERATOR_DESC*

添加后要应用的可选融合激活层。有关详细信息，请参阅使用融合运算符提高性能。

仅当输出数据类型 为FLOAT16 或 FLOAT32时，才能使用融合激活。

注解

可用性

此运算符是在中 DML_FEATURE_LEVEL_2_0引入的。

张量约束

ATensor、 BTensor 和 OutputTensor 必须具有相同的 DataType、 DimensionCount 和 Size。

张量支持

DML_FEATURE_LEVEL_3_0 及更高版本

张	种类	支持的维度计数	支持的数据类型
ATensor	输入	1 到 8	FLOAT32、FLOAT16
BTensor	输入	1 到 8	FLOAT32、FLOAT16
OutputTensor	输出	1 到 8	FLOAT32、FLOAT16

DML_FEATURE_LEVEL_2_0及更高版本

张	种类	支持的维度计数	支持的数据类型
ATensor	输入	4 到 5	FLOAT32、FLOAT16
BTensor	输入	4 到 5	FLOAT32、FLOAT16
OutputTensor	输出	4 到 5	FLOAT32、FLOAT16

要求

要求	值
最低受支持的客户端	Windows 10，版本 2004 (10.0;内部版本 19041)
最低受支持的服务器	Windows Server 版本 2004 (10.0;内部版本 19041)
标头	directml.h

另请参阅

使用融合运算符提高性能

通过

DML_ELEMENT_WISE_ADD1_OPERATOR_DESC结构 (directml.h)

语法

成员

注解

可用性

张量约束

张量支持

DML_FEATURE_LEVEL_3_0 及更高版本

DML_FEATURE_LEVEL_2_0及更高版本

要求

另请参阅

反馈

反馈

其他资源