DML_CONVOLUTION_OPERATOR_DESC结构 (directml.h)

项目
02/29/2024

使用 InputTensor 执行 FilterTensor 的卷积。此运算符支持许多标准卷积配置。这些标准配置包括通过设置 “方向 ”和“ 模式 ”字段 (转置) 卷积，以及通过设置 GroupCount 字段进行深度卷积。

涉及的步骤摘要：将卷积执行到输出张量中;将偏差重塑为与输出张量相同的维度大小;将整形偏置张量添加到输出张量。

语法

struct DML_CONVOLUTION_OPERATOR_DESC {
  const DML_TENSOR_DESC     *InputTensor;
  const DML_TENSOR_DESC     *FilterTensor;
  const DML_TENSOR_DESC     *BiasTensor;
  const DML_TENSOR_DESC     *OutputTensor;
  DML_CONVOLUTION_MODE      Mode;
  DML_CONVOLUTION_DIRECTION Direction;
  UINT                      DimensionCount;
  const UINT                *Strides;
  const UINT                *Dilations;
  const UINT                *StartPadding;
  const UINT                *EndPadding;
  const UINT                *OutputPadding;
  UINT                      GroupCount;
  const DML_OPERATOR_DESC   *FusedActivation;
};

成员

InputTensor

类型： const DML_TENSOR_DESC*

包含输入数据的张量。 InputTensor 的预期维度为：

{ BatchCount, InputChannelCount, InputWidth } 对于 3D，
{ BatchCount, InputChannelCount, InputHeight, InputWidth } 对于 4D，和
{ BatchCount, InputChannelCount, InputDepth, InputHeight, InputWidth } 用于 5D。

FilterTensor

类型： const DML_TENSOR_DESC*

包含筛选器数据的张量。 FilterTensor 的预期维度为：

{ FilterBatchCount, FilterChannelCount, FilterWidth } 对于 3D，
{ FilterBatchCount, FilterChannelCount, FilterHeight, FilterWidth } 对于 4D，和
{ FilterBatchCount, FilterChannelCount, FilterDepth, FilterHeight, FilterWidth } 用于 5D。

BiasTensor

类型：_Maybenull_ const DML_TENSOR_DESC*

包含偏差数据的可选张量。偏置张量是一个张量，其中包含在卷积结束时通过输出张量广播的数据，该卷积将添加到结果中。 BiasTensor 的预期维度为：

{ 1, OutputChannelCount, 1 } 对于 3D，
{ 1, OutputChannelCount, 1, 1 } 对于 4D，和
{ 1, OutputChannelCount, 1, 1, 1 } 用于 5D。

对于每个输出通道，该通道的单个偏差值将添加到 OutputTensor 的该通道中的每个元素中。也就是说， BiasTensor 广播为 OutputTensor 的大小，运算符返回的是此广播的 BiasTensor 与卷积的结果的总和。

OutputTensor

类型： const DML_TENSOR_DESC*

要写入结果的张量。 OutputTensor 的预期维度为：

{ BatchCount, OutputChannelCount, OutputWidth } 对于 3D，
{ BatchCount, OutputChannelCount, OutputHeight, OutputWidth } 对于 4D，和
{ BatchCount, OutputChannelCount, OutputDepth, OutputHeight, OutputWidth } 用于 5D。

Mode

类型： DML_CONVOLUTION_MODE

要用于卷积操作的模式。 DML_CONVOLUTION_MODE_CROSS_CORRELATION 是典型推理方案所需的行为。相比之下， DML_CONVOLUTION_MODE_CONVOLUTION 在每个空间维度上翻转每个筛选器内核中的元素顺序。

Direction

类型： DML_CONVOLUTION_DIRECTION

卷积运算的方向。 DML_CONVOLUTION_DIRECTION_FORWARD 是用于推理的主要卷积形式，在训练期间使用 DML_CONVOLUTION_DIRECTION_FORWARD 和 DML_CONVOLUTION_DIRECTION_BACKWARD 的组合。

DimensionCount

类型： UINT

卷积运算的空间维度数。空间维度是卷积 FilterTensor 的较低维度。例如，宽度和高度维度是 4D 卷积筛选器张量的空间维度。此值还确定 Strides、 Dilations、 StartPadding、 EndPadding 和 OutputPadding 数组的大小。 当 InputTensor.DimensionCount 为 4 时，它应设置为 2，当 InputTensor.DimensionCount 为 5 时应设置为 3。

Strides