DirectML

项目
2024/11/13

DirectML 技术概述。

若要开发 DirectML，需要以下标头：

directml.h

有关此技术的编程指南，请参阅：

DirectML

枚举


DML_AXIS_DIRECTION 定义常量，该常量指定运算符沿给定轴的操作方向（例如，求和、选择 top-k 元素、选择最小元素）。
DML_BINDING_TYPE 定义一个常量，该常量指定绑定说明（DML_BINDING_DESC结构）引用的资源的性质。
DML_CONVOLUTION_DIRECTION 定义指定 DirectML 卷积运算符的方向的常量（如DML_CONVOLUTION_OPERATOR_DESC结构所述）。
DML_CONVOLUTION_MODE 定义为 DirectML 卷积运算符指定模式的常量（如DML_CONVOLUTION_OPERATOR_DESC结构所述）。
DML_CREATE_DEVICE_FLAGS 向 DMLCreateDevice 提供其他设备创建选项。值可以按位 OR 组合在一起。
DML_DEPTH_SPACE_ORDER 定义控制 DirectML 运算符中应用的转换 DML_OPERATOR_DEPTH_TO_SPACE1 和 DML_OPERATOR_SPACE_TO_DEPTH1的常量。
DML_EXECUTION_FLAGS 向 DirectML 提供用于控制运算符执行的选项。这些标志可以按位 OR 一起指定多个标志。
DML_FEATURE 定义一组可从 DirectML 设备查询的可选特性和功能。
DML_FEATURE_LEVEL 定义指定 DirectML 功能级别的常量。功能级别定义 DirectML 支持的广泛功能伞。
DML_GRAPH_EDGE_TYPE 定义指定图形边缘类型的常量。有关此枚举的用法，请参阅 DML_GRAPH_EDGE_DESC。
DML_GRAPH_NODE_TYPE 定义指定图形节点类型的常量。有关此枚举的用法，请参阅 DML_GRAPH_NODE_DESC。
DML_INTERPOLATION_MODE 定义为 DirectML upsample 2-D 运算符指定模式的常量（如DML_UPSAMPLE_2D_OPERATOR_DESC结构所述）。
DML_IS_INFINITY_MODE 定义指定无穷大符号的常量。
DML_MATRIX_TRANSFORM 定义指定要应用于 DirectML 张量矩阵转换的常量。
DML_OPERATOR_TYPE 定义运算符说明的类型。
DML_PADDING_MODE 定义为 DirectML pad 运算符指定模式的常量（如DML_PADDING_OPERATOR_DESC结构所述）。
DML_RANDOM_GENERATOR_TYPE 定义指定随机随机数生成器类型的常量。
DML_RECURRENT_NETWORK_DIRECTION 定义指定循环 DirectML 运算符的方向的常量。
DML_REDUCE_FUNCTION 定义常量，该常量指定要用于 DirectML 化简运算符的特定缩减算法（如DML_REDUCE_OPERATOR_DESC结构所述）。
DML_ROUNDING_MODE 定义指定舍入模式的常量。
DML_TENSOR_DATA_TYPE 指定张量中的值的数据类型。 DirectML 运算符可能不支持所有数据类型;请参阅每个特定运算符的文档，查找它支持的数据类型。
DML_TENSOR_FLAGS 指定张量说明中的其他选项。值可以按位 OR 组合在一起。
DML_TENSOR_TYPE 标识张量描述的类型。

功能


BindInputs 将一组资源绑定为输入张量。
BindOutputs 将一组资源绑定为输出张量。
BindPersistentResource 将缓冲区绑定为永久性资源。可以通过调用 IDMLDispatchable：：GetBindingProperties 来确定此缓冲区范围的所需大小。
BindTemporaryResource 绑定缓冲区以用作临时暂存内存。可以通过调用 IDMLDispatchable：：GetBindingProperties 来确定此缓冲区范围的所需大小。
CheckFeatureSupport 获取有关 DirectML 设备支持的可选特性和功能的信息。
CompileGraph 将 DirectML 运算符的图形编译为可以调度到 GPU 的对象。
CompileOperator 将运算符编译为可调度到 GPU 的对象。
CreateBindingTable 创建一个绑定表，该表是可用于将资源（如张量）绑定到管道的对象。
CreateCommandRecorder 创建 DirectML 命令记录器。
CreateOperator 创建 DirectML 运算符。
CreateOperatorInitializer 创建可用于初始化已编译运算符的对象。
DMLCreateDevice 为给定的 Direct3D 12 设备创建 DirectML 设备。（DMLCreateDevice）
DMLCreateDevice1 为给定的 Direct3D 12 设备创建 DirectML 设备。（DMLCreateDevice1）
逐出从 GPU 内存中逐出一个或多个可分页对象。另请参阅 IDMLDevice：：MakeResident。
GetBindingProperties 检索可调度对象的绑定属性（运算符初始值设定项或已编译运算符）。
GetDevice 检索用于创建此对象的 DirectML 设备。
GetDeviceRemovedReason 检索 DirectML 设备被删除的原因。
GetParentDevice 检索用于创建此 DirectML 设备的 Direct3D 12 设备。
GetPrivateData 从 DirectML 设备对象获取应用程序定义的数据。
MakeResident 导致一个或多个可分页对象驻留在 GPU 内存中。另请参阅 IDMLDevice：：Evict。
RecordDispatch 将可调度对象（运算符初始值设定项或已编译运算符）的执行记录到命令列表中。
重置重置绑定表以包装新的描述符范围，可能适用于其他运算符或初始值设定项。这允许动态重用绑定表。
重置重置初始值设定项以处理新运算符集的初始化。
SetMuteDebugOutput 确定是否将 DirectML 从向 ID3D12InfoQueue 发送消息静音。
SetName 将名称与 DirectML 设备对象相关联。此名称用于调试诊断和工具。
SetPrivateData 将应用程序定义的数据设置为 DirectML 设备对象，并将该数据与应用程序定义的 GUID 相关联。
SetPrivateDataInterface 将 IUnknown 派生接口与 DirectML 设备对象相关联，并将该接口与应用程序定义的 GUID 相关联。

接口


IDMLBindingTable 包装应用程序托管的描述符堆的范围，DirectML 使用它为资源创建绑定。若要创建此对象，请调用 IDMLDevice：：CreateBindingTable。
IDMLCommandRecorder 将 DirectML 工作的调度记录到 Direct3D 12 命令列表中。
IDMLCompiledOperator 表示适合在 GPU 上执行的运算符的已编译高效形式。若要创建此对象，请调用 IDMLDevice：：CompileOperator。
IDMLDebugDevice 控制 DirectML 调试层。
IDMLDevice 表示 DirectML 设备，该设备用于创建运算符、绑定表、命令记录器和其他对象。（IDMLDevice）
IDMLDevice1 表示 DirectML 设备，该设备用于创建运算符、绑定表、命令记录器和其他对象。（IDMLDevice1）
IDMLDeviceChild 由从 DirectML 设备创建的所有对象实现的接口。
IDMLDispatchable 通过使用 IDMLCommandRecorder：：RecordDispatch，可以记录到命令列表中以调度 GPU 的对象实现。
IDMLObject IDMLDevice 和 IDMLDeviceChild 直接继承的接口（间接继承所有其他接口）。
IDMLOperator 表示 DirectML 运算符。
IDMLOperatorInitializer 表示一个专用对象，其用途是初始化已编译的运算符。若要创建此对象的实例，请调用 IDMLDevice：：CreateOperatorInitializer。
IDMLPageable 由可从 GPU 内存中逐出的对象实现，因此可以提供给 IDMLDevice：：Evict 和 IDMLDevice：：MakeResident。

结构


DML_ACTIVATION_CELU_OPERATOR_DESC 对 inputTensor中的每个元素执行连续可区分的指数线性单位（CELU）激活函数，将结果放入 OutputTensor的相应元素中。
DML_ACTIVATION_ELU_OPERATOR_DESC 对 InputTensor中的每个元素执行指数线性单位（ELU）激活函数，并将结果置于 OutputTensor的相应元素中。
DML_ACTIVATION_HARD_SIGMOID_OPERATOR_DESC 对 inputTensor中的每个元素执行硬 sigmoid 函数，将结果置于 OutputTensor的相应元素中。
DML_ACTIVATION_HARDMAX_OPERATOR_DESC 对 InputTensor的每个元素执行 hardmax 函数，将结果放入 OutputTensor的相应元素中。
DML_ACTIVATION_IDENTITY_OPERATOR_DESC 执行标识激活，有效地将 InputTensor 的每个元素复制到 OutputTensor的相应元素。
DML_ACTIVATION_LEAKY_RELU_OPERATOR_DESC 对 inputTensor中的每个元素执行泄漏整型线性单元（ReLU）激活函数，将结果置于 OutputTensor的相应元素中。
DML_ACTIVATION_LINEAR_OPERATOR_DESC 对 inputTensor中的每个元素执行线性激活函数，将结果放入 OutputTensor的相应元素中。
DML_ACTIVATION_LOG_SOFTMAX_OPERATOR_DESC 对 InputTensor的每个元素执行 softmax 激活日志函数，并将结果置于 OutputTensor的相应元素中。
DML_ACTIVATION_PARAMETERIZED_RELU_OPERATOR_DESC 对 inputTensor中的每个元素执行参数化整型线性单元（ReLU）激活函数，将结果置于 OutputTensor的相应元素中。
DML_ACTIVATION_PARAMETRIC_SOFTPLUS_OPERATOR_DESC 对 inputTensor中的每个元素执行参数软增强激活函数，将结果置于 OutputTensor的相应元素中。（DML_ACTIVATION_PARAMETRIC_SOFTPLUS_OPERATOR_DESC）
DML_ACTIVATION_RELU_GRAD_OPERATOR_DESC 计算整型线性单元（ReLU）的反向传播渐变。
DML_ACTIVATION_RELU_OPERATOR_DESC 对 inputTensor中的每个元素执行整改线性单元（ReLU）激活函数，将结果置于 OutputTensor的相应元素中。
DML_ACTIVATION_SCALED_ELU_OPERATOR_DESC 对 inputTensor中的每个元素执行缩放指数线性单元（ELU）激活函数，并将结果放入 OutputTensor的相应元素中。
DML_ACTIVATION_SCALED_TANH_OPERATOR_DESC 对 InputTensor中的每个元素执行缩放双曲正切激活函数，并将结果置于 OutputTensor的相应元素中。
DML_ACTIVATION_SHRINK_OPERATOR_DESC 对 inputTensor中的每个元素执行收缩激活函数，将结果放入 OutputTensor的相应元素中。
DML_ACTIVATION_SIGMOID_OPERATOR_DESC 对 inputTensor中的每个元素执行 sigmoid 函数，将结果置于 OutputTensor的相应元素中。
DML_ACTIVATION_SOFTMAX_OPERATOR_DESC 对 InputTensor执行 softmax 激活函数，将结果置于 OutputTensor的相应元素中。
DML_ACTIVATION_SOFTPLUS_OPERATOR_DESC 对 inputTensor中的每个元素执行参数软增强激活函数，将结果置于 OutputTensor的相应元素中。（DML_ACTIVATION_SOFTPLUS_OPERATOR_DESC）
DML_ACTIVATION_SOFTSIGN_OPERATOR_DESC 对 inputTensor中的每个元素执行软对齐函数，将结果置于 OutputTensor的相应元素中。
DML_ACTIVATION_TANH_OPERATOR_DESC 对 inputTensor中的每个元素执行双曲正切激活函数，并将结果置于 OutputTensor的相应元素中。
DML_ACTIVATION_THRESHOLDED_RELU_OPERATOR_DESC 对 inputTensor中的每个元素执行阈值整改线性单元（ReLU）激活函数，将结果置于 OutputTensor的相应元素中。
DML_ADAM_OPTIMIZER_OPERATOR_DESC 根据 Adam（ADAptive Moment 估计）算法，使用提供的渐变计算更新的权重（参数）。此运算符是优化器，通常用于训练循环的权重更新步骤中来执行梯度下降。
DML_ARGMAX_OPERATOR_DESC 输出输入张量一个或多个维度内最大值元素的索引。
DML_ARGMIN_OPERATOR_DESC 输出输入张量一个或多个维度中最小值元素的索引。
DML_AVERAGE_POOLING_GRAD_OPERATOR_DESC 计算平均池的反向传播渐变（请参阅 DML_AVERAGE_POOLING_OPERATOR_DESC）。
DML_AVERAGE_POOLING_OPERATOR_DESC 在输入张量上滑动窗口中的元素中，平均值。
DML_BATCH_NORMALIZATION_GRAD_OPERATOR_DESC 计算批处理规范化的反向传播渐变。
DML_BATCH_NORMALIZATION_OPERATOR_DESC DML_BATCH_NORMALIZATION_OPERATOR_DESC结构（directml.h）对输入执行批处理规范化。
DML_BATCH_NORMALIZATION_TRAINING_GRAD_OPERATOR_DESC 计算批处理规范化训练的反向传播渐变。
DML_BATCH_NORMALIZATION_TRAINING_OPERATOR_DESC DML_BATCH_NORMALIZATION_TRAINING_OPERATOR_DESC结构（directml.h）对输入执行批处理规范化。
DML_BINDING_DESC 包含绑定的说明，以便可以通过调用其中一个 IDMLBindingTable 方法将其添加到绑定表中。
DML_BINDING_PROPERTIES 包含有关特定已编译运算符或运算符初始值设定项的绑定要求的信息。此结构是从 IDMLDispatchable：：GetBindingProperties 检索的。
DML_BINDING_TABLE_DESC 指定 IDMLDevice：：CreateBindingTable 和 IDMLBindingTable：：Reset 的参数。
DML_BUFFER_ARRAY_BINDING 指定一个资源绑定，该绑定是单个缓冲区绑定的数组。
DML_BUFFER_BINDING 指定 Direct3D 12 缓冲区中的字节范围描述的资源绑定，该绑定由偏移量和大小表示为 ID3D12Resource。
DML_BUFFER_TENSOR_DESC 描述将存储在 Direct3D 12 缓冲区资源的张量。
DML_CAST_OPERATOR_DESC 将输入中的每个元素强制转换为输出张量的数据类型，并将结果存储在输出的相应元素中。
DML_CONVOLUTION_INTEGER_OPERATOR_DESC 使用 InputTensor执行 FilterTensor 的卷积。此运算符对整数数据执行正向卷积。
DML_CONVOLUTION_OPERATOR_DESC 使用 InputTensor执行 FilterTensor 的卷积。此运算符支持许多标准卷积配置。
DML_CUMULATIVE_PRODUCT_OPERATOR_DESC 将张量沿轴的元素相乘，将产品的运行计价写入输出张量中。
DML_CUMULATIVE_SUMMATION_OPERATOR_DESC 将张量沿轴的元素求和，将求和的运行计价写入输出张量中。
DML_DEPTH_TO_SPACE_OPERATOR_DESC 将数据从深度重新排列到空间数据块中。运算符输出输入张量的副本，其中深度维度中的值在空间块中移动到高度和宽度维度。（DML_DEPTH_TO_SPACE_OPERATOR_DESC）
DML_DEPTH_TO_SPACE1_OPERATOR_DESC 将数据从深度重新排列到空间数据块中。运算符输出输入张量的副本，其中深度维度中的值在空间块中移动到高度和宽度维度。（DML_DEPTH_TO_SPACE1_OPERATOR_DESC）
DML_DIAGONAL_MATRIX_OPERATOR_DESC 在主对角线上生成具有一个（或其他显式值）的类似标识矩阵，并在其他位置生成零。
DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC 计算 InputTensor量化所需的量子化刻度和零点值，然后应用该量子化，将结果写入 outputTensor 。
DML_ELEMENT_WISE_ABS_OPERATOR_DESC 计算 InputTensor的每个元素的绝对值，并将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_ACOS_OPERATOR_DESC 计算 InputTensor的每个元素的反余弦值，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_ACOSH_OPERATOR_DESC 计算 InputTensor的每个元素的双曲反正弦值，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_ADD_OPERATOR_DESC 将 ATensor 中的每个元素添加到 BTensor中的相应元素，并将结果放入 OutputTensor的相应元素中。（DML_ELEMENT_WISE_ADD_OPERATOR_DESC）
DML_ELEMENT_WISE_ADD1_OPERATOR_DESC 将 ATensor 中的每个元素添加到 BTensor 中的相应元素，并将结果放入 OutputTensor的相应元素中，并带有融合激活选项。
DML_ELEMENT_WISE_ASIN_OPERATOR_DESC 计算 InputTensor的每个元素的反正弦值，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_ASINH_OPERATOR_DESC 计算 InputTensor的每个元素的双曲反正弦值，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_ATAN_OPERATOR_DESC 计算 InputTensor的每个元素的反正切值，并将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_ATAN_YX_OPERATOR_DESC 计算 ATensor 和 BTensor的每个元素的 2 参数反正切值，其中 ATensor 是 Y 轴和 BTensor 是 X 轴，将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_ATANH_OPERATOR_DESC 计算 InputTensor的每个元素的双曲反正切值，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_BIT_AND_OPERATOR_DESC 计算输入张量的每个对应元素之间的按位 AND，并将结果写入输出张量。
DML_ELEMENT_WISE_BIT_COUNT_OPERATOR_DESC 计算输入张量的每个元素的按位总体计数（设置为 1 位数），并将结果写入输出张量中。
DML_ELEMENT_WISE_BIT_NOT_OPERATOR_DESC 计算输入张量的每个元素的按位 NOT，并将结果写入输出张量。
DML_ELEMENT_WISE_BIT_OR_OPERATOR_DESC 计算输入张量的每个对应元素之间的按位 OR，并将结果写入输出张量。
DML_ELEMENT_WISE_BIT_SHIFT_LEFT_OPERATOR_DESC 按 BTensor相应元素给出的位数 ATensor 的每个元素的逻辑左移，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_BIT_SHIFT_RIGHT_OPERATOR_DESC ATensor 的每个元素执行逻辑右移，由 BTensor的相应元素给出的多个位，将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_BIT_XOR_OPERATOR_DESC 计算输入张量的每个对应元素之间的按位 XOR（eXclusive OR），并将结果写入输出张量中。
DML_ELEMENT_WISE_CEIL_OPERATOR_DESC 计算 InputTensor的每个元素的上限，将结果放入 OutputTensor的相应元素中。 x 的上限是大于或等于 x 的最小整数。
DML_ELEMENT_WISE_CLIP_GRAD_OPERATOR_DESC 计算元素级剪辑的反向传播渐变。
DML_ELEMENT_WISE_CLIP_GRAD1_OPERATOR_DESC 计算元素级剪辑的反向传播渐变。
DML_ELEMENT_WISE_CLIP_OPERATOR_DESC 对 InputTensor的每个元素执行以下操作，将结果放入 OutputTensor的相应元素中。此运算符在封闭间隔 [Min， Max] 内固定输入中的每个元素（或限制）。
DML_ELEMENT_WISE_CLIP1_OPERATOR_DESC 对 InputTensor的每个元素执行固定（或限制）操作，将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_CONSTANT_POW_OPERATOR_DESC 将 InputTensor 的每个元素提升为指数的强大功能，将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_COS_OPERATOR_DESC 计算 InputTensor的每个元素的三角余弦值，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_COSH_OPERATOR_DESC 计算 InputTensor的每个元素的双曲余弦值，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_DEQUANTIZE_LINEAR_OPERATOR_DESC 对 InputTensor 中每个元素执行以下线性去量化函数，使其在 ScaleTensor 和 `ZeroPointTensor`中对应元素，并将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_DIFFERENCE_SQUARE_OPERATOR_DESC 从 ATensor的相应元素中减去 BTensor 的每个元素，将结果单独乘以结果，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_DIVIDE_OPERATOR_DESC 根据 BTensor的相应元素计算 ATensor 的每个元素的商，并将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_ERF_OPERATOR_DESC 对 InputTensor的每个元素执行 Gaussian 错误函数（erf），将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_EXP_OPERATOR_DESC 将自然指数函数应用于 InputTensor的每个元素，并将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_FLOOR_OPERATOR_DESC 计算 InputTensor的每个元素的基底，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_IDENTITY_OPERATOR_DESC 计算 InputTensor的每个元素的标识，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_IF_OPERATOR_DESC 根据 ConditionTensor中相应元素的值，从 ATensor 或 BTensor中选择元素。 ConditionTensor 的非零元素从 ATensor中进行选择，而从 BTensor中选择零值元素。
DML_ELEMENT_WISE_IS_INFINITY_OPERATOR_DESC 根据给定的 InfinityMode，检查 InputTensor 的每个元素，并将结果（1 for true， 0 for false）放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_IS_NAN_OPERATOR_DESC 对于输入张量的每个元素，如果输入为 NaN（由 IEEE-754 定义），则返回 1;否则返回 0。结果将放入输出张量的相应元素中。
DML_ELEMENT_WISE_LOG_OPERATOR_DESC 计算 InputTensor的每个元素的 base-e（natural）对数，将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_LOGICAL_AND_OPERATOR_DESC 对输入张量的每个对应元素对执行逻辑 AND，将结果（1 表示 true，0 为 false）放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_LOGICAL_EQUALS_OPERATOR_DESC 对输入张量的每个对应元素对执行逻辑相等，将结果（1 表示 true，0 为 false）放入 OutputTensor的对应元素中。
DML_ELEMENT_WISE_LOGICAL_GREATER_THAN_OPERATOR_DESC 对输入张量的每个对应元素对执行大于的逻辑，将结果（1 表示 true，0 为 false）放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_LOGICAL_GREATER_THAN_OR_EQUAL_OPERATOR_DESC 对输入张量的每个对应元素对执行大于或等于的逻辑，将结果（1 表示 true，0 表示 false）放入 OutputTensor的对应元素中。
DML_ELEMENT_WISE_LOGICAL_LESS_THAN_OPERATOR_DESC 对输入张量的每个对应元素对执行小于的逻辑，将结果（1 表示 true，0 为 false）放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_LOGICAL_LESS_THAN_OR_EQUAL_OPERATOR_DESC 对输入张量的每个对应元素对执行小于或等于的逻辑，将结果（1 表示 true，0 表示 false）放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_LOGICAL_NOT_OPERATOR_DESC 对 InputTensor的每个元素执行逻辑 NOT，并将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_LOGICAL_OR_OPERATOR_DESC 对输入张量的每个对应元素对执行逻辑 OR，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_LOGICAL_XOR_OPERATOR_DESC 对输入张量的每个对应元素对执行逻辑 XOR（独占或），将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_MAX_OPERATOR_DESC 从输入张量中获取两个相应元素中的更大值，并将结果放入输出张量的相应元素中。
DML_ELEMENT_WISE_MEAN_OPERATOR_DESC 平均输入张量的每个对应元素对，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_MIN_OPERATOR_DESC 从输入张量中获取两个相应元素的较小值，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_MODULUS_FLOOR_OPERATOR_DESC 为输入张量中的每个对应元素对计算与 Python 模数相同的结果，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_MODULUS_TRUNCATE_OPERATOR_DESC 计算输入张量的每个对应元素对的 C 模数运算符，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_MULTIPLY_OPERATOR_DESC 计算输入张量的每个对应元素对的乘积，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_NEGATE_OPERATOR_DESC 将 InputTensor的每个元素相反，将结果存储到 OutputTensor的相应元素中。
DML_ELEMENT_WISE_POW_OPERATOR_DESC 计算 InputTensorExponentTensor的相应元素的幂，并将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_QUANTIZE_LINEAR_OPERATOR_DESC 对 InputTensor 中每个元素执行以下线性量化函数，ScaleTensor 和 `ZeroPointTensor`中的相应元素，将结果置于 OutputTensor的相应元素中。
DML_ELEMENT_WISE_QUANTIZED_LINEAR_ADD_OPERATOR_DESC 将 ATensor 中的每个元素添加到 BTensor中的相应元素，并将结果放入 OutputTensor的相应元素中。（DML_ELEMENT_WISE_QUANTIZED_LINEAR_ADD_OPERATOR_DESC）
DML_ELEMENT_WISE_RECIP_OPERATOR_DESC 计算输入张量的每个元素的倒数，并将结果放入输出张量的相应元素中。
DML_ELEMENT_WISE_ROUND_OPERATOR_DESC 将 InputTensor 的每个元素舍入为整数值，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_SIGN_OPERATOR_DESC 返回一个值，表示 InputTensor的每个元素的符号，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_SIN_OPERATOR_DESC 计算 InputTensor的每个元素的三角正弦值，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_SINH_OPERATOR_DESC 计算 InputTensor的每个元素的双曲正弦值，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_SQRT_OPERATOR_DESC 计算 InputTensor的每个元素的平方根，并将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_SUBTRACT_OPERATOR_DESC 从 ATensor的相应元素中减去 BTensor 的每个元素，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_TAN_OPERATOR_DESC 计算 InputTensor的每个元素的三角正切值，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_TANH_OPERATOR_DESC 计算 InputTensor的元素的双曲正切值，将结果放入 OutputTensor的相应元素中。
DML_ELEMENT_WISE_THRESHOLD_OPERATOR_DESC 将 InputTensor 的所有元素替换为 Min，Min。结果将放置在 OutputTensor的相应元素中。
DML_FEATURE_DATA_FEATURE_LEVELS 提供有关 DirectML 设备支持的功能级别的详细信息。
DML_FEATURE_DATA_TENSOR_DATA_TYPE_SUPPORT 提供有关 DirectML 设备是否支持张量内特定数据类型的详细信息。
DML_FEATURE_QUERY_FEATURE_LEVELS 用于查询 DirectML 设备以支持一个或多个功能级别。
DML_FEATURE_QUERY_TENSOR_DATA_TYPE_SUPPORT 用于查询 DirectML 设备，以获取对张量内特定数据类型的支持。
DML_FILL_VALUE_CONSTANT_OPERATOR_DESC 用给定常量填充张量值。
DML_FILL_VALUE_SEQUENCE_OPERATOR_DESC 用序列填充张量。
DML_GATHER_ELEMENTS_OPERATOR_DESC 使用索引张量从给定轴沿给定轴的输入张量收集元素，以重新映射到输入。
DML_GATHER_ND_OPERATOR_DESC 收集输入张量中的元素，使用索引张量将索引重新映射到输入的整个子块。（DML_GATHER_ND_OPERATOR_DESC）
DML_GATHER_ND1_OPERATOR_DESC 收集输入张量中的元素，使用索引张量将索引重新映射到输入的整个子块。（DML_GATHER_ND1_OPERATOR_DESC）
DML_GATHER_OPERATOR_DESC 使用 IndicesTensor 重新映射索引，从轴收集输入张量中的元素。
DML_GEMM_OPERATOR_DESC 执行窗体 `Output = FusedActivation(Alpha * TransA(A) x TransB(B) + Beta * C)`的一般矩阵乘法函数，其中 `x` 表示矩阵乘法，`*` 表示标量乘法。
DML_GRAPH_DESC 描述用于编译组合优化运算符的 DirectML 运算符的图形。
DML_GRAPH_EDGE_DESC 由 DML_GRAPH_DESC 定义的 DirectML 运算符图中连接的泛型容器，传递给 IDMLDevice1：：CompileGraph。
DML_GRAPH_NODE_DESC 由 DML_GRAPH_DESC 定义的 DirectML 运算符图中节点的泛型容器，并传递给 IDMLDevice1：：CompileGraph。
DML_GRU_OPERATOR_DESC 对输入执行（标准层）单层封闭循环单元（GRU）函数。此运算符使用多个入口来执行此层。这些门在序列长度维度和 SequenceLengthsTensor的循环中执行多次。
DML_INPUT_GRAPH_EDGE_DESC 描述由 DML_GRAPH_DESC 定义的 DirectML 运算符图中的连接，并将其传递给 IDMLDevice1：：CompileGraph。此结构用于定义从图形输入到内部节点输入的连接。
DML_INTERMEDIATE_GRAPH_EDGE_DESC 描述由 DML_GRAPH_DESC 定义的 DirectML 运算符图中的连接，并将其传递给 IDMLDevice1：：CompileGraph。此结构用于定义内部节点之间的连接。
DML_JOIN_OPERATOR_DESC 沿指定轴连接输入张量数组。
DML_LOCAL_RESPONSE_NORMALIZATION_GRAD_OPERATOR_DESC 计算本地响应规范化的反向传播渐变。
DML_LOCAL_RESPONSE_NORMALIZATION_OPERATOR_DESC 对输入执行本地响应规范化（LRN）函数。
DML_LP_NORMALIZATION_OPERATOR_DESC 沿输入张量指定轴执行 Lp 规范化函数。
DML_LP_POOLING_OPERATOR_DESC 计算输入张量上滑动窗口中元素的 Lp 规范化值。
DML_LSTM_OPERATOR_DESC 对输入执行一层长期内存（LSTM）函数。此运算符使用多个入口来执行此层。这些门在循环中执行多次，由序列长度维度和 SequenceLengthsTensor决定。
DML_MATRIX_MULTIPLY_INTEGER_OPERATOR_DESC 对整数数据执行矩阵乘法函数。
DML_MAX_POOLING_GRAD_OPERATOR_DESC 计算最大池的反向传播渐变（请参阅 DML_MAX_POOLING2_OPERATOR_DESC）。
DML_MAX_POOLING_OPERATOR_DESC 计算输入张量上滑动窗口中元素的最大值。
DML_MAX_POOLING1_OPERATOR_DESC 计算输入张量上滑动窗口中元素的最大值，并选择性地返回所选最大值的索引。（DML_MAX_POOLING1_OPERATOR_DESC）
DML_MAX_POOLING2_OPERATOR_DESC 计算输入张量上滑动窗口中元素的最大值，并选择性地返回所选最大值的索引。（DML_MAX_POOLING2_OPERATOR_DESC）
DML_MAX_UNPOOLING_OPERATOR_DESC 根据 IndexesTensor中提供的索引值，通过填充输出张量 OutputTensor，来反转最大池操作（请参阅 DML_MAX_POOLING_OPERATOR1_DESC 了解详细信息），方法是使用输入张量 InputTensor中的值。此过程未触及的输出张量中的元素保留为零值。
DML_MEAN_VARIANCE_NORMALIZATION_OPERATOR_DESC 对输入张量执行平均方差规范化函数。此运算符将计算输入张量执行规范化的平均值和方差。（DML_MEAN_VARIANCE_NORMALIZATION_OPERATOR_DESC）
DML_MEAN_VARIANCE_NORMALIZATION1_OPERATOR_DESC 对输入张量执行平均方差规范化函数。此运算符将计算输入张量执行规范化的平均值和方差。（DML_MEAN_VARIANCE_NORMALIZATION1_OPERATOR_DESC）
DML_NONZERO_COORDINATES_OPERATOR_DESC 计算输入张量的所有非零元素的 N 维坐标。
DML_ONE_HOT_OPERATOR_DESC 生成填充一热编码值的张量。此运算符生成输出张量，其中，对于所选轴中的所有序列，该序列中除一个元素外的所有元素都设置为 OffValue，其余单个元素设置为 OnValue。
DML_OPERATOR_DESC 运算符说明的通用容器。使用此结构中指定的参数构造 DirectML 运算符。有关更多详细信息，请参阅 IDMLDevice：：CreateOperator。
DML_OPERATOR_GRAPH_NODE_DESC 对由 DML_GRAPH_DESC 定义的 DirectML 运算符图中的节点进行解码，并将其传递给 IDMLDevice1：：CompileGraph。
DML_OUTPUT_GRAPH_EDGE_DESC 描述由 DML_GRAPH_DESC 定义的 DirectML 运算符图中的连接，并将其传递给 IDMLDevice1：：CompileGraph。此结构用于定义从内部节点的输出到图形输出的连接。
DML_PADDING_OPERATOR_DESC DML_PADDING_OPERATOR_DESC结构（directml.h）使用边缘上的常量或镜像值来膨胀输入张量，并将结果写入输出。
DML_PADDING1_OPERATOR_DESC DML_PADDING1_OPERATOR_DESC结构（directml.h）使用边缘上的常量或镜像值将输入张量膨胀，并将结果写入输出。
DML_QUANTIZED_LINEAR_CONVOLUTION_OPERATOR_DESC 使用 InputTensor执行 FilterTensor 的卷积。此运算符对量化数据执行转发卷积。此运算符在数学上等效于取消输入的量化、卷积，然后量化输出。
DML_QUANTIZED_LINEAR_MATRIX_MULTIPLY_OPERATOR_DESC 对量化数据执行矩阵乘法函数。此运算符在数学上等效于取消输入的量化，然后执行矩阵乘法，然后量化输出。
DML_RANDOM_GENERATOR_OPERATOR_DESC 使用确定性生成的伪随机统一分布式位填充输出张量。此运算符（可选）还可以输出更新的内部生成器状态，该状态可在运算符的后续执行期间使用。
DML_REDUCE_OPERATOR_DESC 输出输入张量一个或多个维度内的元素（总和、积、最小值等）的减少。
DML_RESAMPLE_GRAD_OPERATOR_DESC 计算 Resample 的反向传播渐变（请参阅 DML_RESAMPLE1_OPERATOR_DESC）。
DML_RESAMPLE_OPERATOR_DESC 使用比例因子计算目标张量大小，将源中的元素重新采样到目标张量。可以使用线性或最接近的邻居内插模式。（DML_RESAMPLE_OPERATOR_DESC）
DML_RESAMPLE1_OPERATOR_DESC 使用比例因子计算目标张量大小，将源中的元素重新采样到目标张量。可以使用线性或最接近的邻居内插模式。（DML_RESAMPLE1_OPERATOR_DESC）
DML_REVERSE_SUBSEQUENCES_OPERATOR_DESC 反转一个或多个子序列的元素，张量。根据提供的轴和序列长度选择要反向的子序列集。
DML_RNN_OPERATOR_DESC 对输入执行一层简单的重复神经网络（RNN）函数。此函数通常称为输入门。此运算符在循环中多次执行此函数，由序列长度维度和 SequenceLengthsTensor指示。
DML_ROI_ALIGN_GRAD_OPERATOR_DESC 计算 ROI_ALIGN 和 ROI_ALIGN1的反向传播渐变。
DML_ROI_ALIGN_OPERATOR_DESC 执行 ROI 对齐操作，如掩码 R-CNN 纸张中所述。总之，该操作从输入图像张量中提取裁剪，并使用指定的内插模式将其调整为由最后 2 个 OutputTensor 维度指定的通用输出大小。
DML_ROI_ALIGN1_OPERATOR_DESC 执行 ROI 对齐操作，如掩码 R-CNN 纸张中所述。总之，该操作从输入图像张量中提取裁剪的窗口，并使用指定的 InterpolationMode将窗口调整为由 OutputTensor 最后 2 个维度指定的通用输出大小。
DML_ROI_POOLING_OPERATOR_DESC 跨输入张量（根据感兴趣的区域或 ROIs）执行 MaxPool 函数。
DML_SCALAR_UNION 标量类型的联合。
DML_SCALE_BIAS 包含提供给 DirectML 运算符的刻度和偏差术语的值。缩放和偏差具有应用函数 g（x） = x * Scale + Bias 的效果。
DML_SCATTER_ND_OPERATOR_DESC 将整个输入张量复制到输出，然后使用更新张量中的相应值覆盖所选索引。（DML_SCATTER_ND_OPERATOR_DESC）
DML_SCATTER_OPERATOR_DESC 将整个输入张量复制到输出，然后使用更新张量中的相应值覆盖所选索引。（DML_SCATTER_OPERATOR_DESC）
DML_SIZE_2D 包含可表示张量内元素的二维平面的大小（如提供给 DirectML 运算符）或二维刻度或任意二维宽度/高度值的值。
DML_SLICE_GRAD_OPERATOR_DESC 计算切片的反向传播渐变（请参阅 DML_SLICE1_OPERATOR_DESC）。
DML_SLICE_OPERATOR_DESC 提取输入张量的单一子区域（“切片”）。（DML_SLICE_OPERATOR_DESC）
DML_SLICE1_OPERATOR_DESC 提取输入张量的单一子区域（“切片”）。（DML_SLICE1_OPERATOR_DESC）
DML_SPACE_TO_DEPTH_OPERATOR_DESC 将空间数据的块重新排列为深度。运算符输出输入张量的副本，其中高度和宽度维度中的值将移动到深度维度。（DML_SPACE_TO_DEPTH_OPERATOR_DESC）
DML_SPACE_TO_DEPTH1_OPERATOR_DESC 将空间数据的块重新排列为深度。运算符输出输入张量的副本，其中高度和宽度维度中的值将移动到深度维度。（DML_SPACE_TO_DEPTH1_OPERATOR_DESC）
DML_SPLIT_OPERATOR_DESC 将沿轴的输入张量拆分为多个输出张量。
DML_TENSOR_DESC DirectML 张量说明的通用容器。
DML_TILE_OPERATOR_DESC 通过平铺输入张量来构造输出张量。输入张量的每个维度中的元素由 Repeats 数组中的倍数重复。
DML_TOP_K_OPERATOR_DESC 沿 InputTensor轴选择每个序列中最大的 K 元素，并分别返回 OutputValueTensor 和 OutputIndexTensor中这些元素的值和索引。
DML_TOP_K1_OPERATOR_DESC 从 InputTensor轴上选择每个序列中的最大或最小 K 元素，并分别返回 OutputValueTensor 和 OutputIndexTensor中这些元素的值和索引。
DML_UPSAMPLE_2D_OPERATOR_DESC 向上采样输入图像，将结果写入输出张量。维度的顺序应为 NCHW（BatchSize、ChannelCount、Height、Width）或 NCDHW（BatchSize、ChannelCount、Depth、Height、Width），但如果数据以不同的格式存储，则可以使用步幅。
DML_VALUE_SCALE_2D_OPERATOR_DESC 执行按元素的刻度和偏差函数，`Output = Scale * Input + Bias`。

Microsoft Learn Challenge

通过

DirectML

枚举

功能

接口

结构

反馈

其他资源