DirectML
DirectML 技术概述。
若要开发 DirectML,需要以下标头:
有关此技术的编程指南,请参阅:
枚举
DML_AXIS_DIRECTION 定义常量,这些常量指定运算符沿给定轴的运算方向 (例如,求和、选择前 k 个元素、选择最小元素) 。 |
DML_BINDING_TYPE 定义常量,这些常量指定由绑定说明 (DML_BINDING_DESC结构) 引用的资源 () 的性质。 |
DML_CONVOLUTION_DIRECTION 定义常量,这些常量指定 directML 卷积运算符 (的方向,如DML_CONVOLUTION_OPERATOR_DESC结构) 所述。 |
DML_CONVOLUTION_MODE 定义常量,这些常量指定 directML 卷积运算符 (的模式,如 DML_CONVOLUTION_OPERATOR_DESC 结构) 所述。 |
DML_CREATE_DEVICE_FLAGS 向 DMLCreateDevice 提供其他设备创建选项。 值可以是按位 OR 组合在一起。 |
DML_DEPTH_SPACE_ORDER 定义控制 DirectML 运算符 DML_OPERATOR_DEPTH_TO_SPACE1 和DML_OPERATOR_SPACE_TO_DEPTH1中应用的转换 的常量。 |
DML_EXECUTION_FLAGS 向 DirectML 提供用于控制运算符执行的选项。 这些标志可以按位 OR 组合在一起,一次指定多个标志。 |
DML_FEATURE 定义一组可从 DirectML 设备查询的可选特性和功能。 |
DML_FEATURE_LEVEL 定义指定 DirectML 功能级别的常量。 功能级别定义了 DirectML 支持的一系列广泛的功能。 |
DML_GRAPH_EDGE_TYPE 定义指定图形边缘类型的常量。 有关此枚举的用法,请参阅 DML_GRAPH_EDGE_DESC 。 |
DML_GRAPH_NODE_TYPE 定义指定图形节点类型的常量。 有关此枚举的用法,请参阅 DML_GRAPH_NODE_DESC 。 |
DML_INTERPOLATION_MODE 定义为 DirectML upsample 2-D 运算符 (指定模式的常量,如 DML_UPSAMPLE_2D_OPERATOR_DESC 结构) 所述。 |
DML_MATRIX_TRANSFORM 定义常量,这些常量指定要应用于 DirectML 张量的矩阵转换。 |
DML_OPERATOR_TYPE 定义运算符说明的类型。 |
DML_PADDING_MODE 定义常量,这些常量指定 DirectML pad 运算符 (的模式,如 DML_PADDING_OPERATOR_DESC 结构) 所述。 |
DML_RANDOM_GENERATOR_TYPE 定义指定随机数生成器类型的常量。 |
DML_RECURRENT_NETWORK_DIRECTION 定义指定循环 DirectML 运算符方向的常量。 |
DML_REDUCE_FUNCTION 定义常量,这些常量指定用于 DirectML reduce 运算符 (的特定缩减算法,如 DML_REDUCE_OPERATOR_DESC 结构) 所述。 |
DML_TENSOR_DATA_TYPE 指定张量中值的数据类型。 DirectML 运算符可能不支持所有数据类型;请参阅每个特定运算符的文档,查找它支持的数据类型。 |
DML_TENSOR_FLAGS 在张量说明中指定其他选项。 值可以是按位 OR 组合在一起。 |
DML_TENSOR_TYPE 标识一种类型的张量说明。 |
函数
BindInputs 将一组资源绑定为输入张量。 |
BindOutputs 将一组资源绑定为输出张量。 |
BindPersistentResource 将缓冲区绑定为永久性资源。 可以通过调用 IDMLDispatchable::GetBindingProperties 来确定此缓冲区范围的所需大小。 |
BindTemporaryResource 绑定缓冲区以用作临时暂存内存。 可以通过调用 IDMLDispatchable::GetBindingProperties 来确定此缓冲区范围的所需大小。 |
CheckFeatureSupport 获取有关 DirectML 设备支持的可选特性和功能的信息。 |
CompileGraph 将 DirectML 运算符图编译为可调度到 GPU 的对象。 |
CompileOperator 将运算符编译为可调度到 GPU 的对象。 |
CreateBindingTable 创建绑定表,该表是一个对象,可用于将资源 ((如张量) )绑定到管道。 |
CreateCommandRecorder 创建 DirectML 命令记录器。 |
CreateOperator 创建 DirectML 运算符。 |
CreateOperatorInitializer 创建可用于初始化已编译运算符的 对象。 |
DMLCreateDevice 为给定的 Direct3D 12 设备创建 DirectML 设备。 (DMLCreateDevice) |
DMLCreateDevice1 为给定的 Direct3D 12 设备创建 DirectML 设备。 (DMLCreateDevice1) |
Evict 从 GPU 内存中逐出一个或多个可分页对象。 另请参阅 IDMLDevice::MakeResident。 |
GetBindingProperties 检索可调度对象的绑定属性 (运算符初始值设定项或编译的运算符) 。 |
GetDevice 检索用于创建此对象的 DirectML 设备。 |
GetDeviceRemovedReason 检索删除 DirectML 设备的原因。 |
GetParentDevice 检索用于创建此 DirectML 设备的 Direct3D 12 设备。 |
GetPrivateData 从 DirectML 设备对象获取应用程序定义的数据。 |
MakeResident 导致一个或多个可分页对象驻留在 GPU 内存中。 另请参阅 IDMLDevice::Evict。 |
RecordDispatch 记录可调度对象的执行 (运算符初始值设定项,或已编译的运算符) 命令列表。 |
重置 重置绑定表以包装新的描述符范围,可能适用于不同的运算符或初始值设定项。 这允许动态重用绑定表。 |
重置 重置初始值设定项以处理一组新运算符的初始化。 |
SetMuteDebugOutput 确定是否将 DirectML 静音,以便将消息发送到 ID3D12InfoQueue。 |
SetName 将名称与 DirectML 设备对象相关联。 此名称用于调试诊断和工具。 |
SetPrivateData 将应用程序定义的数据设置为 DirectML 设备对象,并将该数据与应用程序定义的 GUID 相关联。 |
SetPrivateDataInterface 将 IUnknown 派生的接口与 DirectML 设备对象相关联,并将该接口与应用程序定义的 GUID 相关联。 |
接口
IDMLBindingTable 包装应用程序托管的描述符堆的范围,DirectML 使用 它为资源创建绑定。 若要创建此对象,请调用 IDMLDevice::CreateBindingTable。 |
IDMLCommandRecorder 将 DirectML 工作的调度记录到 Direct3D 12 命令列表中。 |
IDMLCompiledOperator 表示一种经过编译的高效运算符形式,适合在 GPU 上执行。 若要创建此对象,请调用 IDMLDevice::CompileOperator。 |
IDMLDebugDevice 控制 DirectML 调试层。 |
IDMLDevice 表示 DirectML 设备,该设备用于创建运算符、绑定表、命令记录器和其他对象。 (IDMLDevice) |
IDMLDevice1 表示 DirectML 设备,该设备用于创建运算符、绑定表、命令记录器和其他对象。 (IDMLDevice1) |
IDMLDeviceChild 由从 DirectML 设备创建的所有对象实现的接口。 |
IDMLDispatchable 由可以使用 IDMLCommandRecorder::RecordDispatch 记录到命令列表以供调度的对象实现。 |
IDMLObject IDMLDevice 和 IDMLDeviceChild 从中直接继承 (和所有其他接口的接口,间接) 。 |
IDMLOperator 表示 DirectML 运算符。 |
IDMLOperatorInitializer 表示一个专用对象,其用途是初始化已编译的运算符。 若要创建此对象的实例,请调用 IDMLDevice::CreateOperatorInitializer。 |
IDMLPageable 由可从 GPU 内存中逐出的对象实现,因此可以将其提供给 IDMLDevice::Evict 和 IDMLDevice::MakeResident。 |
結構
DML_ACTIVATION_CELU_OPERATOR_DESC 对 InputTensor 中的每个元素执行持续可区分的指数线性单位 (CELU) 激活函数,并将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_ELU_OPERATOR_DESC 对 InputTensor 中的每个元素执行指数线性单位 (ELU) 激活函数,并将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_HARD_SIGMOID_OPERATOR_DESC 对 InputTensor 中的每个元素执行硬 sigmoid 函数,将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_HARDMAX_OPERATOR_DESC 对 InputTensor 的每个元素执行 hardmax 函数,将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_IDENTITY_OPERATOR_DESC 执行标识激活,有效地将 InputTensor 的每个元素复制到 OutputTensor 的相应元素。 |
DML_ACTIVATION_LEAKY_RELU_OPERATOR_DESC 对 InputTensor 中的每个元素执行泄漏修正线性单元 (ReLU) 激活函数,并将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_LINEAR_OPERATOR_DESC 对 InputTensor 中的每个元素执行线性激活函数,将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_LOG_SOFTMAX_OPERATOR_DESC 对 InputTensor 的每个元素执行 (自然) softmax 激活函数,将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_PARAMETERIZED_RELU_OPERATOR_DESC 对 InputTensor 中的每个元素执行参数化整流线性单元 (ReLU) 激活函数,并将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_PARAMETRIC_SOFTPLUS_OPERATOR_DESC 对 InputTensor 中的每个元素执行参数化软增强激活函数,并将结果放入 OutputTensor 的相应元素中。 (DML_ACTIVATION_PARAMETRIC_SOFTPLUS_OPERATOR_DESC) |
DML_ACTIVATION_RELU_GRAD_OPERATOR_DESC (ReLU) 计算修正线性单位的反向传播梯度。 |
DML_ACTIVATION_RELU_OPERATOR_DESC 对 InputTensor 中的每个元素执行修正线性单元 (ReLU) 激活函数,并将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_SCALED_ELU_OPERATOR_DESC 对 InputTensor 中的每个元素执行缩放指数线性单位 (ELU) 激活函数,并将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_SCALED_TANH_OPERATOR_DESC 对 InputTensor 中的每个元素执行缩放双曲正切激活函数,并将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_SHRINK_OPERATOR_DESC 对 InputTensor 中的每个元素执行收缩激活函数,将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_SIGMOID_OPERATOR_DESC 对 InputTensor 中的每个元素执行 sigmoid 函数,将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_SOFTMAX_OPERATOR_DESC 对 InputTensor 执行 softmax 激活函数,将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_SOFTPLUS_OPERATOR_DESC 对 InputTensor 中的每个元素执行参数化软增强激活函数,并将结果放入 OutputTensor 的相应元素中。 (DML_ACTIVATION_SOFTPLUS_OPERATOR_DESC) |
DML_ACTIVATION_SOFTSIGN_OPERATOR_DESC 对 InputTensor 中的每个元素执行软对齐函数,将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_TANH_OPERATOR_DESC 对 InputTensor 中的每个元素执行双曲正切激活函数,将结果放入 OutputTensor 的相应元素中。 |
DML_ACTIVATION_THRESHOLDED_RELU_OPERATOR_DESC 对 InputTensor 中的每个元素执行阈值修正线性单元 (ReLU) 激活函数,并将结果放入 OutputTensor 的相应元素中。 |
DML_ADAM_OPTIMIZER_OPERATOR_DESC 根据 Adam (ADAptive Moment 估计) 算法,使用提供的梯度) 计算更新的权重 (参数。 此运算符是一个优化器,通常用于训练循环的权重更新步骤中,以执行梯度下降。 |
DML_ARGMAX_OPERATOR_DESC 输出输入张量一个或多个维度内最大值元素的索引。 |
DML_ARGMIN_OPERATOR_DESC 输出输入张量一个或多个维度内最小值元素的索引。 |
DML_AVERAGE_POOLING_GRAD_OPERATOR_DESC 计算平均池的反向传播梯度, (请参阅 DML_AVERAGE_POOLING_OPERATOR_DESC) 。 |
DML_AVERAGE_POOLING_OPERATOR_DESC 在输入张量上的滑动窗口中,对元素的值进行平均值。 |
DML_BATCH_NORMALIZATION_GRAD_OPERATOR_DESC 计算 批量规范化的反向传播梯度。 |
DML_BATCH_NORMALIZATION_OPERATOR_DESC DML_BATCH_NORMALIZATION_OPERATOR_DESC结构 (directml.h) 对输入执行批处理规范化。 |
DML_BATCH_NORMALIZATION_TRAINING_GRAD_OPERATOR_DESC 计算 批量规范化训练的反向传播梯度。 |
DML_BATCH_NORMALIZATION_TRAINING_OPERATOR_DESC DML_BATCH_NORMALIZATION_TRAINING_OPERATOR_DESC结构 (directml.h) 对输入执行批量规范化。 |
DML_BINDING_DESC 包含绑定的说明,以便可以通过调用 IDMLBindingTable 方法之一将其添加到绑定表。 |
DML_BINDING_PROPERTIES 包含有关特定已编译运算符或运算符初始值设定项的绑定要求的信息。 从 IDMLDispatchable::GetBindingProperties 检索此结构。 |
DML_BINDING_TABLE_DESC 指定 IDMLDevice::CreateBindingTable 和 IDMLBindingTable::Reset 的参数。 |
DML_BUFFER_ARRAY_BINDING 指定一个资源绑定,该绑定是单个缓冲区绑定的数组。 |
DML_BUFFER_BINDING 指定由 Direct3D 12 缓冲区中的字节范围描述的资源绑定,该范围由 ID3D12Resource 中的偏移量和大小表示。 |
DML_BUFFER_TENSOR_DESC 描述将存储在 Direct3D 12 缓冲区资源中的张量。 |
DML_CAST_OPERATOR_DESC 将输入中的每个元素强制转换为输出张量的数据类型,并将结果存储在输出的相应元素中。 |
DML_CONVOLUTION_INTEGER_OPERATOR_DESC 使用 InputTensor 执行 FilterTensor 的卷积。 此运算符对整数数据执行前向卷积。 |
DML_CONVOLUTION_OPERATOR_DESC 使用 InputTensor 执行 FilterTensor 的卷积。 此运算符支持许多标准卷积配置。 |
DML_CUMULATIVE_PRODUCT_OPERATOR_DESC 沿轴将张量元素相乘,将积的运行计值写入输出张量。 |
DML_CUMULATIVE_SUMMATION_OPERATOR_DESC 沿轴对张量元素求和,将求和的运行计分写入输出张量。 |
DML_DEPTH_TO_SPACE_OPERATOR_DESC 将 (将) 数据从深度重新排列为空间数据块。 运算符输出输入张量的副本,其中深度维度的值在空间块中移动到高度和宽度维度。 (DML_DEPTH_TO_SPACE_OPERATOR_DESC) |
DML_DEPTH_TO_SPACE1_OPERATOR_DESC 将 (将) 数据从深度重新排列为空间数据块。 运算符输出输入张量的副本,其中深度维度的值在空间块中移动到高度和宽度维度。 (DML_DEPTH_TO_SPACE1_OPERATOR_DESC) |
DML_DIAGONAL_MATRIX_OPERATOR_DESC 生成一个类似于标识的矩阵,该矩阵在主对角线上 (或其他显式值) ,在其他位置为零。 |
DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC 计算量化 InputTensor 所需的量化规模和零点值,然后应用该量化,将结果写入 OutputTensor。 |
DML_ELEMENT_WISE_ABS_OPERATOR_DESC 计算 InputTensor 的每个元素的绝对值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_ACOS_OPERATOR_DESC 计算 InputTensor 的每个元素的反余弦值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_ACOSH_OPERATOR_DESC 计算 InputTensor 的每个元素的双曲反正弦值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_ADD_OPERATOR_DESC 将 ATensor 中的每个元素添加到 其 BTensor 中的相应元素,并将结果放入 OutputTensor 的相应元素中。 (DML_ELEMENT_WISE_ADD_OPERATOR_DESC) |
DML_ELEMENT_WISE_ADD1_OPERATOR_DESC 将 ATensor 中的每个元素添加到 其 BTensor 中的相应元素,并将结果放入 OutputTensor 的相应元素中,以及用于融合激活的选项。 |
DML_ELEMENT_WISE_ASIN_OPERATOR_DESC 计算 InputTensor 的每个元素的反正弦值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_ASINH_OPERATOR_DESC 计算 InputTensor 的每个元素的双曲反正弦值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_ATAN_OPERATOR_DESC 计算 InputTensor 的每个元素的反正切值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_ATAN_YX_OPERATOR_DESC 计算 ATensor 和 BTensor 的每个元素的 2 参数反正切,其中 ATensor 为 Y 轴,BTensor 为 X 轴,将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_ATANH_OPERATOR_DESC 计算 InputTensor 的每个元素的双曲反正切值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_BIT_AND_OPERATOR_DESC 计算输入张量的每个对应元素之间的按位 AND,并将结果写入输出张量。 |
DML_ELEMENT_WISE_BIT_COUNT_OPERATOR_DESC 计算输入张量的每个元素的位数 (设置为 1) 的按位总体计数,并将结果写入输出张量。 |
DML_ELEMENT_WISE_BIT_NOT_OPERATOR_DESC 计算输入张量的每个元素的按位 NOT,并将结果写入输出张量。 |
DML_ELEMENT_WISE_BIT_OR_OPERATOR_DESC 计算输入张量的每个对应元素之间的按位 OR,并将结果写入输出张量。 |
DML_ELEMENT_WISE_BIT_SHIFT_LEFT_OPERATOR_DESC 按 BTensor 的相应元素给定的位数对 ATensor 的每个元素执行逻辑左移,将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_BIT_SHIFT_RIGHT_OPERATOR_DESC 按 BTensor 的相应元素给定的位数对 ATensor 的每个元素执行逻辑右移,将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_BIT_XOR_OPERATOR_DESC 计算输入张量的每个对应元素之间的按位 XOR (eXclusive OR) ,并将结果写入输出张量中。 |
DML_ELEMENT_WISE_CEIL_OPERATOR_DESC 计算 InputTensor 中每个元素的上限,并将结果放入 OutputTensor 的相应元素中。 x 的上限是大于或等于 x 的最小整数。 |
DML_ELEMENT_WISE_CLIP_GRAD_OPERATOR_DESC 计算 元素级剪辑的反向传播渐变。 |
DML_ELEMENT_WISE_CLIP_GRAD1_OPERATOR_DESC 计算 元素级剪辑的反向传播渐变。 |
DML_ELEMENT_WISE_CLIP_OPERATOR_DESC 对 InputTensor 的每个元素执行以下操作,将结果放入 OutputTensor 的相应元素中。 此运算符将 (或限制) 闭合间隔 [Min, Max] 内输入中的每个元素。 |
DML_ELEMENT_WISE_CLIP1_OPERATOR_DESC 对 InputTensor 的每个元素执行固定 (或限制) 操作,将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_CONSTANT_POW_OPERATOR_DESC 将 InputTensor 的每个元素提升为 Exponent 的幂,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_COS_OPERATOR_DESC 计算 InputTensor 中每个元素的三角余弦值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_COSH_OPERATOR_DESC 计算 InputTensor 每个元素的双曲余弦值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_DEQUANTIZE_LINEAR_OPERATOR_DESC 针对 ScaleTensor ZeroPointTensor 中的对应元素对 InputTensor 中的每个元素执行以下线性去量化函数,并将结果放置在 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_DIFFERENCE_SQUARE_OPERATOR_DESC 从 ATensor 的相应元素中减去 BTensor 的每个元素,将结果本身乘以,并将结果放入 OutputTensor 的对应元素中。 |
DML_ELEMENT_WISE_DIVIDE_OPERATOR_DESC 计算 ATensor 的每个元素在 BTensor 的相应元素上的商,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_ERF_OPERATOR_DESC 对 InputTensor 的每个元素执行高斯错误函数 (erf) ,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_EXP_OPERATOR_DESC 将自然指数函数应用于 InputTensor 的每个元素,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_FLOOR_OPERATOR_DESC 计算 InputTensor 的每个元素的下限,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_IDENTITY_OPERATOR_DESC 计算 InputTensor 的每个元素的标识,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_IF_OPERATOR_DESC 根据 ConditionTensor 中对应元素的值,选择 ATensor 或 BTensor 中的元素。 ConditionTensor 的非零元素从 ATensor 中选择,而零值元素则从 BTensor 中选择。 |
DML_ELEMENT_WISE_IS_INFINITY_OPERATOR_DESC 根据给定的 InfinityMode,检查 InputTensor 的每个元素是否为 IEEE-754 -inf 和/或 inf,并将结果 (1 表示 true,0 表示 false) 放入 OutputTensor 的相应元素。 |
DML_ELEMENT_WISE_IS_NAN_OPERATOR_DESC 对于输入张量的每个元素,如果输入是 IEEE-754) 定义的 NaN (,则返回 1;否则返回 0。 结果将放入输出张量的相应元素中。 |
DML_ELEMENT_WISE_LOG_OPERATOR_DESC 计算 InputTensor 每个元素的 base-e (自然) 对数,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_LOGICAL_AND_OPERATOR_DESC 对输入张量的每个对应元素对执行逻辑 AND,将结果 (1 表示 true,0 表示 false) 放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_LOGICAL_EQUALS_OPERATOR_DESC 对输入张量的每个对应元素对执行逻辑 相等 ,将结果 (1 表示 true,0 表示 false) 放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_LOGICAL_GREATER_THAN_OPERATOR_DESC 对输入张量的每个对应元素对执行 大于 的逻辑,将结果 (1 表示 true,0 表示 false) 放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_LOGICAL_GREATER_THAN_OR_EQUAL_OPERATOR_DESC 对输入张量的每一对对应元素执行 大于或等于 的逻辑,将结果 (1 表示 true,0 表示 false) 到 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_LOGICAL_LESS_THAN_OPERATOR_DESC 对输入张量的每个对应元素对执行 小于 的逻辑,将结果 (1 表示 true,0 表示 false) 到 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_LOGICAL_LESS_THAN_OR_EQUAL_OPERATOR_DESC 对输入张量的每个对应元素对执行 小于或等于 的逻辑,将结果 (1 表示 true,0 表示 false) OutputTensor 的相应元素。 |
DML_ELEMENT_WISE_LOGICAL_NOT_OPERATOR_DESC 对 InputTensor 的每个元素执行逻辑 NOT,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_LOGICAL_OR_OPERATOR_DESC 对输入张量的每个对应元素对执行逻辑 OR,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_LOGICAL_XOR_OPERATOR_DESC 对输入张量的每个对应元素对执行逻辑 XOR (独占或) ,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_MAX_OPERATOR_DESC 从输入张量获取两个相应元素的较大值,并将结果放入输出张量对应的元素中。 |
DML_ELEMENT_WISE_MEAN_OPERATOR_DESC 对输入张量的每个对应元素对求平均值,将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_MIN_OPERATOR_DESC 从输入张量中获取两个相应元素的较小值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_MODULUS_FLOOR_OPERATOR_DESC 计算输入张量中每对对应元素的模数,其结果与 Python 模数相同,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_MODULUS_TRUNCATE_OPERATOR_DESC 计算输入张量的每个对应元素对的 C 模数运算符,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_MULTIPLY_OPERATOR_DESC 计算输入张量的每个对应元素对的乘积,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_NEGATE_OPERATOR_DESC 将 InputTensor 的每个元素相反,并将结果存储到 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_POW_OPERATOR_DESC 计算 向 ExponentTensor 相应元素的幂引发的 InputTensor 的每个元素,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_QUANTIZE_LINEAR_OPERATOR_DESC 针对 ScaleTensor ZeroPointTensor 中的对应元素对 InputTensor 中的每个元素执行以下线性量化函数,并将结果放置在 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_QUANTIZED_LINEAR_ADD_OPERATOR_DESC 将 ATensor 中的每个元素添加到 其 BTensor 中的相应元素,并将结果放入 OutputTensor 的相应元素中。 (DML_ELEMENT_WISE_QUANTIZED_LINEAR_ADD_OPERATOR_DESC) |
DML_ELEMENT_WISE_RECIP_OPERATOR_DESC 计算输入张量的每个元素的倒数,并将结果放入输出张量对应的元素中。 |
DML_ELEMENT_WISE_ROUND_OPERATOR_DESC 将 InputTensor 的每个元素舍入为整数值,将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_SIGN_OPERATOR_DESC 返回一个值,该值表示 InputTensor 的每个元素的符号,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_SIN_OPERATOR_DESC 计算 InputTensor 每个元素的三角正弦值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_SINH_OPERATOR_DESC 计算 InputTensor 的每个元素的双曲正弦值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_SQRT_OPERATOR_DESC 计算 InputTensor 的每个元素的平方根,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_SUBTRACT_OPERATOR_DESC 从 ATensor 的对应元素中减去 BTensor 的每个元素,将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_TAN_OPERATOR_DESC 计算 InputTensor 每个元素的三角正切值,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_TANH_OPERATOR_DESC 计算 InputTensor 元素的双曲正切,并将结果放入 OutputTensor 的相应元素中。 |
DML_ELEMENT_WISE_THRESHOLD_OPERATOR_DESC 将低于给定阈值 Min 的所有 InputTensor 元素替换为 Min。 结果将放入 OutputTensor 的相应元素中。 |
DML_FEATURE_DATA_FEATURE_LEVELS 提供有关 DirectML 设备支持的功能级别的详细信息。 |
DML_FEATURE_DATA_TENSOR_DATA_TYPE_SUPPORT 提供有关 DirectML 设备是否支持张量中的特定数据类型的详细信息。 |
DML_FEATURE_QUERY_FEATURE_LEVELS 用于查询 DirectML 设备对一个或多个功能级别的支持。 |
DML_FEATURE_QUERY_TENSOR_DATA_TYPE_SUPPORT 用于查询 DirectML 设备是否支持张量中的特定数据类型。 |
DML_FILL_VALUE_CONSTANT_OPERATOR_DESC 使用给定的常量 值填充张量。 |
DML_FILL_VALUE_SEQUENCE_OPERATOR_DESC 使用序列填充张量。 |
DML_GATHER_ELEMENTS_OPERATOR_DESC 使用索引张量从输入张量沿给定轴收集元素,以重新映射到输入中。 |
DML_GATHER_ND_OPERATOR_DESC 从输入张量中收集元素,使用索引张量将索引重新映射到输入的整个子块。 (DML_GATHER_ND_OPERATOR_DESC) |
DML_GATHER_ND1_OPERATOR_DESC 从输入张量中收集元素,使用索引张量将索引重新映射到输入的整个子块。 (DML_GATHER_ND1_OPERATOR_DESC) |
DML_GATHER_OPERATOR_DESC 使用 IndicesTensor 重新映射索引,沿轴收集输入张量中的元素。 |
DML_GEMM_OPERATOR_DESC 执行形式的 Output = FusedActivation(Alpha * TransA(A) x TransB(B) + Beta * C) 常规矩阵乘法函数,其中 x 表示矩阵乘法,用 * 标量表示乘法。 |
DML_GRAPH_DESC 描述用于编译合并的优化运算符的 DirectML 运算符图。 |
DML_GRAPH_EDGE_DESC 由 DML_GRAPH_DESC 定义并传递给 IDMLDevice1::CompileGraph 的 DirectML 运算符图中的连接的通用容器。 |
DML_GRAPH_NODE_DESC DML_GRAPH_DESC 定义并传递给IDMLDevice1::CompileGraph 的 DirectML 运算符图中的节点的通用容器。 |
DML_GRU_OPERATOR_DESC 对输入执行 (标准层) 单层封闭循环单元 (GRU) 函数。 此运算符使用多个入口来执行此层。 这些门在序列长度维度和 SequenceLengthsTensor 规定的循环中执行多次。 |
DML_INPUT_GRAPH_EDGE_DESC 描述由 DML_GRAPH_DESC 定义并传递给 IDMLDevice1::CompileGraph 的 DirectML 运算符图中的连接。 此结构用于定义从图形输入到内部节点输入的连接。 |
DML_INTERMEDIATE_GRAPH_EDGE_DESC 描述由 DML_GRAPH_DESC 定义并传递给 IDMLDevice1::CompileGraph 的 DirectML 运算符图中的连接。 此结构用于定义内部节点之间的连接。 |
DML_JOIN_OPERATOR_DESC 沿指定轴连接输入张量数组。 |
DML_LOCAL_RESPONSE_NORMALIZATION_GRAD_OPERATOR_DESC 计算 本地响应规范化的反向传播梯度。 |
DML_LOCAL_RESPONSE_NORMALIZATION_OPERATOR_DESC 对输入执行本地响应规范化 (LRN) 函数。 |
DML_LP_NORMALIZATION_OPERATOR_DESC 沿输入张量指定轴执行 Lp 规范化函数。 |
DML_LP_POOLING_OPERATOR_DESC 通过输入张量计算滑动窗口中元素的 Lp 规范化值。 |
DML_LSTM_OPERATOR_DESC 对输入执行单层长短期内存 (LSTM) 函数。 此运算符使用多个入口来执行此层。 这些门在一个循环中执行多次,由序列长度维度和 SequenceLengthsTensor 指定。 |
DML_MATRIX_MULTIPLY_INTEGER_OPERATOR_DESC 对整数数据执行矩阵乘法函数。 |
DML_MAX_POOLING_GRAD_OPERATOR_DESC 计算最大池的反向传播梯度, (请参阅 DML_MAX_POOLING2_OPERATOR_DESC) 。 |
DML_MAX_POOLING_OPERATOR_DESC 通过输入张量计算滑动窗口中元素的最大值。 |
DML_MAX_POOLING1_OPERATOR_DESC 在输入张量上计算滑动窗口中元素的最大值,并选择性地返回所选最大值的索引。 (DML_MAX_POOLING1_OPERATOR_DESC) |
DML_MAX_POOLING2_OPERATOR_DESC 在输入张量上计算滑动窗口中元素的最大值,并选择性地返回所选最大值的索引。 (DML_MAX_POOLING2_OPERATOR_DESC) |
DML_MAX_UNPOOLING_OPERATOR_DESC 反转 max-pooling 操作 (根据 IndexesTensor 中提供的索引值,使用输入张量 InputTensor 中的值填充输出张量 OutputTensor,了解) 的详细信息DML_MAX_POOLING_OPERATOR1_DESC。 进程未触及的输出张量中的元素将保留零个值。 |
DML_MEAN_VARIANCE_NORMALIZATION_OPERATOR_DESC 对输入张量执行平均方差规范化函数。 此运算符将计算输入张量的平均数和方差以执行规范化。 (DML_MEAN_VARIANCE_NORMALIZATION_OPERATOR_DESC) |
DML_MEAN_VARIANCE_NORMALIZATION1_OPERATOR_DESC 对输入张量执行平均方差规范化函数。 此运算符将计算输入张量的平均数和方差以执行规范化。 (DML_MEAN_VARIANCE_NORMALIZATION1_OPERATOR_DESC) |
DML_NONZERO_COORDINATES_OPERATOR_DESC 计算输入张量的所有非零元素的 N 维坐标。 |
DML_ONE_HOT_OPERATOR_DESC 生成填充了 单热编码 值的张量。 此运算符生成一个输出张量,其中,对于所选轴中的所有序列,该序列中除一个元素外的所有元素都设置为 OffValue,其余单个元素设置为 OnValue。 |
DML_OPERATOR_DESC 运算符说明的泛型容器。 使用此结构中指定的参数构造 DirectML 运算符。 有关更多详细信息,请参阅 IDMLDevice::CreateOperator。 |
DML_OPERATOR_GRAPH_NODE_DESC 描述 由 DML_GRAPH_DESC 定义并传递给 IDMLDevice1::CompileGraph 的 DirectML 运算符图中的节点。 |
DML_OUTPUT_GRAPH_EDGE_DESC 描述由 DML_GRAPH_DESC 定义并传递给 IDMLDevice1::CompileGraph 的 DirectML 运算符图中的连接。 此结构用于定义从内部节点的输出到图形输出的连接。 |
DML_PADDING_OPERATOR_DESC DML_PADDING_OPERATOR_DESC结构 (directml.h) 使用边缘上的常量或镜像值将输入张量膨胀,并将结果写入输出。 |
DML_PADDING1_OPERATOR_DESC DML_PADDING1_OPERATOR_DESC结构 (directml.h) 使用边缘上的常量或镜像值放大输入张量,并将结果写入输出。 |
DML_QUANTIZED_LINEAR_CONVOLUTION_OPERATOR_DESC 使用 InputTensor 执行 FilterTensor 的卷积。 此运算符对量化数据执行正向卷积。 此运算符在数学上等效于对输入进行去量化、卷积,然后量化输出。 |
DML_QUANTIZED_LINEAR_MATRIX_MULTIPLY_OPERATOR_DESC 对量化数据执行矩阵乘法函数。 此运算符在数学上等效于对输入进行去量化,然后执行矩阵乘法,然后量化输出。 |
DML_RANDOM_GENERATOR_OPERATOR_DESC 使用确定性生成的伪随机均匀分布位填充输出张量。 此运算符还可以根据需要输出更新的内部生成器状态,该状态可在运算符的后续执行期间使用。 |
DML_REDUCE_OPERATOR_DESC 输出输入张量一个或多个维度内的元素缩减 (和、乘积、最小值等) 。 |
DML_RESAMPLE_GRAD_OPERATOR_DESC 计算重新采样的反向传播梯度, (请参阅 DML_RESAMPLE1_OPERATOR_DESC) 。 |
DML_RESAMPLE_OPERATOR_DESC 使用比例系数计算目标张量大小,将元素从源重新采样到目标张量。 可以使用线性或近邻内插模式。 (DML_RESAMPLE_OPERATOR_DESC) |
DML_RESAMPLE1_OPERATOR_DESC 使用比例系数计算目标张量大小,将元素从源重新采样到目标张量。 可以使用线性或近邻内插模式。 (DML_RESAMPLE1_OPERATOR_DESC) |
DML_REVERSE_SUBSEQUENCES_OPERATOR_DESC 反转张量一个或多个 子序列的 元素。 根据提供的轴和序列长度选择要反转的子序列集。 |
DML_RNN_OPERATOR_DESC 对输入执行单层简单循环神经网络 (RNN) 函数。 此函数通常称为输入门。 此运算符在循环中多次执行此函数,由序列长度维度和 SequenceLengthsTensor 决定。 |
DML_ROI_ALIGN_GRAD_OPERATOR_DESC 计算 ROI_ALIGN 和 ROI_ALIGN1的反向传播梯度。 |
DML_ROI_ALIGN_OPERATOR_DESC 执行 ROI 对齐操作,如 掩码 R-CNN 一文中所述。 总之,该操作从输入图像张量中提取裁剪,并使用指定的 InterpolationMode 将它们调整为 OutputTensor 最后 2 个维度指定的通用输出大小。 |
DML_ROI_ALIGN1_OPERATOR_DESC 执行 ROI 对齐操作,如 掩码 R-CNN 一文中所述。 总之,该操作从输入图像张量中提取裁剪的窗口,并使用指定的 InterpolationMode 将其大小调整为 OutputTensor 最后 2 个维度指定的通用输出大小。 |
DML_ROI_POOLING_OPERATOR_DESC 根据感兴趣的区域或 ROI) 跨输入张量 (执行 MaxPool 函数。 |
DML_SCALAR_UNION 标量类型的联合。 |
DML_SCALE_BIAS 包含提供给 DirectML 运算符的刻度和偏差项的值。 缩放和偏差的作用是应用函数 g (x) = x * Scale + Bias。 |
DML_SCATTER_ND_OPERATOR_DESC 将整个输入张量复制到输出,然后使用更新张量中的相应值覆盖所选索引。 (DML_SCATTER_ND_OPERATOR_DESC) |
DML_SCATTER_OPERATOR_DESC 将整个输入张量复制到输出,然后使用更新张量中的相应值覆盖所选索引。 (DML_SCATTER_OPERATOR_DESC) |
DML_SIZE_2D 包含的值可以表示提供给 DirectML 运算符的大小 (,) 张量内元素的二维平面、二维刻度或任何二维宽度/高度值。 |
DML_SLICE_GRAD_OPERATOR_DESC 计算切片的反向传播梯度, (请参阅 DML_SLICE1_OPERATOR_DESC) 。 |
DML_SLICE_OPERATOR_DESC (输入张量) 提取单个子区域。 (DML_SLICE_OPERATOR_DESC) |
DML_SLICE1_OPERATOR_DESC (输入张量) 提取单个子区域。 (DML_SLICE1_OPERATOR_DESC) |
DML_SPACE_TO_DEPTH_OPERATOR_DESC 将空间数据块重新排列为深度。 运算符输出输入张量的副本,其中高度和宽度维度的值将移动到深度维度。 (DML_SPACE_TO_DEPTH_OPERATOR_DESC) |
DML_SPACE_TO_DEPTH1_OPERATOR_DESC 将空间数据块重新排列为深度。 运算符输出输入张量的副本,其中高度和宽度维度的值将移动到深度维度。 (DML_SPACE_TO_DEPTH1_OPERATOR_DESC) |
DML_SPLIT_OPERATOR_DESC 沿轴将输入张量拆分为多个输出张量。 |
DML_TENSOR_DESC DirectML 张量说明的泛型容器。 |
DML_TILE_OPERATOR_DESC 通过平铺输入张量来构造输出张量。 输入张量的每个维度中的元素由 Repeats 数组中的一个倍数重复。 |
DML_TOP_K_OPERATOR_DESC 从 InputTensor 轴的每个序列中选择最大的 K 元素,并分别返回 OutputValueTensor 和 OutputIndexTensor 中这些元素的值和索引。 |
DML_TOP_K1_OPERATOR_DESC 沿 InputTensor 轴从每个序列中选择最大或最小的 K 元素,并分别返回 OutputValueTensor 和 OutputIndexTensor 中这些元素的值和索引。 |
DML_UPSAMPLE_2D_OPERATOR_DESC 对输入图像进行升采样,将结果写入输出张量。 维度的顺序应为 NCHW (BatchSize、ChannelCount、Height、Width) 或 NCDHW (BatchSize、ChannelCount、Depth、Height、Width) ,但如果以不同的格式存储数据,则可以使用步幅。 |
DML_VALUE_SCALE_2D_OPERATOR_DESC 执行元素级缩放和偏差函数 Output = Scale * Input + Bias 。 |