estructura DML_ELEMENT_WISE_ADD1_OPERATOR_DESC (directml.h)
Agrega cada elemento de ATensor a su elemento correspondiente en BTensor y coloca el resultado en el elemento correspondiente de OutputTensor, con la opción de activación fusionada.
f(a, b) = FusedActivation(a + b)
La descripción del operador de activación fusionada, si se proporciona, ejecuta el operador de activación especificado en la salida.
Este operador admite la ejecución en contexto, lo que significa que OutputTensor tiene permiso para alias uno o varios de los tensores de entrada durante el enlace.
Sintaxis
struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
const DML_TENSOR_DESC *ATensor;
const DML_TENSOR_DESC *BTensor;
const DML_TENSOR_DESC *OutputTensor;
const DML_OPERATOR_DESC *FusedActivation;
};
Miembros
ATensor
Tipo: const DML_TENSOR_DESC*
Tensor que contiene las entradas del lado izquierdo.
BTensor
Tipo: const DML_TENSOR_DESC*
Tensor que contiene las entradas del lado derecho.
OutputTensor
Tipo: const DML_TENSOR_DESC*
Tensor de salida en el que se van a escribir los resultados.
FusedActivation
Tipo: _Maybenull_ const DML_OPERATOR_DESC*
Una capa de activación fusionada opcional que se aplicará después de la adición. Para obtener más información, consulta Uso de operadores fusionados para mejorar el rendimiento.
La activación fusionada solo se puede usar cuando el tipo de datos de salida es FLOAT16 o FLOAT32.
Comentarios
Disponibilidad
Este operador se introdujo en DML_FEATURE_LEVEL_2_0
.
Restricciones tensor
ATensor, BTensor y OutputTensor deben tener el mismo DataType, DimensionCount y Sizes.
Compatibilidad con Tensor
DML_FEATURE_LEVEL_3_0 y versiones posteriores
Tensor | Clase | Recuentos de dimensiones admitidos | Tipos de datos admitidos |
---|---|---|---|
ATensor | Entrada | De 1 a 8 | FLOAT32, FLOAT16 |
BTensor | Entrada | De 1 a 8 | FLOAT32, FLOAT16 |
OutputTensor | Resultados | De 1 a 8 | FLOAT32, FLOAT16 |
DML_FEATURE_LEVEL_2_0 y versiones posteriores
Tensor | Clase | Recuentos de dimensiones admitidos | Tipos de datos admitidos |
---|---|---|---|
ATensor | Entrada | De 4 a 5 | FLOAT32, FLOAT16 |
BTensor | Entrada | De 4 a 5 | FLOAT32, FLOAT16 |
OutputTensor | Resultados | De 4 a 5 | FLOAT32, FLOAT16 |
Requisitos
Requisito | Value |
---|---|
Cliente mínimo compatible | Windows 10, versión 2004 (10.0; Compilación 19041) |
Servidor mínimo compatible | Windows Server, versión 2004 (10.0; Compilación 19041) |
Encabezado | directml.h |