Share via


DML_ELEMENT_WISE_ADD1_OPERATOR_DESC-Struktur (directml.h)

Fügt jedes Element in ATensor dem entsprechenden Element in BTensor hinzu und platziert das Ergebnis in das entsprechende Element von OutputTensor mit der Option für die fusionierte Aktivierung.

f(a, b) = FusedActivation(a + b)

Die Beschreibung des fusionierten Aktivierungsoperators führt dann den angegebenen Aktivierungsoperator für die Ausgabe aus, sofern angegeben.

Dieser Operator unterstützt die direkte Ausführung, was bedeutet, dass OutputTensor während der Bindung mindestens einen der Eingabe tensors aliasen darf.

Syntax

struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
  const DML_TENSOR_DESC   *ATensor;
  const DML_TENSOR_DESC   *BTensor;
  const DML_TENSOR_DESC   *OutputTensor;
  const DML_OPERATOR_DESC *FusedActivation;
};

Member

ATensor

Typ: const DML_TENSOR_DESC*

Ein Tensor, der die linksseitigen Eingaben enthält.

BTensor

Typ: const DML_TENSOR_DESC*

Ein Tensor, der die rechten Seiteneingaben enthält.

OutputTensor

Typ: const DML_TENSOR_DESC*

Der Ausgabe tensor, in den die Ergebnisse geschrieben werden sollen.

FusedActivation

Typ: _Maybenull_ const DML_OPERATOR_DESC*

Eine optionale Fused-Aktivierungsebene, die nach dem Hinzufügen angewendet werden soll. Weitere Informationen finden Sie unter Verwenden von fusionierten Operatoren für verbesserte Leistung.

Die Fused-Aktivierung kann nur verwendet werden, wenn der Ausgabedatentyp FLOAT16 oder FLOAT32 ist.

Hinweise

Verfügbarkeit

Dieser Operator wurde in DML_FEATURE_LEVEL_2_0eingeführt.

Tensoreinschränkungen

ATensor, BTensor und OutputTensor müssen die gleichen DataType, DimensionCount und Sizes aufweisen.

Tensorunterstützung

DML_FEATURE_LEVEL_3_0 und höher

Tensor Variante Unterstützte Dimensionsanzahl Unterstützte Datentypen
ATensor Eingabe 1 bis 8 FLOAT32, FLOAT16
BTensor Eingabe 1 bis 8 FLOAT32, FLOAT16
OutputTensor Ausgabe 1 bis 8 FLOAT32, FLOAT16

DML_FEATURE_LEVEL_2_0 und höher

Tensor Variante Unterstützte Dimensionsanzahl Unterstützte Datentypen
ATensor Eingabe 4 bis 5 FLOAT32, FLOAT16
BTensor Eingabe 4 bis 5 FLOAT32, FLOAT16
OutputTensor Ausgabe 4 bis 5 FLOAT32, FLOAT16

Anforderungen

Anforderung Wert
Unterstützte Mindestversion (Client) Windows 10, Version 2004 (10.0; Build 19041)
Unterstützte Mindestversion (Server) Windows Server, Version 2004 (10.0; Build 19041)
Kopfzeile directml.h

Weitere Informationen