DML_ELEMENT_WISE_ADD1_OPERATOR_DESC 구조체(directml.h)
ATensor의 모든 요소를 BTensor의 해당 요소에 추가하고 결과를 융합 활성화 옵션을 사용하여 OutputTensor의 해당 요소에 배치합니다.
f(a, b) = FusedActivation(a + b)
융합 활성화 연산자 설명(제공된 경우)은 출력에서 지정된 활성화 연산자를 실행합니다.
이 연산자는 현재 위치 실행을 지원합니다. 즉, OutputTensor 는 바인딩 중에 하나 이상의 입력 텐서에 별칭을 지정하도록 허용됩니다.
구문
struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
const DML_TENSOR_DESC *ATensor;
const DML_TENSOR_DESC *BTensor;
const DML_TENSOR_DESC *OutputTensor;
const DML_OPERATOR_DESC *FusedActivation;
};
멤버
ATensor
형식: const DML_TENSOR_DESC*
왼쪽 입력을 포함하는 텐서입니다.
BTensor
형식: const DML_TENSOR_DESC*
오른쪽 입력을 포함하는 텐서입니다.
OutputTensor
형식: const DML_TENSOR_DESC*
결과를 쓸 출력 텐서입니다.
FusedActivation
형식: _Maybenull_ const DML_OPERATOR_DESC*
추가 후 적용할 선택적 융합 활성화 계층입니다. 자세한 내용은 성능 향상을 위해 융합 연산자 사용을 참조하세요.
융합 활성화는 출력 데이터 형식이 FLOAT16 또는FLOAT32 경우에만 사용할 수 있습니다.
설명
가용성
이 연산자는 에서 DML_FEATURE_LEVEL_2_0
도입되었습니다.
텐서 제약 조건
ATensor, BTensor 및 OutputTensor 에는 동일한 DataType, DimensionCount 및 크기가 있어야 합니다.
텐서 지원
DML_FEATURE_LEVEL_3_0 이상
텐서 | 종류 | 지원되는 차원 수 | 지원되는 데이터 형식 |
---|---|---|---|
ATensor | 입력 | 1-8 | FLOAT32, FLOAT16 |
BTensor | 입력 | 1-8 | FLOAT32, FLOAT16 |
OutputTensor | 출력 | 1-8 | FLOAT32, FLOAT16 |
DML_FEATURE_LEVEL_2_0 이상
텐서 | 종류 | 지원되는 차원 수 | 지원되는 데이터 형식 |
---|---|---|---|
ATensor | 입력 | 4~5 | FLOAT32, FLOAT16 |
BTensor | 입력 | 4~5 | FLOAT32, FLOAT16 |
OutputTensor | 출력 | 4~5 | FLOAT32, FLOAT16 |
요구 사항
요구 사항 | 값 |
---|---|
지원되는 최소 클라이언트 | Windows 10 버전 2004(10.0; 빌드 19041) |
지원되는 최소 서버 | Windows Server 버전 2004(10.0; 빌드 19041) |
머리글 | directml.h |