DML_ELEMENT_WISE_ADD_OPERATOR_DESC 구조체(directml.h)
ATensor의 모든 요소를 BTensor의 해당 요소에 추가하여 결과를 OutputTensor의 해당 요소에 배치합니다.
f(a, b) = a + b
이 연산자는 현재 위치 실행을 지원합니다. 즉, OutputTensor 는 바인딩하는 동안 하나 이상의 입력 텐서에 별칭을 지정하도록 허용됩니다.
구문
struct DML_ELEMENT_WISE_ADD_OPERATOR_DESC {
const DML_TENSOR_DESC *ATensor;
const DML_TENSOR_DESC *BTensor;
const DML_TENSOR_DESC *OutputTensor;
};
멤버
ATensor
형식: const DML_TENSOR_DESC*
왼쪽 입력을 포함하는 텐서입니다.
BTensor
형식: const DML_TENSOR_DESC*
오른쪽 입력을 포함하는 텐서입니다.
OutputTensor
형식: const DML_TENSOR_DESC*
결과를 쓸 출력 텐서입니다.
설명
이 연산자의 최신 버전인 DML_ELEMENT_WISE_ADD1_OPERATOR_DESC 에 DML_FEATURE_LEVEL_2_0
도입되었습니다.
가용성
이 연산자는 에서 DML_FEATURE_LEVEL_1_0
도입되었습니다.
텐서 제약 조건
ATensor, BTensor 및 OutputTensor 에는 동일한 DataType, DimensionCount 및 크기가 있어야 합니다.
텐서 지원
DML_FEATURE_LEVEL_5_1 이상
텐서 | Kind | 지원되는 차원 수 | 지원되는 데이터 형식 |
---|---|---|---|
ATensor | 입력 | 1~8개 | FLOAT32, FLOAT16, INT64, INT32, INT16, INT8, UINT64, UINT32, UINT16, UINT8 |
BTensor | 입력 | 1~8개 | FLOAT32, FLOAT16, INT64, INT32, INT16, INT8, UINT64, UINT32, UINT16, UINT8 |
OutputTensor | 출력 | 1~8개 | FLOAT32, FLOAT16, INT64, INT32, INT16, INT8, UINT64, UINT32, UINT16, UINT8 |
DML_FEATURE_LEVEL_4_1 이상
텐서 | Kind | 지원되는 차원 수 | 지원되는 데이터 형식 |
---|---|---|---|
ATensor | 입력 | 1~8개 | FLOAT32, FLOAT16, INT64, INT32, UINT64, UINT32 |
BTensor | 입력 | 1~8개 | FLOAT32, FLOAT16, INT64, INT32, UINT64, UINT32 |
OutputTensor | 출력 | 1~8개 | FLOAT32, FLOAT16, INT64, INT32, UINT64, UINT32 |
DML_FEATURE_LEVEL_3_0 이상
텐서 | Kind | 지원되는 차원 수 | 지원되는 데이터 형식 |
---|---|---|---|
ATensor | 입력 | 1~8개 | FLOAT32, FLOAT16, INT32, UINT32 |
BTensor | 입력 | 1~8개 | FLOAT32, FLOAT16, INT32, UINT32 |
OutputTensor | 출력 | 1~8개 | FLOAT32, FLOAT16, INT32, UINT32 |
DML_FEATURE_LEVEL_2_1 이상
텐서 | Kind | 지원되는 차원 수 | 지원되는 데이터 형식 |
---|---|---|---|
ATensor | 입력 | 4~5개 | FLOAT32, FLOAT16, INT32, UINT32 |
BTensor | 입력 | 4~5개 | FLOAT32, FLOAT16, INT32, UINT32 |
OutputTensor | 출력 | 4~5개 | FLOAT32, FLOAT16, INT32, UINT32 |
DML_FEATURE_LEVEL_1_0 이상
텐서 | Kind | 지원되는 차원 수 | 지원되는 데이터 형식 |
---|---|---|---|
ATensor | 입력 | 4~5개 | FLOAT32, FLOAT16 |
BTensor | 입력 | 4~5개 | FLOAT32, FLOAT16 |
OutputTensor | 출력 | 4~5개 | FLOAT32, FLOAT16 |
요구 사항
머리글 | directml.h |