DML_GATHER_ND_OPERATOR_DESC 구조체(directml.h)
인덱스 텐서를 사용하여 입력 텐서에서 요소를 수집하여 인덱스를 입력의 전체 하위 블록에 다시 매핑합니다. 이 연산자는 다음 의사 코드를 수행합니다. 여기서 "..." 는 입력 및 인덱스 차원 수에 따라 정확한 동작이 종속된 일련의 좌표를 나타냅니다.
output[...] = input[indices[...]]
구문
struct DML_GATHER_ND_OPERATOR_DESC {
const DML_TENSOR_DESC *InputTensor;
const DML_TENSOR_DESC *IndicesTensor;
const DML_TENSOR_DESC *OutputTensor;
UINT InputDimensionCount;
UINT IndicesDimensionCount;
};
멤버
InputTensor
형식: const DML_TENSOR_DESC*
읽을 텐서입니다.
IndicesTensor
형식: const DML_TENSOR_DESC*
인덱스를 포함하는 텐서입니다. 이 텐서의 DimensionCount 는 InputTensor.DimensionCount와 일치해야 합니다. IndicesTensor의 마지막 차원은 실제로 인덱스 튜플당 좌표 수이며 InputTensor.DimensionCount를 초과할 수 없습니다. 예를 들어 IndicesDimensionCount{1,4,5,2}
= 3이 있는 크기의 인덱스 텐서에는 InputTensor로 인덱싱하는 2좌표 튜플의 4x5 배열이 있습니다.
부터 이 연산자는 이 텐서와 DML_FEATURE_LEVEL_3_0
함께 서명된 정수 형식을 사용할 때 음수 인덱스 값을 지원합니다. 음수 인덱스는 해당 차원의 끝을 기준으로 하는 것으로 해석됩니다. 예를 들어 -1의 인덱스는 해당 차원을 따라 마지막 요소를 나타냅니다.
OutputTensor
형식: const DML_TENSOR_DESC*
결과를 쓸 텐서입니다. 이 텐서의 DimensionCount 및 DataType 은 InputTensor.DimensionCount와 일치해야 합니다. 예상되는 OutputTensor.Sizes 는 IndicesTensor.Sizes 선행 세그먼트와 InputTensor.Sizes 후행 세그먼트가 연결되어 다음과 같이 생성됩니다.
indexTupleSize = IndicesTensor.Sizes[IndicesTensor.DimensionCount - 1]
OutputTensor.Sizes = {
1...,
IndicesTensor.Sizes[(IndicesTensor.DimensionCount - IndicesDimensionCount) .. (IndicesTensor.DimensionCount - 1)],
InputTensor.Sizes[(InputTensor.DimensionCount - indexTupleSize) .. InputTensor.DimensionCount]
}
출력 차원은 오른쪽에 정렬되며, OutputTensor.DimensionCount까지 충족하는 데 필요한 경우 선행 1개 값이 앞에 추가됩니다.
예제는 다음과 같습니다.
InputTensor.Sizes = {3,4,5,6,7}
InputDimensionCount = 5
IndicesTensor.Sizes = {1,1, 1,2,3}
IndicesDimensionCount = 3 // can be thought of as a {1,2} array of 3-coordinate tuples
// The {1,2} comes from the indices tensor (ignoring last dimension which is the tuple size),
// and the {6,7} comes from input tensor, ignoring the first 3 dimensions
// since the index tuples are 3 elements (from the indices tensor last dimension).
OutputTensor.Sizes = {1, 1,2,6,7}
InputDimensionCount
형식: UINT
관련 없는 선행 차원을 무시한 후 InputTensor 내의 실제 입력 차원 수(범위 [1, *InputTensor.DimensionCount*]
)입니다. 예를 들어 InputTensor.Sizes 및 InputDimensionCount
= 3을 = {1,1,4,6}
지정하면 실제 의미 있는 인덱스는 입니다{1,4,6}
.
IndicesDimensionCount
형식: UINT
[1, IndicesTensor.DimensionCount ]에 이르는 관련 없는 선행 차원을 무시한 후 IndicesTensor 내의 실제 인덱스 차원 수입니다. 예를 들어 IndicesTensor.Sizes = {1,1,4,6}
및 IndicesDimensionCount = 3이 지정된 경우 실제 의미 있는 인덱스는 입니다 {1,4,6}
.
예
예제 1. 1D 다시 매핑
InputDimensionCount: 2
IndicesDimensionCount: 2
InputTensor: (Sizes:{2,2}, DataType:FLOAT32)
[[0,1],[2,3]]
IndicesTensor: (Sizes:{2,1}, DataType:UINT32)
[[1],[0]]
// output[y, x] = input[indices[y], x]
OutputTensor: (Sizes:{2,2}, DataType:FLOAT32)
[[2,3],[0,1]]
예제 2. 2D 다시 매핑
InputDimensionCount: 3
IndicesDimensionCount: 2
InputTensor: (Sizes:{1, 2,2,2}, DataType:FLOAT32)
[ [[[0,1],[2,3]],[[4,5],[6,7]]] ]
IndicesTensor: (Sizes:{1,1, 2,2}, DataType:UINT32)
[[ [[0,1],[1,0]] ]]
// output[y, x] = input[indices[y, 0], indices[y, 1], x]
OutputTensor: (Sizes:{1,1, 2,2}, DataType:FLOAT32)
[[ [[2,3],[4,5]] ]]
설명
이 연산자의 최신 버전인 DML_OPERATOR_GATHER_ND1
가 에 DML_FEATURE_LEVEL_3_0
도입되었습니다.
가용성
이 연산자는 에서 DML_FEATURE_LEVEL_2_1
도입되었습니다.
텐서 제약 조건
- IndicesTensor, InputTensor 및 OutputTensor 에는 동일한 DimensionCount가 있어야 합니다.
- InputTensor 및 OutputTensor 에는 동일한 DataType이 있어야 합니다.
텐서 지원
DML_FEATURE_LEVEL_4_1 이상
텐서 | 종류 | 지원되는 차원 수 | 지원되는 데이터 형식 |
---|---|---|---|
InputTensor | 입력 | 1~8개 | FLOAT64, FLOAT32, FLOAT16, INT64, INT32, INT16, INT8, UINT64, UINT32, UINT16, UINT8 |
IndicesTensor | 입력 | 1~8개 | INT64, INT32, UINT64, UINT32 |
OutputTensor | 출력 | 1~8개 | FLOAT64, FLOAT32, FLOAT16, INT64, INT32, INT16, INT8, UINT64, UINT32, UINT16, UINT8 |
DML_FEATURE_LEVEL_3_0 이상
텐서 | 종류 | 지원되는 차원 수 | 지원되는 데이터 형식 |
---|---|---|---|
InputTensor | 입력 | 1~8개 | FLOAT32, FLOAT16, INT32, INT16, INT8, UINT32, UINT16, UINT8 |
IndicesTensor | 입력 | 1~8개 | INT64, INT32, UINT64, UINT32 |
OutputTensor | 출력 | 1~8개 | FLOAT32, FLOAT16, INT32, INT16, INT8, UINT32, UINT16, UINT8 |
DML_FEATURE_LEVEL_2_1 이상
텐서 | 종류 | 지원되는 차원 수 | 지원되는 데이터 형식 |
---|---|---|---|
InputTensor | 입력 | 4 | FLOAT32, FLOAT16, INT32, INT16, INT8, UINT32, UINT16, UINT8 |
IndicesTensor | 입력 | 4 | Uint32 |
OutputTensor | 출력 | 4 | FLOAT32, FLOAT16, INT32, INT16, INT8, UINT32, UINT16, UINT8 |
요구 사항
요구 사항 | 값 |
---|---|
지원되는 최소 클라이언트 | Windows 10 빌드 20348 |
지원되는 최소 서버 | Windows 10 빌드 20348 |
머리글 | directml.h |