DML_TILE_OPERATOR_DESC 구조체(directml.h)

아티클
08/23/2023

입력 텐서를 바둑판식으로 배열하여 출력 텐서를 생성합니다. 입력 텐서의 각 차원에 있는 요소는 Repeats 배열의 여러 요소에 의해 반복됩니다.

구문

struct DML_TILE_OPERATOR_DESC {
  const DML_TENSOR_DESC *InputTensor;
  const DML_TENSOR_DESC *OutputTensor;
  UINT                  RepeatsCount;
  const UINT            *Repeats;
};

멤버

InputTensor

형식: const DML_TENSOR_DESC*

읽을 텐서입니다. 여기에는 타일화할 요소가 포함됩니다.

OutputTensor

형식: const DML_TENSOR_DESC*

쓸 텐서이며 타일 출력을 보유합니다. 의 각 차원 i 에 [0, InputTensor.DimensionCount-1]대해 출력 크기는 로 OutputTensor.Sizes[i] = InputTensor.Sizes[i] * Repeats[i]계산됩니다. 이 텐서는 입력 텐서와 동일한 DimensionCount 를 가져야 합니다.

RepeatsCount

형식: UINT

이 필드는 반복 배열의 크기를 결정 합니다 . 이 값은 InputTensor.DimensionCount와 동일해야 합니다.

Repeats

형식: const UINT*

이 배열의 각 값은 입력 텐서의 차원 중 하나에 해당합니다(순서대로). 각 값은 해당 차원을 만들 타일화된 복사본의 수입니다. 값은 0보다 커야 합니다.

예제

RepeatsCount: 4
Repeats: {1, 1, 3, 3}

InputTensor: (Sizes:{1, 1, 2, 3}, DataType:FLOAT32)
[[[[1, 2, 3]
   [4, 5, 6]]]]

InputTensor: (Sizes:{1, 1, 6, 9}, DataType:FLOAT32)
[[[[1, 2, 3, 1, 2, 3, 1, 2, 3]
   [4, 5, 6, 4, 5, 6, 4, 5, 6] 
   [1, 2, 3, 1, 2, 3, 1, 2, 3] 
   [4, 5, 6, 4, 5, 6, 4, 5, 6] 
   [1, 2, 3, 1, 2, 3, 1, 2, 3] 
   [4, 5, 6, 4, 5, 6, 4, 5, 6]]]]

가용성

이 연산자는 에서 DML_FEATURE_LEVEL_1_0도입되었습니다.

텐서 제약 조건

InputTensor 및 OutputTensor 에는 동일한 DataType이 있어야 합니다.

텐서 지원

DML_FEATURE_LEVEL_4_1 이상

텐서	Kind	지원되는 차원 수	지원되는 데이터 형식
InputTensor	입력	1~8개	FLOAT32, FLOAT16, INT64, INT32, INT16, INT8, UINT64, UINT32, UINT16, UINT8
OutputTensor	출력	1~8개	FLOAT32, FLOAT16, INT64, INT32, INT16, INT8, UINT64, UINT32, UINT16, UINT8

DML_FEATURE_LEVEL_3_1 이상

텐서	Kind	지원되는 차원 수	지원되는 데이터 형식
InputTensor	입력	1~8개	FLOAT32, FLOAT16, INT32, INT16, INT8, UINT32, UINT16, UINT8
OutputTensor	출력	1~8개	FLOAT32, FLOAT16, INT32, INT16, INT8, UINT32, UINT16, UINT8

DML_FEATURE_LEVEL_2_1 이상

텐서	Kind	지원되는 차원 수	지원되는 데이터 형식
InputTensor	입력	4	FLOAT32, FLOAT16, INT32, INT16, INT8, UINT32, UINT16, UINT8
OutputTensor	출력	4	FLOAT32, FLOAT16, INT32, INT16, INT8, UINT32, UINT16, UINT8

DML_FEATURE_LEVEL_1_0 이상

텐서	Kind	지원되는 차원 수	지원되는 데이터 형식
InputTensor	입력	4	FLOAT32, FLOAT16
OutputTensor	출력	4	FLOAT32, FLOAT16

요구 사항


머리글	directml.h

다음을 통해 공유