次の方法で共有


DML_TILE_OPERATOR_DESC構造体 (directml.h)

入力テンソルをタイリングして出力テンソルを構築します。 入力テンソルの各次元の要素は、Repeats 配列の倍数によって 繰り返 されます。

構文

struct DML_TILE_OPERATOR_DESC {
  const DML_TENSOR_DESC *InputTensor;
  const DML_TENSOR_DESC *OutputTensor;
  UINT                  RepeatsCount;
  const UINT            *Repeats;
};

メンバー

InputTensor

型: const DML_TENSOR_DESC*

読み取り元のテンソル。タイル化する要素が含まれます。

OutputTensor

型: const DML_TENSOR_DESC*

書き込むテンソル。タイル出力を保持します。 の[0, InputTensor.DimensionCount-1]ディメンションiごとに、出力サイズは としてOutputTensor.Sizes[i] = InputTensor.Sizes[i] * Repeats[i]計算されます。 このテンソルには、入力テンソルと同じ DimensionCount が必要です。

RepeatsCount

型: UINT

このフィールドは 、Repeats 配列のサイズを決定します。 この値は 、InputTensor.DimensionCount と同じである必要があります。

Repeats

型: const UINT*

この配列内の各値は、入力テンソルの次元の 1 つに対応します (順序)。 各値は、そのディメンションで作成するタイル コピーの数です。 値は 0 より大きくする必要があります。

RepeatsCount: 4
Repeats: {1, 1, 3, 3}

InputTensor: (Sizes:{1, 1, 2, 3}, DataType:FLOAT32)
[[[[1, 2, 3]
   [4, 5, 6]]]]

InputTensor: (Sizes:{1, 1, 6, 9}, DataType:FLOAT32)
[[[[1, 2, 3, 1, 2, 3, 1, 2, 3]
   [4, 5, 6, 4, 5, 6, 4, 5, 6] 
   [1, 2, 3, 1, 2, 3, 1, 2, 3] 
   [4, 5, 6, 4, 5, 6, 4, 5, 6] 
   [1, 2, 3, 1, 2, 3, 1, 2, 3] 
   [4, 5, 6, 4, 5, 6, 4, 5, 6]]]]

可用性

この演算子は で DML_FEATURE_LEVEL_1_0導入されました。

テンソル制約

InputTensorOutputTensor には、同じ DataType が必要です。

Tensor のサポート

DML_FEATURE_LEVEL_4_1以上

テンソル 種類 サポートされているディメンション数 サポートされるデータ型
InputTensor 入力 1 から 8 FLOAT32、FLOAT16、INT64、INT32、INT16、INT8、UINT64、UINT32、UINT16、UINT8
OutputTensor 出力 1 から 8 FLOAT32、FLOAT16、INT64、INT32、INT16、INT8、UINT64、UINT32、UINT16、UINT8

DML_FEATURE_LEVEL_3_1以上

テンソル 種類 サポートされているディメンション数 サポートされるデータ型
InputTensor 入力 1 から 8 FLOAT32、FLOAT16、INT32、INT16、INT8、UINT32、UINT16、UINT8
OutputTensor 出力 1 から 8 FLOAT32、FLOAT16、INT32、INT16、INT8、UINT32、UINT16、UINT8

DML_FEATURE_LEVEL_2_1以上

テンソル 種類 サポートされているディメンション数 サポートされるデータ型
InputTensor 入力 4 FLOAT32、FLOAT16、INT32、INT16、INT8、UINT32、UINT16、UINT8
OutputTensor 出力 4 FLOAT32、FLOAT16、INT32、INT16、INT8、UINT32、UINT16、UINT8

DML_FEATURE_LEVEL_1_0以上

テンソル 種類 サポートされているディメンション数 サポートされるデータ型
InputTensor 入力 4 FLOAT32、FLOAT16
OutputTensor 出力 4 FLOAT32、FLOAT16

要件

   
Header directml.h