Compartir a través de


estructura DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC (directml.h)

Calcula la escala de cuantificación y los valores de punto cero necesarios para cuantizar InputTensor y, a continuación, aplica esa cuantificación, escribiendo el resultado en OutputTensor.

Este operador usa la siguiente ecuación para cuantificar.

InputMax = Max(InputTensor)
InputMin = Min(InputTensor)

AValue = (A - AZeroPoint) * AScale
BValue = (B - BZeroPoint) * BScale

// For uint8 output, Min = 0, Max = 255
// For int8 output, Min = -128, Max = 127
OutputScale = (InputMax – InputMin) / (Max – Min)

OutputZeroPoint = Min - InputMin / OutputScale

OutputTensor = clamp(round(InputValue / OutputScale) + OutputZeroPoint, Min, Max)

Sintaxis

struct DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC {
  const DML_TENSOR_DESC *InputTensor;
  const DML_TENSOR_DESC *OutputTensor;
  const DML_TENSOR_DESC *OutputScaleTensor;
  const DML_TENSOR_DESC *OutputZeroPointTensor;
};

Miembros

InputTensor

Tipo: const DML_TENSOR_DESC*

Tensor que contiene las entradas.

OutputTensor

Tipo: const DML_TENSOR_DESC*

Tensor de salida en el que se van a escribir los resultados.

OutputScaleTensor

Tipo: const DML_TENSOR_DESC*

Tensor de salida para escribir el factor de escala de salida para OutputTensor. El número esperado de elementos de OutputScaleTensor es 1.

OutputZeroPointTensor

Tipo: const DML_TENSOR_DESC*

Tensor de salida para escribir el punto cero de salida para OutputTensor. El número esperado de elementos de OutputZeroPointTensor es 1.

Comentarios

Disponibilidad

Este operador se introdujo en DML_FEATURE_LEVEL_4_0.

Restricciones tensor

  • InputTensor, OutputScaleTensor, OutputTensor y OutputZeroPointTensor deben tener el mismo DimensionCount.
  • OutputTensor y OutputZeroPointTensor deben tener el mismo DataType.

Compatibilidad con Tensor

Tensor Clase Recuentos de dimensiones admitidos Tipos de datos admitidos
InputTensor Entrada De 1 a 8 FLOAT32, FLOAT16
OutputTensor Resultados De 1 a 8 INT8, UINT8
OutputScaleTensor Resultados De 1 a 8 FLOAT32
OutputZeroPointTensor Resultados De 1 a 8 INT8, UINT8

Requisitos

Requisito Value
Cliente mínimo compatible Compilación 22000 de Windows
Servidor mínimo compatible Compilación 22000 de Windows
Encabezado directml.h

Consulte también