estructura DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC (directml.h)
Calcula la escala de cuantificación y los valores de punto cero necesarios para cuantizar InputTensor y, a continuación, aplica esa cuantificación, escribiendo el resultado en OutputTensor.
Este operador usa la siguiente ecuación para cuantificar.
InputMax = Max(InputTensor)
InputMin = Min(InputTensor)
AValue = (A - AZeroPoint) * AScale
BValue = (B - BZeroPoint) * BScale
// For uint8 output, Min = 0, Max = 255
// For int8 output, Min = -128, Max = 127
OutputScale = (InputMax – InputMin) / (Max – Min)
OutputZeroPoint = Min - InputMin / OutputScale
OutputTensor = clamp(round(InputValue / OutputScale) + OutputZeroPoint, Min, Max)
Sintaxis
struct DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC {
const DML_TENSOR_DESC *InputTensor;
const DML_TENSOR_DESC *OutputTensor;
const DML_TENSOR_DESC *OutputScaleTensor;
const DML_TENSOR_DESC *OutputZeroPointTensor;
};
Miembros
InputTensor
Tipo: const DML_TENSOR_DESC*
Tensor que contiene las entradas.
OutputTensor
Tipo: const DML_TENSOR_DESC*
Tensor de salida en el que se van a escribir los resultados.
OutputScaleTensor
Tipo: const DML_TENSOR_DESC*
Tensor de salida para escribir el factor de escala de salida para OutputTensor. El número esperado de elementos de OutputScaleTensor es 1.
OutputZeroPointTensor
Tipo: const DML_TENSOR_DESC*
Tensor de salida para escribir el punto cero de salida para OutputTensor. El número esperado de elementos de OutputZeroPointTensor es 1.
Comentarios
Disponibilidad
Este operador se introdujo en DML_FEATURE_LEVEL_4_0.
Restricciones tensor
- InputTensor, OutputScaleTensor, OutputTensor y OutputZeroPointTensor deben tener el mismo DimensionCount.
- OutputTensor y OutputZeroPointTensor deben tener el mismo DataType.
Compatibilidad con Tensor
Tensor | Clase | Recuentos de dimensiones admitidos | Tipos de datos admitidos |
---|---|---|---|
InputTensor | Entrada | De 1 a 8 | FLOAT32, FLOAT16 |
OutputTensor | Resultados | De 1 a 8 | INT8, UINT8 |
OutputScaleTensor | Resultados | De 1 a 8 | FLOAT32 |
OutputZeroPointTensor | Resultados | De 1 a 8 | INT8, UINT8 |
Requisitos
Requisito | Value |
---|---|
Cliente mínimo compatible | Compilación 22000 de Windows |
Servidor mínimo compatible | Compilación 22000 de Windows |
Encabezado | directml.h |