estructura DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC (directml.h)

Calcula la escala de cuantificación y los valores de punto cero necesarios para cuantizar InputTensor y, a continuación, aplica esa cuantificación, escribiendo el resultado en OutputTensor.

Este operador usa la siguiente ecuación para cuantificar.

InputMax = Max(InputTensor)
InputMin = Min(InputTensor)

AValue = (A - AZeroPoint) * AScale
BValue = (B - BZeroPoint) * BScale

// For uint8 output, Min = 0, Max = 255
// For int8 output, Min = -128, Max = 127
OutputScale = (InputMax – InputMin) / (Max – Min)

OutputZeroPoint = Min - InputMin / OutputScale

OutputTensor = clamp(round(InputValue / OutputScale) + OutputZeroPoint, Min, Max)

Sintaxis

struct DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC {
  const DML_TENSOR_DESC *InputTensor;
  const DML_TENSOR_DESC *OutputTensor;
  const DML_TENSOR_DESC *OutputScaleTensor;
  const DML_TENSOR_DESC *OutputZeroPointTensor;
};

Miembros

InputTensor

Tipo: const DML_TENSOR_DESC*

Tensor que contiene las entradas.

OutputTensor

Tipo: const DML_TENSOR_DESC*

Tensor de salida en el que se van a escribir los resultados.

OutputScaleTensor

Tipo: const DML_TENSOR_DESC*

Tensor de salida para escribir el factor de escala de salida para OutputTensor. El número esperado de elementos de OutputScaleTensor es 1.

OutputZeroPointTensor

Tipo: const DML_TENSOR_DESC*

Tensor de salida para escribir el punto cero de salida para OutputTensor. El número esperado de elementos de OutputZeroPointTensor es 1.

Comentarios

Disponibilidad

Este operador se introdujo en DML_FEATURE_LEVEL_4_0.

Restricciones tensor

InputTensor, OutputScaleTensor, OutputTensor y OutputZeroPointTensor deben tener el mismo DimensionCount.
OutputTensor y OutputZeroPointTensor deben tener el mismo DataType.

Compatibilidad con Tensor

Tensor	Clase	Recuentos de dimensiones admitidos	Tipos de datos admitidos
InputTensor	Entrada	De 1 a 8	FLOAT32, FLOAT16
OutputTensor	Resultados	De 1 a 8	INT8, UINT8
OutputScaleTensor	Resultados	De 1 a 8	FLOAT32
OutputZeroPointTensor	Resultados	De 1 a 8	INT8, UINT8

Requisitos

Requisito	Value
Cliente mínimo compatible	Compilación 22000 de Windows
Servidor mínimo compatible	Compilación 22000 de Windows
Encabezado	directml.h

Consulte también

DML_ELEMENT_WISE_DEQUANTIZE_LINEAR_OPERATOR_DESC

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2024-02-26

estructura DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC (directml.h)

Sintaxis

Miembros

Comentarios

Disponibilidad

Restricciones tensor

Compatibilidad con Tensor

Requisitos

Consulte también

Comentarios

Recursos adicionales