Compartir a través de


NormalizingEstimator Clase

Definición

public sealed class NormalizingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.NormalizingTransformer>
type NormalizingEstimator = class
    interface IEstimator<NormalizingTransformer>
Public NotInheritable Class NormalizingEstimator
Implements IEstimator(Of NormalizingTransformer)
Herencia
NormalizingEstimator
Implementaciones

Comentarios

Características del estimador

¿Este estimador necesita examinar los datos para entrenar sus parámetros?
Tipo de datos de columna de entrada Single o Double un vector de tamaño conocido de esos tipos.
Tipo de datos de columna de salida El mismo tipo de datos que la columna de entrada
Exportable a ONNX

NormalizingEstimator resultante normalizará los datos de una de las siguientes maneras en función de cómo se creó:

  • Mínimo máximo: escala lineal que se basa en los valores mínimo y máximo de cada fila.
  • Varianza media: vuelva a escalar cada fila a varianza unitaria y, opcionalmente, cero media.
  • Varianza media del registro: vuelva a escalar cada fila a varianza unitaria, opcionalmente, cero media en función de los cálculos en la escala del registro.
  • Discretización: bucketiza los datos de cada fila y realiza una reescala lineal en función de los intervalos calculados.
  • Discretización supervisada: cubo los datos de cada fila y realiza una reescala lineal basada en los intervalos calculados. El cálculo de la discretización se basa en la correlación de la columna Etiqueta.
  • Escalado sólido: opcionalmente centra los datos y las escalas en función del intervalo de datos y los valores mínimo y máximo cuantiles proporcionados. Este método es más sólido para valores atípicos.

Detalles del estimador

El intervalo de los datos normalizados depende de si se especifica fixZero o no. fixZero tiene como valor predeterminado true. Cuando fixZero es false, el intervalo normalizado es $[0,1]$ y la distribución de los valores normalizados depende del modo de normalización. Por ejemplo, con Min Max, los valores mínimo y máximo se asignan a 0 y 1 respectivamente y los valores restantes se encuentran entre sí. Cuando se establece fixZero, el intervalo normalizado es $[-1,1]$ con la distribución de los valores normalizados según el modo de normalización, pero el comportamiento es diferente. Con Min Max, la distribución depende de la distancia que el número es de 0, lo que da como resultado el número con la distancia más grande que se asigna a 1 si es un número positivo o -1 si es un número negativo. La distancia a partir de 0 afectará a la distribución con una mayoría de números que están más cerca de normalizar hacia 0. El escalado sólido no usa fixZero y sus valores no están restringidos a $[0,1]$ o $[-1,1]$. Su escalado se basa en el intervalo de los datos y el mínimo cuantiles y el máximo proporcionados.

La ecuación para la salida $y$ de aplicar la varianza media y la varianza media del registro en la entrada $x$ sin usar la opción CDF es: $y = (x - \text{offset}) \text{scale}$. Donde el desplazamiento y la escala se calculan durante el entrenamiento.

Con la opción CDF es: $y = 0,5 * (1 + \text{ERF}((x - \text{mean}) / (\text{desviación estándar} * sqrt(2))$. Donde ERF es la función de error que se usa para aproximar el CDF de una variable aleatoria que se supone que se distribuye normalmente. La media y la desviación estándar son informáticas durante el entrenamiento.

Para crear este estimador, use una de las siguientes opciones:

Consulte los vínculos anteriores para ver ejemplos de uso.

Métodos

Fit(IDataView)

Entrena y devuelve un NormalizingTransformer.

GetOutputSchema(SchemaShape)

Devuelve el SchemaShape valor del esquema que generará el transformador. Se usa para la propagación y comprobación de esquemas en una canalización.

Métodos de extensión

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Anexe un "punto de control de almacenamiento en caché" a la cadena del estimador. Esto garantizará que los estimadores de nivel inferior se entrenarán con los datos almacenados en caché. Resulta útil tener un punto de control de almacenamiento en caché antes de que los instructores tomen varios pases de datos.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dado un estimador, devuelva un objeto de ajuste que llamará a un delegado una vez Fit(IDataView) que se llame. A menudo, es importante que un estimador devuelva información sobre lo que cabe, por lo que el Fit(IDataView) método devuelve un objeto con tipo específico, en lugar de simplemente un general ITransformer. Sin embargo, al mismo tiempo, IEstimator<TTransformer> a menudo se forman en canalizaciones con muchos objetos, por lo que es posible que tengamos que crear una cadena de estimadores a través EstimatorChain<TLastTransformer> de donde el estimador para el que queremos obtener el transformador está enterrado en algún lugar de esta cadena. En ese escenario, podemos a través de este método adjuntar un delegado al que se llamará una vez que se llame a fit.

Se aplica a