Compartir por


microsoftml.mutualinformation_select: selección de características basada en información mutua

Usage

microsoftml.mutualinformation_select(cols: [list, str], label: str,
    num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)

Description

Selecciona las características k principales en todas las columnas especificadas ordenadas por su información mutua con la columna de etiqueta.

Detalles

La información mutua de dos variables X aleatorias y Y es una medida de la dependencia mutua entre las variables. Formalmente, la información mutua se puede escribir como:

I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]

donde la expectativa se toma sobre la distribución conjunta de X y Y. Esta p(x,y) es la función de densidad de probabilidad conjunta de X y Y, p(x) y p(y) son las funciones de densidad de probabilidad marginal de X y Y respectivamente. En general, una mayor información mutua entre la variable dependiente (o etiqueta) y una variable independiente (o característica) significa que la etiqueta tiene una mayor dependencia mutua sobre esa característica.

El modo de selección de características de información mutua selecciona las características en función de la información mutua. Mantiene las principales num_features_to_keep características con la información mutua más grande con la etiqueta .

Arguments

cols

Especifica la cadena de caracteres o la lista de los nombres de las variables que se van a seleccionar.

label

Especifica el nombre de la etiqueta.

num_features_to_keep

Si se especifica el número de características que se deben mantener como n, la transformación elige las n características que tienen la información mutua más alta con la variable dependiente. El valor predeterminado es 1000.

num_bins

Número máximo de intervalos para valores numéricos. Se recomiendan potencias de 2. El valor predeterminado es 256.

kargs

Argumentos adicionales enviados al motor de proceso.

Devoluciones

Objeto que define la transformación.

Consulte también

count_select

Referencias

Wikipedia: Información mutua