microsoftml.mutualinformation_select: selezione delle caratteristiche in base alle informazioni reciproche

Utilizzo

microsoftml.mutualinformation_select(cols: [list, str], label: str,
    num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)

Descrizione

Seleziona le principali funzionalità k in tutte le colonne specificate ordinate in base alle relative informazioni reciproche con la colonna etichetta.

Dettagli

Le informazioni reciproche di due variabili X casuali e Y sono una misura della dipendenza reciproca tra le variabili. Formalmente, le informazioni reciproche possono essere scritte come:

I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]

dove l'aspettativa viene presa in considerazione la distribuzione congiunta di X e Y. Di seguito p(x,y) è riportata la funzione di densità di probabilità congiunta di X e p(x)Ye p(y) sono rispettivamente le funzioni di densità di probabilità marginale di X e Y . In generale, una maggiore informazione reciproca tra la variabile dipendente (o etichetta) e una variabile indipendente (o funzionalità) significa che l'etichetta ha una dipendenza reciproca più elevata rispetto a tale funzionalità.

La modalità di selezione delle informazioni reciproca seleziona le funzionalità in base alle informazioni reciproche. Mantiene le caratteristiche principali num_features_to_keep con le informazioni reciproche più grandi con l'etichetta.

Argomenti

Cols

Specifica la stringa di caratteri o l'elenco dei nomi delle variabili da selezionare.

label

Specifica il nome dell'etichetta.

num_features_to_keep

Se il numero di funzionalità da mantenere viene specificato come n, la trasformazione seleziona le n funzionalità con le informazioni reciproche più elevate con la variabile dipendente. Il valore predefinito è 1000.

num_bins

Numero massimo di contenitori per i valori numerici. Sono raccomandati poteri di 2. Il valore predefinito è 256.

karg

Argomenti aggiuntivi inviati al motore di calcolo.

Restituisce

Oggetto che definisce la trasformazione.

Vedi anche

count_select

Riferimenti

Wikipedia: Informazioni reciproche