Freigeben über


microsoftml.mutualinformation_select: Featureauswahl basierend auf gegenseitigen Informationen

Usage

microsoftml.mutualinformation_select(cols: [list, str], label: str,
    num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)

Description

Wählt die oberen k-Features in allen angegebenen Spalten aus, die nach ihren gegenseitigen Informationen mit der Beschriftungsspalte sortiert sind.

Einzelheiten

Die gegenseitigen Informationen von zwei Zufallsvariablen X und Y sind ein Maß für die gegenseitige Abhängigkeit zwischen den Variablen. Formell können die gegenseitigen Informationen wie folgt geschrieben werden:

I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]

wenn die Erwartung über die gemeinsame Verteilung X von und .Y Hier p(x,y) ist die Gemeinsame Wahrscheinlichkeitsdichtefunktion von X und Y, p(x) und p(y) sind die Grenzwahrscheinlichkeitsdichtefunktionen von X bzw Y . Im Allgemeinen bedeutet eine höhere gegenseitige Information zwischen der abhängigen Variablen (oder Bezeichnung) und einer unabhängigen Variablen (oder Funktion), dass die Bezeichnung eine höhere gegenseitige Abhängigkeit von diesem Feature hat.

Der Auswahlmodus für gegenseitige Informationen wählt die Features basierend auf den gegenseitigen Informationen aus. Es behält die wichtigsten num_features_to_keep Features mit den größten gegenseitigen Informationen mit dem Etikett bei.

Arguments

Cols

Gibt eine Zeichenfolge oder Liste der Namen der auszuwählenden Variablen an.

label

Gibt den Namen der Bezeichnung an.

num_features_to_keep

Wenn die Anzahl der zu behaltenden Features angegeben nist, wählt die Transformation die n Features mit den höchsten gegenseitigen Informationen mit der abhängigen Variablen aus. Der Standardwert lautet „1000“.

num_bins

Maximale Anzahl von Bins für numerische Werte. Befugnisse von 2 werden empfohlen. Der Standardwert ist 256.

Kargs

Zusätzliche Argumente, die an das Computemodul gesendet werden.

Rückkehr

Ein Objekt, das die Transformation definiert.

Siehe auch

count_select

References

Wikipedia: Gegenseitige Informationen