Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Usage
microsoftml.mutualinformation_select(cols: [list, str], label: str,
num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)
Description
Wählt die oberen k-Features in allen angegebenen Spalten aus, die nach ihren gegenseitigen Informationen mit der Beschriftungsspalte sortiert sind.
Einzelheiten
Die gegenseitigen Informationen von zwei Zufallsvariablen X und Y sind ein Maß für die gegenseitige Abhängigkeit zwischen den Variablen. Formell können die gegenseitigen Informationen wie folgt geschrieben werden:
I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]
wenn die Erwartung über die gemeinsame Verteilung X von und .Y Hier p(x,y) ist die Gemeinsame Wahrscheinlichkeitsdichtefunktion von X und Y, p(x) und p(y) sind die Grenzwahrscheinlichkeitsdichtefunktionen von X bzw Y . Im Allgemeinen bedeutet eine höhere gegenseitige Information zwischen der abhängigen Variablen (oder Bezeichnung) und einer unabhängigen Variablen (oder Funktion), dass die Bezeichnung eine höhere gegenseitige Abhängigkeit von diesem Feature hat.
Der Auswahlmodus für gegenseitige Informationen wählt die Features basierend auf den gegenseitigen Informationen aus. Es behält die wichtigsten num_features_to_keep Features mit den größten gegenseitigen Informationen mit dem Etikett bei.
Arguments
Cols
Gibt eine Zeichenfolge oder Liste der Namen der auszuwählenden Variablen an.
label
Gibt den Namen der Bezeichnung an.
num_features_to_keep
Wenn die Anzahl der zu behaltenden Features angegeben nist, wählt die Transformation die n Features mit den höchsten gegenseitigen Informationen mit der abhängigen Variablen aus. Der Standardwert lautet „1000“.
num_bins
Maximale Anzahl von Bins für numerische Werte. Befugnisse von 2 werden empfohlen. Der Standardwert ist 256.
Kargs
Zusätzliche Argumente, die an das Computemodul gesendet werden.
Rückkehr
Ein Objekt, das die Transformation definiert.