Delen via


microsoftml.mutualinformation_select: Functieselectie op basis van wederzijdse informatie

Usage

microsoftml.mutualinformation_select(cols: [list, str], label: str,
    num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)

Description

Hiermee selecteert u de bovenste k-functies voor alle opgegeven kolommen die zijn geordend op basis van hun wederzijdse informatie met de labelkolom.

Bijzonderheden

De wederzijdse informatie van twee willekeurige variabelen X en Y is een meting van de wederzijdse afhankelijkheid tussen de variabelen. Formeel kan de wederzijdse informatie worden geschreven als:

I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]

wanneer de verwachting wordt overgenomen over de gezamenlijke verdeling van X en Y. Hier p(x,y) volgt de gezamenlijke kansdichtheidsfunctie van X en Y, p(x) en p(y) zijn de marginale kansdichtheidsfuncties van X respectievelijk Y . Over het algemeen betekent een hogere wederzijdse informatie tussen de afhankelijke variabele (of het label) en een onafhankelijke variabele (of functie) dat het label een hogere wederzijdse afhankelijkheid van die functie heeft.

De selectiemodus voor wederzijdse informatie selecteert de functies op basis van de wederzijdse informatie. Het bewaart de belangrijkste num_features_to_keep functies met de grootste wederzijdse informatie met het label.

Arguments

Cols

Hiermee geeft u tekenreeks of lijst van de namen van de variabelen die u wilt selecteren.

label

Hiermee geeft u de naam van het label.

num_features_to_keep

Als het aantal functies dat moet worden bewaard, moet worden nopgegeven, kiest de transformatie de n functies met de hoogste wederzijdse informatie met de afhankelijke variabele. De standaardwaarde is 1000.

num_bins

Maximum aantal bins voor numerieke waarden. Bevoegdheden van 2 worden aanbevolen. De standaardwaarde is 256.

kargs

Aanvullende argumenten die naar de berekeningsengine worden verzonden.

Retouren

Een object dat de transformatie definieert.

Zie ook

count_select

References

Wikipedia: Wederzijdse informatie