Megosztás:


microsoftml.mutualinformation_select: Funkcióválasztás kölcsönös információk alapján

Usage

microsoftml.mutualinformation_select(cols: [list, str], label: str,
    num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)

Description

Kiválasztja az összes megadott oszlop legfontosabb k funkcióit, amelyek a címkeoszlopmal kapcsolatos kölcsönös információik szerint rendezve jelennek meg.

Részletek

Két véletlenszerű változó kölcsönös információja, és Y a változók X közötti kölcsönös függőség mértéke. Formálisan a kölcsönös információ a következőképpen írható:

I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]

amennyiben az elvárás átvenni a közös eloszlást X és Ya . Itt p(x,y) van a közös valószínűség sűrűségfüggvénye X és Y, p(x) és p(y) a marginális sűrűségfüggvényei X és Y azok. Általánosságban elmondható, hogy a függő változó (vagy címke) és a független változó (vagy funkció) közötti magasabb kölcsönös információ azt jelenti, hogy a címke nagyobb kölcsönös függőséggel rendelkezik az adott funkciótól.

A kölcsönös tájékoztatási funkcióválasztási mód a kölcsönös információk alapján választja ki a funkciókat. Megtartja a legfontosabb num_features_to_keep funkciókat a címkével együtt a legnagyobb kölcsönös információkkal.

Arguments

cols

Megadja a kijelölendő változók karaktersztringjének vagy nevének listáját.

címke

Megadja a címke nevét.

num_features_to_keep

Ha a megtartandó funkciók száma meg van adva n, az átalakítás azokat a n funkciókat választja ki, amelyek a legmagasabb kölcsönös információkkal rendelkeznek a függő változóval. Az alapértelmezett érték 1000.

num_bins

Számértékek tárolóinak maximális száma. A 2-ből álló képességek használata ajánlott. Az alapértelmezett érték 256.

kargs

A számítási motornak küldött további argumentumok.

Visszatérítések

Az átalakítást meghatározó objektum.

Lásd még

count_select

Hivatkozások

Wikipedia: Kölcsönös információ