Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
Usage
microsoftml.mutualinformation_select(cols: [list, str], label: str,
num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)
Description
Kiválasztja az összes megadott oszlop legfontosabb k funkcióit, amelyek a címkeoszlopmal kapcsolatos kölcsönös információik szerint rendezve jelennek meg.
Részletek
Két véletlenszerű változó kölcsönös információja, és Y a változók X közötti kölcsönös függőség mértéke. Formálisan a kölcsönös információ a következőképpen írható:
I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]
amennyiben az elvárás átvenni a közös eloszlást X és Ya . Itt p(x,y) van a közös valószínűség sűrűségfüggvénye X és Y, p(x) és p(y) a marginális sűrűségfüggvényei X és Y azok. Általánosságban elmondható, hogy a függő változó (vagy címke) és a független változó (vagy funkció) közötti magasabb kölcsönös információ azt jelenti, hogy a címke nagyobb kölcsönös függőséggel rendelkezik az adott funkciótól.
A kölcsönös tájékoztatási funkcióválasztási mód a kölcsönös információk alapján választja ki a funkciókat. Megtartja a legfontosabb num_features_to_keep funkciókat a címkével együtt a legnagyobb kölcsönös információkkal.
Arguments
cols
Megadja a kijelölendő változók karaktersztringjének vagy nevének listáját.
címke
Megadja a címke nevét.
num_features_to_keep
Ha a megtartandó funkciók száma meg van adva n, az átalakítás azokat a n funkciókat választja ki, amelyek a legmagasabb kölcsönös információkkal rendelkeznek a függő változóval. Az alapértelmezett érték 1000.
num_bins
Számértékek tárolóinak maximális száma. A 2-ből álló képességek használata ajánlott. Az alapértelmezett érték 256.
kargs
A számítási motornak küldött további argumentumok.
Visszatérítések
Az átalakítást meghatározó objektum.