Aracılığıyla paylaş


microsoftml.mutualinformation_select: Karşılıklı bilgilere göre özellik seçimi

Usage

microsoftml.mutualinformation_select(cols: [list, str], label: str,
    num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)

Description

Etiket sütunuyla karşılıklı bilgilerine göre sıralanmış tüm belirtilen sütunlarda en üstteki k özelliklerini seçer.

Ayrıntılar

İki rastgele değişkenin X karşılıklı bilgileri ve Y değişkenler arasındaki karşılıklı bağımlılığın ölçüsüdür. Resmi olarak, karşılıklı bilgiler şöyle yazılabilir:

I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]

ve ortak dağılımı XYüzerinde beklentinin ele alındığı durumlar. Ve'nin p(x,y)XYp(x) eklem olasılık yoğunluğu işlevi aşağıdadır ve p(y) sırasıyla ve'nin XY marjinal olasılık yoğunluğu işlevleridir. Genel olarak, bağımlı değişken (veya etiket) ile bağımsız değişken (veya özellik) arasında daha yüksek karşılıklı bilgi olması, etiketin bu özellik üzerinde daha yüksek karşılıklı bağımlılığı olduğu anlamına gelir.

Karşılıklı bilgi özelliği seçim modu, karşılıklı bilgilere göre özellikleri seçer. Etiketle en büyük karşılıklı bilgilere sahip en önemli num_features_to_keep özellikleri tutar.

Arguments

Cols

Karakter dizesini veya seçecek değişkenlerin adlarının listesini belirtir.

label

Etiketin adını belirtir.

num_features_to_keep

Tutulacak özellik sayısı olarak nbelirtilirse, dönüşüm bağımlı değişkenle en yüksek karşılıklı bilgiye sahip olan özellikleri seçer n . Varsayılan değer 1000'dir.

num_bins

Sayısal değerler için en fazla bölme sayısı. 2'nin gücü önerilir. Varsayılan değer 256'dır.

kargs

İşlem altyapısına gönderilen ek bağımsız değişkenler.

İade

Dönüşümü tanımlayan bir nesne.

Ayrıca bakınız

count_select

References

Vikipedi: Karşılıklı Bilgi