Бөлісу құралы:


microsoftml.mutualinformation_select: выбор компонентов на основе взаимной информации

Usage

microsoftml.mutualinformation_select(cols: [list, str], label: str,
    num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)

Description

Выбирает основные функции k для всех указанных столбцов, упорядоченных по их взаимной информации с столбцом меток.

Сведения

Взаимная информация двух случайных переменных и Y является мерой взаимной зависимости между переменнымиX. Формально взаимная информация может быть написана следующим образом:

I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]

где ожидание берется за совместное распределение X и Y. Вот p(x,y) общая функция X плотности вероятности и Y, p(x) а p(y) также являются функциями маргинальной плотности X вероятности и Y соответственно. Как правило, более высокая взаимная информация между зависимой переменной (или меткой) и независимой переменной (или функцией) означает, что метка имеет более высокую взаимную зависимость от этой функции.

Режим выбора взаимной информации выбирает функции на основе взаимной информации. Он сохраняет основные num_features_to_keep функции с самой большой взаимной информацией с меткой.

Arguments

cols

Задает символьную строку или список имен переменных, которые нужно выбрать.

label

Указывает имя метки.

num_features_to_keep

Если указано число хранимых nфункций, преобразование выбирает n функции, имеющие самую высокую взаимную информацию с зависимой переменной. Значение по умолчанию — 1000.

num_bins

Максимальное число ячеек для числовых значений. Рекомендуется использовать полномочия 2. Значение по умолчанию — 256.

карги

Дополнительные аргументы, отправленные в подсистему вычислений.

Возвраты

Объект, определяющий преобразование.

См. также

count_select

Ссылки

Википедия: взаимная информация