Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Usage
microsoftml.mutualinformation_select(cols: [list, str], label: str,
num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)
Description
Выбирает основные функции k для всех указанных столбцов, упорядоченных по их взаимной информации с столбцом меток.
Сведения
Взаимная информация двух случайных переменных и Y является мерой взаимной зависимости между переменнымиX. Формально взаимная информация может быть написана следующим образом:
I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]
где ожидание берется за совместное распределение X и Y. Вот p(x,y) общая функция X плотности вероятности и Y, p(x) а p(y) также являются функциями маргинальной плотности X вероятности и Y соответственно. Как правило, более высокая взаимная информация между зависимой переменной (или меткой) и независимой переменной (или функцией) означает, что метка имеет более высокую взаимную зависимость от этой функции.
Режим выбора взаимной информации выбирает функции на основе взаимной информации. Он сохраняет основные num_features_to_keep функции с самой большой взаимной информацией с меткой.
Arguments
cols
Задает символьную строку или список имен переменных, которые нужно выбрать.
label
Указывает имя метки.
num_features_to_keep
Если указано число хранимых nфункций, преобразование выбирает n функции, имеющие самую высокую взаимную информацию с зависимой переменной. Значение по умолчанию — 1000.
num_bins
Максимальное число ячеек для числовых значений. Рекомендуется использовать полномочия 2. Значение по умолчанию — 256.
карги
Дополнительные аргументы, отправленные в подсистему вычислений.
Возвраты
Объект, определяющий преобразование.