Ескертпе
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Жүйеге кіруді немесе каталогтарды өзгертуді байқап көруге болады.
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Каталогтарды өзгертуді байқап көруге болады.
Usage
microsoftml.mutualinformation_select(cols: [list, str], label: str,
num_features_to_keep: int = 1000, num_bins: int = 256, **kargs)
Description
Выбирает основные функции k для всех указанных столбцов, упорядоченных по их взаимной информации с столбцом меток.
Сведения
Взаимная информация двух случайных переменных и Y является мерой взаимной зависимости между переменнымиX. Формально взаимная информация может быть написана следующим образом:
I(X;Y) = E[log(p(x,y)) - log(p(x)) - log(p(y))]
где ожидание берется за совместное распределение X и Y. Вот p(x,y) общая функция X плотности вероятности и Y, p(x) а p(y) также являются функциями маргинальной плотности X вероятности и Y соответственно. Как правило, более высокая взаимная информация между зависимой переменной (или меткой) и независимой переменной (или функцией) означает, что метка имеет более высокую взаимную зависимость от этой функции.
Режим выбора взаимной информации выбирает функции на основе взаимной информации. Он сохраняет основные num_features_to_keep функции с самой большой взаимной информацией с меткой.
Arguments
cols
Задает символьную строку или список имен переменных, которые нужно выбрать.
label
Указывает имя метки.
num_features_to_keep
Если указано число хранимых nфункций, преобразование выбирает n функции, имеющие самую высокую взаимную информацию с зависимой переменной. Значение по умолчанию — 1000.
num_bins
Максимальное число ячеек для числовых значений. Рекомендуется использовать полномочия 2. Значение по умолчанию — 256.
карги
Дополнительные аргументы, отправленные в подсистему вычислений.
Возвраты
Объект, определяющий преобразование.