Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Логистическая регрессия — это хорошо известный статистический метод, используемый для моделирования двоичных результатов.
Существуют различные реализации логистической регрессии в исследованиях статистики, используя различные методы обучения. Алгоритм логистической регрессии Майкрософт реализован с помощью варианта алгоритма нейронной сети Майкрософт. Этот алгоритм разделяет многие качества нейронных сетей, но проще обучать.
Одним из преимуществ логистической регрессии является то, что алгоритм является очень гибким, принимая любой тип входных данных и поддерживает несколько различных аналитических задач:
Используйте демографические данные для прогнозирования результатов, таких как риск для определенной болезни.
Изучать и взвешивать факторы, которые способствуют результату. Например, найдите факторы, которые побуждают клиентов совершить повторный визит в магазин.
Классифицируйте документы, электронную почту или другие объекты, имеющие множество атрибутов.
Пример
Рассмотрим группу людей, которые делятся аналогичной демографическими сведениями и которые покупают продукты из компании Adventure Works. Моделируя данные, связанные с конкретным результатом, например приобретение целевого продукта, вы можете увидеть, как демографические данные способствуют вероятности покупки целевого продукта.
Принцип работы алгоритма
Логистическая регрессия — это известный статистический метод для определения вклада нескольких факторов в пару результатов. Реализация Майкрософт использует измененную нейронную сеть для моделирования связей между входными и выходными данными. Результат каждого входного значения для выходных данных измеряется, а различные входные данные взвешиваются в готовой модели. Название логистическая регрессия происходит от того, что данные преобразуются с помощью логистического преобразования, чтобы свести к минимуму эффект экстремальных значений. Дополнительные сведения о реализации и настройке алгоритма см. в техническом справочнике по алгоритму логистической регрессии Майкрософт.
Данные, необходимые для моделей логистической регрессии
При подготовке данных для обучения модели логистической регрессии необходимо понимать требования для конкретного алгоритма, включая необходимые данные и способ использования данных.
Требования к модели логистической регрессии приведены следующим образом:
Один ключевой столбец Каждая модель должна содержать один числовый или текстовый столбец, который однозначно идентифицирует каждую запись. Составные ключи не допускаются.
Входные столбцы Каждая модель должна содержать по крайней мере один входной столбец, содержащий значения, используемые в качестве факторов анализа. Можно иметь столько входных столбцов, сколько нужно, но в зависимости от количества значений в каждом столбце добавление дополнительных столбцов может увеличить время обучения модели.
По крайней мере один прогнозируемый столбец Модель должна содержать по крайней мере один прогнозируемый столбец любого типа данных, включая непрерывные числовые данные. Значения прогнозируемого столбца также можно рассматривать как входные данные модели или указать, что он используется только для прогнозирования. Вложенные таблицы не допускаются для прогнозируемых столбцов, но могут использоваться в качестве входных данных.
Дополнительные сведения о типах контента и типах данных, поддерживаемых для моделей логистической регрессии, см. в разделе "Требования" технического справочника по алгоритму логистической регрессии Майкрософт.
Просмотр модели логистической регрессии
Для изучения модели можно использовать средство просмотра нейронных сетей Майкрософт или средство просмотра дерева универсального содержимого Майкрософт.
При просмотре модели с помощью средства просмотра нейронной сети Майкрософт службы Analysis Services показывают факторы, которые способствуют определенному результату, ранжированному по их важности. Для сравнения можно выбрать атрибут и значения. Дополнительные сведения см. в статье "Обзор модели с помощью средства просмотра нейронных сетей Майкрософт".
Если вы хотите узнать больше, вы можете просмотреть сведения о модели с помощью средства просмотра дерева универсального содержимого Майкрософт. Содержимое модели для модели логистической регрессии включает в себя маргинальный узел, показывающий все входные данные, используемые для модели, и подсети для прогнозируемых атрибутов. Дополнительные сведения см. в разделе "Содержимое модели интеллектуального анализа данных" для моделей логистической регрессии (службы Analysis Services — интеллектуальный анализ данных).
Создание прогнозов
После обучения модели можно создать запросы к содержимому модели, чтобы получить коэффициенты регрессии и другие сведения, или использовать модель для прогнозирования.
Общие сведения о создании запросов к модели интеллектуального анализа данных см. в разделе "Запросы интеллектуального анализа данных".
Примеры запросов к модели логистической регрессии см. в примерах запросов к модели кластеризации.
Замечания
Не поддерживает функцию drillthrough. Это связано с тем, что структура узлов в модели добычи данных не обязательно непосредственно соответствует базовым данным.
Не поддерживает создание измерений дата-майнинга.
Поддерживает использование OLAP-моделей для интеллектуального анализа данных.
Не поддерживает использование языка разметки прогнозной модели (PMML) для создания моделей анализа данных.
См. также
Содержимое модели интеллектуального анализа данных для моделей логистической регрессии (службы Analysis Services — интеллектуальный анализ данных)
Технический справочник по алгоритму логистической регрессии Майкрософт
Примеры запросов модели логистической регрессии