Поделиться через


Алгоритмы добычи данных (Analysis Services — добыча данных)

Алгоритм интеллектуального анализа данных — это набор эвристики и вычислений, который создает модель интеллектуального анализа данных из данных. Чтобы создать модель, алгоритм сначала анализирует предоставленные данные, ищет конкретные типы шаблонов или тенденций. Алгоритм использует результаты этого анализа для определения оптимальных параметров для создания модели добычи данных. Затем эти параметры применяются ко всему набору данных для извлечения практических шаблонов и подробных статистических данных.

Модель добычи данных, созданная алгоритмом, может принимать различные формы, в том числе:

  • Набор кластеров, описывающий, как связаны случаи в наборе данных.

  • Дерево принятия решений, которое прогнозирует результат и описывает, как различные критерии влияют на этот результат.

  • Математическая модель, которая прогнозирует продажи.

  • Набор правил, описывающих, как продукты группируются в транзакции, и вероятности того, что продукты приобретаются вместе.

Службы Microsoft SQL Server Analysis Services предоставляют несколько алгоритмов для использования в решениях интеллектуального анализа данных. Эти алгоритмы являются реализацией некоторых наиболее популярных методологий, используемых в интеллектуальном анализе данных. Все алгоритмы интеллектуального анализа данных Майкрософт можно настроить и полностью программировать с помощью предоставленных API или с помощью компонентов интеллектуального анализа данных в службах SQL Server Integration Services.

Кроме того, можно использовать сторонние алгоритмы, соответствующие спецификации OLE DB для интеллектуального анализа данных, или разрабатывать пользовательские алгоритмы, которые можно зарегистрировать в качестве служб, а затем использовать в платформе интеллектуального анализа данных SQL Server.

Выбор правильного алгоритма

Выбор оптимального алгоритма для конкретной аналитической задачи может быть проблемой. Хотя для выполнения одной бизнес-задачи можно использовать разные алгоритмы, каждый алгоритм создает другой результат, а некоторые алгоритмы могут создавать несколько типов результатов. Например, можно использовать алгоритм деревьев принятия решений Майкрософт не только для прогнозирования, но и для уменьшения количества столбцов в наборе данных, так как дерево принятия решений может определять столбцы, не влияющие на окончательную модель интеллектуального анализа данных.

Выбор алгоритма по типу

Службы Analysis Services включают следующие типы алгоритмов:

  • Алгоритмы классификации прогнозируют одну или несколько дискретных переменных на основе других атрибутов в наборе данных.

  • Алгоритмы регрессии прогнозируют одну или несколько непрерывных переменных, например прибыль или потерю, на основе других атрибутов в наборе данных.

  • Алгоритмы сегментации делят данные на группы или кластеры элементов с аналогичными свойствами.

  • Алгоритмы сопоставления находят корреляции между различными атрибутами в наборе данных. Наиболее распространенное применение такого алгоритма заключается в создании правил ассоциации, которые можно использовать в анализе рыночной корзины.

  • Алгоритмы анализа последовательностей обобщают частые последовательности или эпизоды в данных, например поток веб-трафика.

Однако нет никаких причин, по которым в решениях следует ограничиться одним алгоритмом. Опытные аналитики иногда используют один алгоритм для определения наиболее эффективных входных данных (то есть переменных), а затем применяет другой алгоритм для прогнозирования определенного результата на основе этих данных. Интеллектуальный анализ данных SQL Server позволяет создавать несколько моделей в одной структуре интеллектуального анализа данных, поэтому в одном решении интеллектуального анализа данных можно использовать алгоритм кластеризации, модель деревьев принятия решений и наивную модель Bayes для получения различных представлений о данных. Можно также использовать несколько алгоритмов в одном решении для выполнения отдельных задач: например, можно использовать регрессию для получения финансовых прогнозов и использовать алгоритм нейронной сети для анализа факторов, влияющих на продажи.

Выбор алгоритма по задаче

Чтобы помочь выбрать алгоритм для использования с определенной задачей, в следующей таблице приведены предложения по типам задач, для которых традиционно используется каждый алгоритм.

Примеры задач Алгоритмы Майкрософт для использования
Прогнозирование дискретного атрибута

Помечайте клиентов в списке потенциальных покупателей как хорошие или плохие кандидаты.

Вычислите вероятность сбоя сервера в течение следующих 6 месяцев.

Классификация результатов пациентов и изучение связанных факторов.
Алгоритм деревьев принятия решений Майкрософт

Алгоритм Microsoft Naive Bayes

Алгоритм кластеризации Майкрософт

Алгоритм нейронной сети Майкрософт
Прогнозирование непрерывного атрибута

Прогноз продаж в следующем году.

Прогнозирование посетителей сайта с учетом прошлых и сезонных тенденций.

Создайте оценку риска с учетом демографических данных.
Алгоритм деревьев принятия решений Майкрософт

Алгоритм временных рядов Майкрософт

Алгоритм линейной регрессии Майкрософт
Прогнозирование последовательности

Выполните анализ потоков кликов на веб-сайте компании.

Анализ факторов, ведущих к сбою сервера.

Сбор и анализ последовательностей действий во время амбулаторных посещений, чтобы сформулировать рекомендации по общепринятым действиям.
Алгоритм кластеризации последовательностей Майкрософт
Поиск групп распространенных элементов в транзакциях

Используйте анализ корзины рынка для определения размещения продуктов.

Предложить дополнительные продукты клиенту для покупки.

Анализ данных опроса от посетителей мероприятия, чтобы выяснить, какие действия или стенды имеют взаимосвязь, для планирования будущих мероприятий.
Алгоритм ассоциации Майкрософт

Алгоритм деревьев принятия решений Майкрософт
Поиск групп похожих элементов

Создайте группы профилей риска пациентов на основе таких атрибутов, как демографические данные и поведение.

Анализируйте пользователей по шаблонам их просмотра и покупок.

Определите серверы, имеющие аналогичные характеристики использования.
Алгоритм кластеризации Майкрософт

Алгоритм кластеризации последовательностей Майкрософт

В следующей таблице приведены ссылки на ресурсы обучения для каждого алгоритма интеллектуального анализа данных, предоставляемых в службах Analysis Services:

Описание базового алгоритма Объясняет, что делает алгоритм и как он работает, и описывает возможные бизнес-сценарии, в которых алгоритм может оказаться полезным.
Алгоритм ассоциации Майкрософт

Алгоритм кластеризации Майкрософт

Алгоритм деревьев принятия решений Майкрософт

Алгоритм линейной регрессии Майкрософт

Алгоритм логистической регрессии Майкрософт

Алгоритм Microsoft Naive Bayes

Алгоритм нейронной сети Майкрософт

Алгоритм кластеризации последовательностей Майкрософт

Алгоритм временных рядов Майкрософт
Технический справочник Предоставляет технические сведения о реализации алгоритма с академическими ссылками по мере необходимости. Выводит список параметров, которые можно задать для управления поведением алгоритма и настройки результатов в модели. Описывает требования к данным и предоставляет советы по производительности, если это возможно.
Технический справочник по алгоритму ассоциаций Майкрософт

Технический справочник по алгоритму кластеризации Майкрософт

Технический справочник по алгоритму деревьев принятия решений Майкрософт

Технический справочник по алгоритму линейной регрессии Майкрософт

Технический справочник по алгоритму логистической регрессии Майкрософт

Технический справочник по наивному алгоритму Байеса

Технический справочник по алгоритму нейронной сети Майкрософт

Технический справочник по алгоритму кластеризации последовательностей Майкрософт

Технический справочник по алгоритму временных рядов Майкрософт
Содержимое модели Описывает структуру информации в каждом типе модели интеллектуального анализа данных и объясняет, как интерпретировать сведения, хранящиеся в каждом узле.
Содержимое модели интеллектуального анализа данных для моделей ассоциаций (службы Analysis Services — интеллектуальный анализ данных)

Содержимое модели интеллектуального анализа данных для моделей кластеризации (службы Analysis Services — интеллектуальный анализ данных)

Содержимое модели интеллектуального анализа данных для моделей дерева принятия решений (службы Analysis Services — интеллектуальный анализ данных)

Содержимое модели интеллектуального анализа данных для моделей линейной регрессии (службы Analysis Services — интеллектуальный анализ данных)

Содержимое модели интеллектуального анализа данных для моделей логистической регрессии (службы Analysis Services — интеллектуальный анализ данных)

Содержимое модели интеллектуального анализа для моделей Наивного Байеса (Analysis Services — интеллектуальный анализ)

Модель контента интеллектуального анализа данных для моделей нейронных сетей (Analysis Services — интеллектуальный анализ данных)

Содержимое модели интеллектуального анализа данных для моделей кластеризации последовательностей (службы Analysis Services — интеллектуальный анализ данных)

Содержимое модели анализа данных для моделей временных рядов (службы Analysis Services — интеллектуальный анализ данных)
Запросы интеллектуального анализа данных Предоставляет несколько запросов, которые можно использовать с каждым типом модели. К примерам относятся запросы содержимого, которые позволяют узнать больше о шаблонах в модели и прогнозируемых запросах, которые помогут вам создавать прогнозы на основе этих шаблонов.
Примеры запросов модели ассоциаций

Примеры запросов модели кластеризации

Примеры запросов модели дерева принятия решений

Примеры запросов модели линейной регрессии

Примеры запросов модели логистической регрессии

Примеры наивных примеров запросов модели Bayes

Примеры запросов модели нейронной сети

Примеры запросов модели кластеризации последовательностей

Примеры запросов модели временных рядов
Тема Описание
Определение алгоритма, используемого моделью интеллектуального анализа данных Запросите параметры, используемые для создания модели интеллектуального анализа данных
Создайте пользовательский алгоритм Plug-In Алгоритмы подключаемого модуля
Изучение модели с помощью средства просмотра алгоритмов Средства просмотра моделей интеллектуального анализа данных
Просмотр содержимого модели с помощью универсального формата таблицы Просмотр модели с помощью средства просмотра дерева универсального содержимого Майкрософт
Узнайте, как настроить данные и использовать алгоритмы для создания моделей Структуры добычи данных (Analysis Services — интеллектуальный анализ данных)

Модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

См. также

Средства интеллектуального анализа данных