Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Алгоритм интеллектуального анализа данных — это набор эвристики и вычислений, который создает модель интеллектуального анализа данных из данных. Чтобы создать модель, алгоритм сначала анализирует предоставленные данные, ищет конкретные типы шаблонов или тенденций. Алгоритм использует результаты этого анализа для определения оптимальных параметров для создания модели добычи данных. Затем эти параметры применяются ко всему набору данных для извлечения практических шаблонов и подробных статистических данных.
Модель добычи данных, созданная алгоритмом, может принимать различные формы, в том числе:
Набор кластеров, описывающий, как связаны случаи в наборе данных.
Дерево принятия решений, которое прогнозирует результат и описывает, как различные критерии влияют на этот результат.
Математическая модель, которая прогнозирует продажи.
Набор правил, описывающих, как продукты группируются в транзакции, и вероятности того, что продукты приобретаются вместе.
Службы Microsoft SQL Server Analysis Services предоставляют несколько алгоритмов для использования в решениях интеллектуального анализа данных. Эти алгоритмы являются реализацией некоторых наиболее популярных методологий, используемых в интеллектуальном анализе данных. Все алгоритмы интеллектуального анализа данных Майкрософт можно настроить и полностью программировать с помощью предоставленных API или с помощью компонентов интеллектуального анализа данных в службах SQL Server Integration Services.
Кроме того, можно использовать сторонние алгоритмы, соответствующие спецификации OLE DB для интеллектуального анализа данных, или разрабатывать пользовательские алгоритмы, которые можно зарегистрировать в качестве служб, а затем использовать в платформе интеллектуального анализа данных SQL Server.
Выбор правильного алгоритма
Выбор оптимального алгоритма для конкретной аналитической задачи может быть проблемой. Хотя для выполнения одной бизнес-задачи можно использовать разные алгоритмы, каждый алгоритм создает другой результат, а некоторые алгоритмы могут создавать несколько типов результатов. Например, можно использовать алгоритм деревьев принятия решений Майкрософт не только для прогнозирования, но и для уменьшения количества столбцов в наборе данных, так как дерево принятия решений может определять столбцы, не влияющие на окончательную модель интеллектуального анализа данных.
Выбор алгоритма по типу
Службы Analysis Services включают следующие типы алгоритмов:
Алгоритмы классификации прогнозируют одну или несколько дискретных переменных на основе других атрибутов в наборе данных.
Алгоритмы регрессии прогнозируют одну или несколько непрерывных переменных, например прибыль или потерю, на основе других атрибутов в наборе данных.
Алгоритмы сегментации делят данные на группы или кластеры элементов с аналогичными свойствами.
Алгоритмы сопоставления находят корреляции между различными атрибутами в наборе данных. Наиболее распространенное применение такого алгоритма заключается в создании правил ассоциации, которые можно использовать в анализе рыночной корзины.
Алгоритмы анализа последовательностей обобщают частые последовательности или эпизоды в данных, например поток веб-трафика.
Однако нет никаких причин, по которым в решениях следует ограничиться одним алгоритмом. Опытные аналитики иногда используют один алгоритм для определения наиболее эффективных входных данных (то есть переменных), а затем применяет другой алгоритм для прогнозирования определенного результата на основе этих данных. Интеллектуальный анализ данных SQL Server позволяет создавать несколько моделей в одной структуре интеллектуального анализа данных, поэтому в одном решении интеллектуального анализа данных можно использовать алгоритм кластеризации, модель деревьев принятия решений и наивную модель Bayes для получения различных представлений о данных. Можно также использовать несколько алгоритмов в одном решении для выполнения отдельных задач: например, можно использовать регрессию для получения финансовых прогнозов и использовать алгоритм нейронной сети для анализа факторов, влияющих на продажи.
Выбор алгоритма по задаче
Чтобы помочь выбрать алгоритм для использования с определенной задачей, в следующей таблице приведены предложения по типам задач, для которых традиционно используется каждый алгоритм.
| Примеры задач | Алгоритмы Майкрософт для использования |
|---|---|
|
Прогнозирование дискретного атрибута Помечайте клиентов в списке потенциальных покупателей как хорошие или плохие кандидаты. Вычислите вероятность сбоя сервера в течение следующих 6 месяцев. Классификация результатов пациентов и изучение связанных факторов. |
Алгоритм деревьев принятия решений Майкрософт Алгоритм Microsoft Naive Bayes Алгоритм кластеризации Майкрософт Алгоритм нейронной сети Майкрософт |
|
Прогнозирование непрерывного атрибута Прогноз продаж в следующем году. Прогнозирование посетителей сайта с учетом прошлых и сезонных тенденций. Создайте оценку риска с учетом демографических данных. |
Алгоритм деревьев принятия решений Майкрософт Алгоритм временных рядов Майкрософт Алгоритм линейной регрессии Майкрософт |
|
Прогнозирование последовательности Выполните анализ потоков кликов на веб-сайте компании. Анализ факторов, ведущих к сбою сервера. Сбор и анализ последовательностей действий во время амбулаторных посещений, чтобы сформулировать рекомендации по общепринятым действиям. |
Алгоритм кластеризации последовательностей Майкрософт |
|
Поиск групп распространенных элементов в транзакциях Используйте анализ корзины рынка для определения размещения продуктов. Предложить дополнительные продукты клиенту для покупки. Анализ данных опроса от посетителей мероприятия, чтобы выяснить, какие действия или стенды имеют взаимосвязь, для планирования будущих мероприятий. |
Алгоритм ассоциации Майкрософт Алгоритм деревьев принятия решений Майкрософт |
|
Поиск групп похожих элементов Создайте группы профилей риска пациентов на основе таких атрибутов, как демографические данные и поведение. Анализируйте пользователей по шаблонам их просмотра и покупок. Определите серверы, имеющие аналогичные характеристики использования. |
Алгоритм кластеризации Майкрософт Алгоритм кластеризации последовательностей Майкрософт |
Связанные материалы
В следующей таблице приведены ссылки на ресурсы обучения для каждого алгоритма интеллектуального анализа данных, предоставляемых в службах Analysis Services:
Связанные задачи
| Тема | Описание |
|---|---|
| Определение алгоритма, используемого моделью интеллектуального анализа данных | Запросите параметры, используемые для создания модели интеллектуального анализа данных |
| Создайте пользовательский алгоритм Plug-In | Алгоритмы подключаемого модуля |
| Изучение модели с помощью средства просмотра алгоритмов | Средства просмотра моделей интеллектуального анализа данных |
| Просмотр содержимого модели с помощью универсального формата таблицы | Просмотр модели с помощью средства просмотра дерева универсального содержимого Майкрософт |
| Узнайте, как настроить данные и использовать алгоритмы для создания моделей |
Структуры добычи данных (Analysis Services — интеллектуальный анализ данных) Модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных) |