Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Применимо к:
SQL Server 2019 и более ранних версий Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
Это важно
Интеллектуальный анализ данных был признан устаревшим в службах SQL Server 2017 Analysis Services и теперь прекращён в службах SQL Server 2022 Analysis Services. Документация не обновляется для устаревших и прекращённых функций. Дополнительные сведения см. в статье о обратной совместимости служб Analysis Services.
Алгоритм интеллектуального анализа данных (или машинного обучения) — это набор эвристики и вычислений, создающих модель из данных. Чтобы создать модель, алгоритм сначала анализирует предоставленные данные, ищет конкретные типы шаблонов или тенденций. Алгоритм использует результаты этого анализа в ходе многих итераций, чтобы найти оптимальные параметры для создания модели добычи данных. Затем эти параметры применяются ко всему набору данных для извлечения практических шаблонов и подробных статистических данных.
Модель интеллектуального анализа данных, созданная алгоритмом на основе ваших данных, может принимать различные формы, в том числе:
Набор кластеров, описывающий, как связаны случаи в наборе данных.
Дерево принятия решений, которое прогнозирует результат и описывает, как различные критерии влияют на этот результат.
Математическая модель, которая прогнозирует продажи.
Набор правил, описывающих, как продукты сгруппированы вместе в сделке, и вероятности того, что эти продукты покупаются вместе.
Алгоритмы, предоставляемые в интеллектуальном анализе данных SQL Server, являются самыми популярными, хорошо изученными методами извлечения шаблонов из данных. Чтобы взять один пример, кластеризация K-средних является одним из старейших алгоритмов кластеризации и доступна широко в различных инструментах и с множеством различных реализаций и параметров. Однако конкретная реализация кластеризации методом K-средних, используемая в службах интеллектуального анализа данных SQL Server, была разработана Microsoft Research, а затем оптимизирована для повышения производительности в службах SQL Server Analysis Services. Все алгоритмы интеллектуального анализа данных Майкрософт могут быть тщательно настроены и полностью программируются с помощью предоставленных API. Вы также можете автоматизировать создание, обучение и переобучение моделей с помощью компонентов интеллектуального анализа данных в службах Integration Services.
Кроме того, можно использовать сторонние алгоритмы, соответствующие спецификации OLE DB для интеллектуального анализа данных, или разрабатывать пользовательские алгоритмы, которые можно зарегистрировать в качестве служб, а затем использовать в платформе интеллектуального анализа данных SQL Server.
Выбор правильного алгоритма
Выбор оптимального алгоритма для конкретной аналитической задачи может быть проблемой. Хотя для выполнения одной бизнес-задачи можно использовать разные алгоритмы, каждый алгоритм создает другой результат, а некоторые алгоритмы могут создавать несколько типов результатов. Например, можно использовать алгоритм деревьев принятия решений Майкрософт не только для прогнозирования, но и для уменьшения количества столбцов в наборе данных, так как дерево принятия решений может определять столбцы, не влияющие на окончательную модель интеллектуального анализа данных.
Выбор алгоритма по типу
Интеллектуальный анализ данных SQL Server включает следующие типы алгоритмов:
Алгоритмы классификации прогнозируют одну или несколько дискретных переменных на основе других атрибутов в наборе данных.
Алгоритмы регрессии прогнозируют одну или несколько непрерывных числовых переменных, например прибыль или потерю, на основе других атрибутов в наборе данных.
Алгоритмы сегментации делят данные на группы или кластеры элементов с аналогичными свойствами.
Алгоритмы сопоставления находят корреляции между различными атрибутами в наборе данных. Наиболее распространенное применение такого алгоритма заключается в создании правил ассоциации, которые можно использовать в анализе рыночной корзины.
Алгоритмы анализа последовательностей суммируют частые последовательности или эпизоды в данных, например ряд щелчков на веб-сайте или ряд событий журнала, предшествующих обслуживанию компьютера.
Однако нет никаких причин, по которым в решениях следует ограничиться одним алгоритмом. Опытные аналитики иногда используют один алгоритм для определения наиболее эффективных входных данных (то есть переменных), а затем применяет другой алгоритм для прогнозирования определенного результата на основе этих данных. Интеллектуальный анализ данных SQL Server позволяет создавать несколько моделей в одной структуре интеллектуального анализа данных, поэтому в одном решении интеллектуального анализа данных можно использовать алгоритм кластеризации, модель деревьев принятия решений и модель Наивного Байеса для получения различных представлений о данных. Вы также можете использовать несколько алгоритмов в одном решении для выполнения отдельных задач: например, можно использовать регрессию для получения финансовых прогнозов и использовать алгоритм нейронной сети для анализа факторов, влияющих на прогнозы.
Выбор алгоритма по задаче
Чтобы помочь выбрать алгоритм для использования с определенной задачей, в следующей таблице приведены предложения по типам задач, для которых традиционно используется каждый алгоритм.
| Примеры задач | Алгоритмы Майкрософт для использования |
|---|---|
|
Прогнозирование дискретного атрибута: Отмечайте клиентов в списке потенциальных покупателей как перспективные или неперспективные. Вычислите вероятность сбоя сервера в течение следующих 6 месяцев. Классификация результатов пациентов и изучение связанных факторов. |
Алгоритм деревьев принятия решений Майкрософт Алгоритм Microsoft Naive Bayes Алгоритм кластеризации Майкрософт Алгоритм нейронной сети Майкрософт |
|
Прогнозирование непрерывного атрибута: Прогноз продаж в следующем году. Прогнозирование посетителей сайта с учетом прошлых и сезонных тенденций. Создайте оценку риска с учетом демографических данных. |
Алгоритм деревьев принятия решений Майкрософт Алгоритм временных рядов Майкрософт Алгоритм линейной регрессии Майкрософт |
|
Прогнозирование последовательности: Выполните анализ кликов веб-сайта компании. Анализ факторов, ведущих к сбою сервера. Сбор и анализ последовательностей действий во время амбулаторных посещений, чтобы формировать лучшие практики по общим действиям. |
Алгоритм кластеризации последовательностей Майкрософт |
|
Поиск групп общих элементов в транзакциях: Используйте анализ корзины рынка для определения размещения продуктов. Предложить дополнительные продукты клиенту для покупки. Анализ данных опроса от посетителей мероприятия, чтобы найти, какие действия или стенды были сопоставлены, чтобы планировать будущие мероприятия. |
Алгоритм ассоциации Майкрософт Алгоритм деревьев принятия решений Майкрософт |
|
Поиск групп похожих элементов: Создайте группы профилей риска пациентов на основе таких атрибутов, как демографические данные и поведение. Анализ пользователей по моделям просмотра и покупок. Определите серверы, имеющие аналогичные характеристики использования. |
Алгоритм кластеризации Майкрософт Алгоритм кластеризации последовательностей Майкрософт |
Связанные материалы
В следующем разделе приведены ссылки на ресурсы обучения для каждого алгоритма интеллектуального анализа данных, предоставляемых в интеллектуальном анализе данных SQL Server:
Базовое описание алгоритма: объясняет, что делает алгоритм и как он работает, и описывает возможные бизнес-сценарии, в которых алгоритм может быть полезным.
Технический справочник: предоставляет технические сведения о реализации алгоритма с академическими ссылками по мере необходимости. Выводит список параметров, которые можно задать для управления поведением алгоритма и настройки результатов в модели. Описывает требования к данным и предоставляет советы по производительности, если это возможно.
Технический справочник по алгоритму кластеризации Майкрософт
Технический справочник по алгоритму деревьев принятия решений Майкрософт
Технический справочник по алгоритму линейной регрессии Майкрософт
Технический справочник по алгоритму логистической регрессии Майкрософт
Технический справочник по алгоритму нейронной сети Майкрософт
Технический справочник по алгоритму кластеризации последовательностей Майкрософт
Технический справочник по алгоритму временных рядов Майкрософт
Содержимое модели. Объясняет структуру информации в рамках каждой модели интеллектуального анализа данных и объясняет, как интерпретировать информацию, хранящуюся в каждом узле.
Запросы интеллектуального анализа данных: предоставляет несколько запросов, которые можно использовать с каждым типом модели. К примерам относятся запросы содержимого, которые позволяют узнать больше о шаблонах в модели и прогнозируемых запросах, которые помогут вам создавать прогнозы на основе этих шаблонов.
Связанные задачи
| Topic | Описание |
|---|---|
| Определение алгоритма, используемого моделью интеллектуального анализа данных | Запрос параметров, используемых для создания модели интеллектуального анализа данных |
| Создание пользовательского алгоритма плагина | Алгоритмы подключаемого модуля |
| Изучение модели с помощью средства просмотра алгоритмов | Средства просмотра моделей интеллектуального анализа данных |
| Просмотр содержимого модели с помощью универсального формата таблицы | Просмотр модели с помощью средства просмотра дерева универсального содержимого Майкрософт |
| Узнайте, как настроить данные и использовать алгоритмы для создания моделей |
Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных) Модели анализа данных (службы Analysis Services - интеллектуальный анализ данных) |