Мастер интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
Мастер интеллектуального анализа данных в службах MicrosoftSQL ServerAnalysis Services запускается каждый раз, когда к проекту интеллектуального анализа данных добавляется новая структура интеллектуального анализа данных. Мастер помогает выбрать источник данных и создать представление источника данных, которое определяет данные, используемые для анализа, а также создать начальную модель.
На последнем этапе работы мастера можно разделить данные на обучающий и проверочный наборы и включить такие функции, как детализация.
Что нужно знать до начала работы
Прежде чем запускать мастер, необходимо ответить на следующие вопросы.
Как будут создаваться структура и модель интеллектуального анализа данных: на основе реляционной базы данных или на основе существующего куба в базе данных OLAP?
Какие столбцы содержат ключи, однозначно идентифицирующие запись варианта.
Какие столбцы или атрибуты будут использоваться в прогнозе? Какие столбцы или атрибуты подходят для использования в качестве входных данных для анализа?
Какой алгоритм использовать? Алгоритмы, используемые службами SQL Server Analysis Services, имеют разные характеристики и дают разные результаты. К счастью, вы не ограничены одной моделью для каждого набора данных, поэтому экспериментируйте, добавляя новые модели.
Потребуется ли проверка моделей на унифицированном наборе данных? Если да, то можно отложить некоторые данные для проверки. Можно выбрать процент и, если потребуется, указать количество строк.
Запуск мастера интеллектуального анализа данных
Чтобы использовать мастер интеллектуального анализа данных, необходимо открыть в среде SQL Server Data Tools (SSDT) решение, которое содержит хотя бы один проект интеллектуального анализа данных или OLAP.
Если решение готово для интеллектуального анализа данных, достаточно щелкнуть правой кнопкой мыши узел Структуры интеллектуального анализа данных в обозревателе решений и выбрать пункт Создать структуру интеллектуального анализа данных, чтобы запустить мастер интеллектуального анализа данных.
Если в решении еще нет проектов, можно добавить новый проект интеллектуального анализа данных. В меню Файл последовательно выберите команды Создать и Проект. Обязательно выберите шаблон Проект многомерных данных и интеллектуального анализа данных служб Analysis Services.
Используйте мастер импорта служб Analysis Services для получения метаданных из существующего решения интеллектуального анализа данных. Однако выбрать отдельные объекты для импорта невозможно. Импортируется вся база данных, включая кубы, представления источников данных и т. д. Также обратите внимание, что новое решение, созданное с помощью импорта, автоматически настраивается на использование локальной базы данных по умолчанию. Возможно, это придется изменить на другой экземпляр, прежде чем можно будет обрабатывать или просматривать объекты, а если импорт производится из предыдущей версии служб Analysis Services, может потребоваться обновление ссылок на поставщики.
Затем создается структура интеллектуального анализа данных и одна модель интеллектуального анализа данных, связанная с этой структурой. Можно также создать только структуру интеллектуального анализа данных и добавить модели позже, но обычно проще сначала создать проверочную модель.
Реляционные иМодели интеллектуального анализа данных OLAP
Теперь следует сделать следующий важный выбор: использовать реляционный источник данных или создать модель на основе многомерных данных (OLAP).
В этой точке мастер интеллектуального анализа данных разделяется на две ветви в зависимости от того, содержатся данные в реляционном источнике данных или в кубе. Все остальное, кроме процесса выбора данных, остается прежним (выбор алгоритма, возможность добавить необязательный контрольный набор данных и т. д.), но выбор данных из куба немного сложнее, чем использование реляционных данных. (Если модель создается на основе куба, в конце будет несколько дополнительных параметров.)
Подробное описание каждого параметра см. в следующих разделах:
Создание реляционной структуры интеллектуального анализа данных
Описывает решения, которые необходимо принять при создании модели интеллектуального анализа данных на основе реляционных данных.Создание структуры интеллектуального анализа данных OLAP
Описывает дополнительные параметры и решения, которые необходимо принять, если выбираются данные куба OLAP.
Примечание |
---|
Для интеллектуального анализа данных наличие куба или базы данных OLAP не требуется. Для интеллектуального анализа данных рекомендуется использовать реляционную таблицу или источник данных, если только данные уже не хранятся в кубе или если необходимо провести интеллектуальный анализ измерений OLAP или результатов агрегатов или вычислений OLAP. |
Выбор алгоритма
Теперь необходимо решить, какой алгоритм использовать для обработки данных. Это решение может быть сложным. Каждый алгоритм в службах Analysis Services имеет свои характеристики и дает свои результаты, поэтому можно поэкспериментировать и попробовать разные модели, прежде чем решить, какая из них лучше всего подходит для конкретных данных и задач бизнеса. Задачи, для которых лучше всего подходит каждый алгоритм, см. в разделе
В любом случае можно создавать разные модели с разными алгоритмами или менять параметры алгоритмов для создания разных моделей. Вы не ограничены в выборе алгоритма, и рекомендуется создать несколько моделей с одними и теми же данными.
Определение данных для модели
Помимо выбора данных из определенного источника, необходимо указать, какая таблица в представлении источника данных содержит данные вариантов. Таблица вариантов будет использоваться для обучения модели интеллектуального анализа данных, поэтому она должна содержать сущности, которые нужно анализировать. например, сведения о заказчиках и соответствующие демографические сведения. Каждый вариант должен быть уникальным и идентифицироваться по ключу варианта.
Помимо указания таблицы вариантов можно включить в данные вложенные таблицы. Вложенная таблица обычно содержит дополнительные сведения о сущностях таблицы вариантов. Это могут быть транзакции, осуществляемые заказчиком, или атрибуты, имеющие связь с сущностью «многие к одному». Например, вложенная таблица, присоединенная к таблице вариантов Customers, может содержать список покупок каждого заказчика. В модели, анализирующей трафик веб-сайта, вложенная таблица может содержать последовательности страниц, которые посетил пользователь. Дополнительные сведения см. в разделе Вложенные таблицы (службы Analysis Services — интеллектуальный анализ данных).
Дополнительные функции
Мастер интеллектуального анализа данных содержит следующие дополнительные функции, помогающие выбрать данные и правильно настроить источники данных.
Автоматическое определение типов данных. Мастер исследует уникальность и распределение значений в столбцах и затем рекомендует наилучший тип данных и тип использования данных. Эти предложения можно отвергнуть и выбрать значения из списка.
Предложения по переменным. Можно щелкнуть диалоговое окно и запустить анализатор, который вычисляет корреляцию столбцов, включенных в модель, и определяет столбцы, оптимально подходящие для прогнозирования выходного атрибута, на основании текущей конфигурации модели. Эти предложения можно отвергнуть и ввести другие значения.
Выбор компонентов. Большинство алгоритмов автоматически обнаруживает столбцы, наиболее подходящие для прогнозирования, и используют в первую очередь эти столбцы. В столбцах с большим количеством значений используется функция выбор компонентов для уменьшения количества элементов связи данных и повышения вероятности получения значимой закономерности. На выбор компонентов можно повлиять с помощью параметров модели.
Автоматическое создание срезов куба. Если модель интеллектуального анализа данных основана на источнике данных OLAP, автоматически предоставляется возможность получения срезов модели с помощью атрибутов куба. Это удобно, когда модели создаются на основе подмножеств данных куба.
Завершение работы мастера
На последнем шаге выполнения мастера указываются имена структуры интеллектуального анализа данных и связанной с ней модели интеллектуального анализа данных. В зависимости от созданного типа модели могут предоставляться следующие возможности.
Если выбран параметр Разрешить детализацию, в модели включается функция детализации. Если детализация включена, пользователи с соответствующими разрешениями могут просматривать исходные данные, которые использовались для построения модели.
Если создается модель OLAP, можно установить флажок Создать новый куб интеллектуального анализа данных или Создать измерение модели интеллектуального анализа данных. Оба варианта упрощают просмотр готовой модели и детализацию базовых данных.
После завершения работы мастера интеллектуального анализа данных с помощью конструктора интеллектуального анализа данных можно изменить структуру и модели интеллектуального анализа данных, просмотреть точность модели, просмотреть характеристики структуры и моделей или выполнить прогнозирование с использованием этих моделей.
В начало
См. также
Узнать больше о решениях, которые необходимо принять при создании модели интеллектуального анализа данных, можно по следующим ссылкам:
Типы содержимого (интеллектуальный анализ данных)
Типы данных (интеллектуальный анализ данных)
Выбор компонентов (интеллектуальный анализ данных)
Отсутствующие значения (службы Analysis Services — интеллектуальный анализ данных)
Детализация моделей интеллектуального анализа данных