Мастер интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
Мастер интеллектуального анализа данных в службах MicrosoftSQL ServerAnalysis Services запускается каждый раз при добавлении новой структуры интеллектуального анализа данных к проекту интеллектуального анализа данных. Мастер помогает определить новые структуры интеллектуального анализа данных и выбирает источники данных, которые будут использованы для интеллектуального анализа данных. Мастер также может разбить данные структуры интеллектуального анализа на обучающие и проверочные наборы и для каждой структуры позволяет добавить исходную модель интеллектуального анализа данных.
Содержимое структуры интеллектуального анализа данных выводится на основе существующего представления источника данных или куба. Мастер предлагает выбрать столбцы для включения в структуру интеллектуального анализа данных. Эти столбцы могут использоваться всеми моделями на основе данной структуры. Можно также позволить пользователям модели интеллектуального анализа детализировать результаты модели углублением с целью просмотра дополнительных столбцов структуры интеллектуального анализа данных, не включенных в саму модель.
Во время создания структур и моделей интеллектуального анализа данных с помощью мастера интеллектуального анализа данных можно принять следующие решения.
Определить, на основе чего будет построена структура и модель интеллектуального анализа данных: на основе реляционной базы данных или на основе существующего куба в базе данных OLAP.
Определить объем данных, который будет использоваться для обучения, и объем, который будет использоваться для проверки. При разбиении структуры интеллектуального анализа данных на обучающий и проверочный данные эти данные могут быть использованы всеми моделями на основе данной структуры.
Определить, какие столбцы или атрибуты будут использоваться для прогноза, а какие будут входными данными для анализа. Кроме того, в каждой структуре должен присутствовать ключ, однозначно идентифицирующий запись варианта.
Определить используемый алгоритм. Алгоритмы, предусмотренные службами SQL ServerAnalysis Services, отличаются своими характеристиками и приводят к различным результатам. Чтобы создать различные модели, можно создать несколько моделей на основе различных алгоритмов или изменить параметры алгоритмов. .
В мастере интеллектуального анализа данных имеются функции, помогающие принять эти решения.
Страницы мастера, на которых определяется набор вариантов. Можно выбрать таблицы вариантов и вложенные таблицы из реляционного источника данных либо выбрать источник данных OLAP, выбрать ключ варианта и столбцы уровня вариантов, а затем (по желанию) установить фильтры для куба.
Данные столбцов анализируются в диалоговых окнах, после чего предлагаются рекомендации по использованию этих столбцов.
Автоматическое определение содержимого столбцов и типов данных.
Автоматически создается срез куба, если модель интеллектуального анализа данных основана на источнике данных OLAP.
После завершения работы мастера интеллектуального анализа данных с помощью конструктора интеллектуального анализа данных можно изменить структуру и модели интеллектуального анализа данных, просмотреть точность модели, просмотреть характеристики структуры и моделей или выполнить прогнозирование с использованием этих моделей.
Дополнительные сведения см. в разделахКонструктор интеллектуального анализа данных
Использование мастера интеллектуального анализа данных
Чтобы запустить мастер интеллектуального анализа данных, добавьте новую структуру интеллектуального анализа данных к проекту служб Analysis Services, используя обозреватель решений или меню Проект в среде Business Intelligence Development Studio.
Мастер интеллектуального анализа данных имеет две ветви, в зависимости от того, содержатся ли данные в реляционном источнике данных или в кубе.
Реляционные модели интеллектуального анализа данных
Модели интеллектуального анализа данных OLAP
Примечание |
---|
Для интеллектуального анализа данных наличие куба или базы данных OLAP не требуется. Для интеллектуального анализа данных рекомендуется использовать реляционную таблицу или источник данных, если только данные уже не хранятся в кубе или если необходимо провести интеллектуальный анализ измерений OLAP или результатов агрегатов или вычислений OLAP. |
Реляционные модели интеллектуального анализа данных
При построении модели интеллектуального анализа данных на основе реляционного источника данных в службах Analysis Services сначала в мастере интеллектуального анализа данных указывается, что необходимо использовать существующую реляционную базу данных для определения структуры этой модели. Кроме того, можно создать только структуру интеллектуального анализа данных или структуру и одну связанную с ней модель интеллектуального анализа данных. Если выбрано создание модели интеллектуального анализа данных, необходимо указать используемый способ интеллектуального анализа — выбрать алгоритм, наилучшим образом подходящий для требуемого интеллектуального анализа данных указанного типа.
Дополнительные сведения см. в разделахАлгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
Указание представления источника данных и типов таблицы
В следующих шагах мастера осуществляется выбор конкретного представления источника данных, которое необходимо использовать для определения структуры интеллектуального анализа данных, а также указание таблицы вариантов. Таблица вариантов будет использоваться для обучения модели интеллектуального анализа данных, а при необходимости — и для ее проверки. Можно указать и вложенную таблицу.
Выбор таблицы вариантов представляет собой важное решение. Она должна содержать сущности для анализа: например, сведения о заказчиках и соответствующие демографические сведения. Вложенные таблицы содержат, как правило, дополнительные сведения о сущностях таблицы вариантов, например транзакции, осуществляемые заказчиком, или атрибуты, имеющие с сущностью связь «многие к одному». Так, например, вложенные таблицы, присоединенные к таблице вариантов Customers, могут содержать списки покупок, совершаемых каждым заказчиком, или списки увлечений. Дополнительные сведения см. в разделахВложенные таблицы (службы Analysis Services — интеллектуальный анализ данных)
Указание использования столбцов
После указания таблицы вариантов и вложенных таблиц определяется тип использования для каждого столбца в таблицах, которые будут включены в структуру интеллектуального анализа данных. Если для столбца не указан тип использования, то этот столбец не будет включен в структуру интеллектуального анализа данных.
Столбцы интеллектуального анализа данных могут быть: ключевыми, входными, прогнозируемыми или комбинацией входного и прогнозируемого. Ключевые столбцы содержат уникальный идентификатор для каждой строки в таблице. Некоторые модели интеллектуального анализа данных, например модели, основанные на алгоритмах кластеризации последовательностей и временных рядов, могут содержать несколько ключевых столбцов. Однако эти несколько ключей не являются составными в реляционном смысле, а должны быть выбраны для обеспечения поддержки анализа временных рядов и кластера последовательностей. Дополнительные сведения см. в разделах Алгоритм временных рядов (Майкрософт) и Алгоритм кластеризации последовательностей (Майкрософт).
Входные столбцы предоставляют данные, на основе которых осуществляется прогнозирование. Прогнозируемые столбцы содержат данные, которые прогнозирует модель интеллектуального анализа данных.
Например, ряд таблиц может содержать идентификаторы заказчиков, демографические данные и сумму денег, которую каждый заказчик тратит в конкретном магазине. Идентификатор заказчика уникально определяет заказчика, а также связывает таблицу вариантов с вложенными таблицами, поэтому его следует использовать в качестве ключевого столбца. Можно использовать набор столбцов из демографических данных как входной столбец, а столбец, описывающий сумму денег, которую тратит каждый заказчик, в качестве прогнозируемого столбца. После этого можно построить модель интеллектуального анализа данных, связывающую демографические данные с суммой денег, которую заказчик тратит в магазине. Эту модель можно использовать в качестве основы для целевого маркетинга.
Мастер интеллектуального анализа данных предоставляет функцию Предложить, которая включается при выборе прогнозируемого столбца. Наборы данных часто содержат больше столбцов, чем нужно использовать при построении модели интеллектуального анализа данных. Функция Предложить вычисляет численный показатель, от 0 до 1, описывающий связь между каждым столбцом в наборе данных и прогнозируемым столбцом. На основе этого показателя функция предполагает столбцы для использования в качестве входных для модели интеллектуального анализа данных. При использовании функции Предложить можно использовать предполагаемые столбцы, изменить выбор в соответствии с потребностями или пропустить предположения.
Указание типов содержимого и данных
После выбора одного или нескольких прогнозируемых и входных столбцов можно указать типы содержимого и данных для каждого из них.
Дополнительные сведения см. в разделахТипы данных (интеллектуальный анализ данных), Типы содержимого (интеллектуальный анализ данных)
Разбиение данных на обучающий и проверочный наборы
Последним шагом перед завершением работы мастера является секционирование данных на обучающие и проверочные наборы. Возможность удерживать часть данных для проверки реализована в версии SQL Server 2008 впервые и представляет собой простой механизм, обеспечивающий доступность согласованного набора проверочных данных для использования со всеми моделями интеллектуального анализа данных, связанными с новой структурой интеллектуального анализа.
Можно указать в процентах, какая часть данных должна использоваться для проверки, и остальные данные будут использованы для обучения. Также можно указать количество вариантов, которые будут использоваться для проверки. Определение секции хранится в структуре интеллектуального анализа данных, поэтому каждый раз при создании новой модели на основе этой структуры набор проверочных данных будет доступен для оценки точности модели.
Дополнительные сведения см. в разделахПроверка моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных), Секционирование данных на обучающий и проверочный наборы данных (службы Analysis Services — интеллектуальный анализ данных)
Завершение работы мастера
На последнем шаге выполнения мастера указываются имена структуры интеллектуального анализа данных и связанной с ней модели интеллектуального анализа данных. При выборе параметра Разрешить детализацию в модели включается функция детализации. Это позволяет пользователям, имеющим соответствующие разрешения, просматривать исходные данные, которые были использованы для построения модели.
Дополнительные сведения см. в разделахИспользование детализации в моделях и структурах интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
В начало
Модели интеллектуального анализа данных OLAP
При построении модели интеллектуального анализа данных на основе источника данных OLAP в службах Analysis Services сначала в мастере интеллектуального анализа данных указывается, что необходимо использовать существующий куб для определения структуры этой модели. Можно также создать только структуру интеллектуального анализа данных или структуру и одну связанную с ней модель интеллектуального анализа данных. Если выбрано создание модели интеллектуального анализа данных, то необходимо указать используемый способ интеллектуального анализа — выбрать алгоритм, наилучшим образом подходящий для решения имеющихся задач.
Дополнительные сведения см. в разделахАлгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
Указание источника данных и ключа варианта
Затем выбирается измерение куба для использования в качестве источника данных при определении структуры интеллектуального анализа данных. После этого выбирается атрибут для использования в качестве ключа или ключа варианта модели интеллектуального анализа данных.
Примечание |
---|
Модель интеллектуального анализа OLAP, построение которой производится, и исходный куб, используемый при создании этой модели, должны содержаться в одной и той же базе данных служб Analysis Services. |
Указание столбцов и использования столбцов уровня вариантов
После выбора ключа варианта атрибуты и меры, связанные с этим ключом, отображаются в представлении дерева на следующей странице мастера. Из этого списка выбираются атрибуты и меры для использования в качестве столбцов структуры. Эти столбцы называются столбцами уровня вариантов. Как и в случае реляционной модели, сначала необходимо указать, как каждый из столбцов будет использоваться в структуре. Это можно сделать на следующей странице мастера. Столбцы могут быть ключевыми, входными, прогнозируемыми, входными и прогнозируемыми или не выбранными.
Добавление вложенных таблиц
Ветвь OLAP мастера интеллектуального анализа данных включает параметр для добавления структуры модели интеллектуального анализа данных. На странице Использование столбцов для модели мастера нажмите кнопку Добавить вложенные таблицы, чтобы открыть отдельное диалоговое окно, отображающее шаги для добавления вложенных таблиц. Отображаются только группы мер, применяемые к измерению. Выберите группу мер, содержащую внешний ключ измерения вариантов. Затем укажите использование для каждого столбца в группе мер, входного или прогнозируемого. После этого мастер добавит вложенную таблицу к таблице вариантов. Именем по умолчанию для вложенной таблицы является имя вложенного измерения, но можно переименовать вложенную таблицу и ее столбцы. Дополнительные сведения см. в разделахВложенные таблицы (службы Analysis Services — интеллектуальный анализ данных)
Указание типов содержимого и данных
После выбора одного или нескольких прогнозируемых и входных столбцов можно указать типы содержимого и данных для каждого из них.
Дополнительные сведения см. в разделахТипы данных (интеллектуальный анализ данных), Типы содержимого (интеллектуальный анализ данных)
Создание срезов исходного куба
В ветви OLAP мастера можно ограничить область модели интеллектуального анализа данных путем создания срезов исходного куба перед обучением модели интеллектуального анализа данных. Создание срезов куба аналогично добавлению предложения WHERE к инструкции SQL. Например, если куб содержит данные о покупках продуктов, то можно ограничить атрибут возраста значением более 30, столбец пола только женским полом, а дату покупки — датой не ранее марта 2000 года. Таким образом, можно ограничить модель для отражения области, содержащей женщин старше 30, которые приобретали продукт после марта 2000 года.
Разбиение данных на обучающий и проверочный наборы
Последним шагом перед завершением работы мастера является секционирование доступных в кубе данных на обучающий и проверочный наборы. Определение секции хранится в структуре интеллектуального анализа данных, поэтому каждый раз при создании новой модели на основе этой структуры набор проверочных данных будет доступен для оценки точности модели.
Дополнительные сведения см. в разделахПроверка моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных), Секционирование данных на обучающий и проверочный наборы данных (службы Analysis Services — интеллектуальный анализ данных)
Завершение работы мастера
На последнем шаге выполнения мастера указываются имена структуры интеллектуального анализа данных и связанной с ней модели интеллектуального анализа данных. При выборе параметра Разрешить детализацию в модели включается функция детализации. Это позволяет пользователям, имеющим соответствующие разрешения, просматривать исходные данные, которые были использованы для построения модели. Можно также указать, необходимо ли добавить к исходному кубу новое измерение на основе модели интеллектуального анализа данных или создать на ее основе новый куб.
Дополнительные сведения см. в разделахИспользование детализации в моделях и структурах интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
В начало