Логическая архитектура (службы Analysis Services — интеллектуальный анализ данных)
Интеллектуальный анализ данных — это процесс, сопряженный с взаимодействием нескольких компонентов. Выполняется доступ к источникам данных в базе данных SQL Server или любому другому источнику данных, используемому для обучения, тестирования и прогнозирования. Определяются структуры и модели интеллектуального анализа данных с помощью среды Business Intelligence Development Studio или Visual Studio 2005. Управлять объектами интеллектуального анализа данных и создавать прогнозы и запросы можно в среде SQL Server Management Studio. Законченное решение развертывается в экземпляре служб Analysis Services.
Решения и проекты по интеллектуальному анализу данных
Для создания проекта по интеллектуальному анализу данных необходимо определить источники данных, структуры интеллектуального анализа данных и модели интеллектуального анализа данных. Создаваемый проект интеллектуального анализа данных также может содержать проверочные наборы данных для проверки модели. После развертывания проекта на сервере можно продолжить разработку и тестирование новых моделей в исходном решении.
Исходные данные для интеллектуального анализа
Для интеллектуального анализа данных не обязательно использовать куб или другой специализированный источник данных. Интеллектуальный анализ данных можно легко и быстро проводить с реляционными таблицами данных или другим источником данных, определенным в качестве представления источника данных в службах Analysis Services. Данные, используемые в интеллектуальном анализе, не хранятся в решении по интеллектуальному анализу данных. Сохраняются только привязки. Данные могут располагаться в базе данных, созданной в предыдущей версии SQL Server, в системе CRM или даже в плоском файле. Представление источника данных служб Analysis Services позволяет сочетать различные источники данных, задавая соединения между несколькими таблицами. Также можно добавлять таблицы, имеющие связь «многие к одному», чтобы создать столбцы вложенных таблиц.
Когда необходимо использовать данные в решении по интеллектуальному анализу данных, службы Analysis Services считывают данные из источника и создают кэш для статистических выражений и других используемых данных. Данные, помещенные в кэш, можно сохранить и использовать в создании других моделей интеллектуального анализа данных или удалить, чтобы освободить место в хранилище.
Можно постоянно обновлять новыми данными решение по интеллектуальному анализу данных или, если найдена эффективная модель, можно развернуть эту модель без изменений и больше не добавлять в нее новые данные.
Службы SQL Server 2008 Analysis Services также дают возможность разделить данные на набор данных для обучения и набор проверочных данных, что позволяет проверять модели интеллектуального анализа данных на случайно выбираемом репрезентативном наборе данных.
Дополнительные сведения о создании и использовании источников данных и представлений источников данных в службах Analysis Services см. в разделе Определение источников данных (службы Analysis Services).
Структуры интеллектуального анализа данных
Структура интеллектуального анализа данных — это логическая структура данных, определяющая область данных, на основе которой строятся модели интеллектуального анализа данных. Одна структура интеллектуального анализа данных может поддерживать несколько моделей интеллектуального анализа данных, совместно использующих одну область. Структуру интеллектуального анализа данных также можно секционировать на обучающий и проверочный набор данных, задав процентное отношение или объем данных в параметре HOLDOUT. Такое секционирование можно выполнить автоматически во время определения структуры интеллектуального анализа данных.
Дополнительные сведения см. в разделе Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
Структура интеллектуального анализа данных может содержать вложенные таблицы. Вложенная таблица содержит дополнительные сведения о варианте, который моделируется в первичной таблице данных. Дополнительные сведения см. в разделе Вложенные таблицы (службы Analysis Services — интеллектуальный анализ данных).
Модели интеллектуального анализа данных
Модель интеллектуального анализа данных представляет собой сочетание самих данных, алгоритма интеллектуального анализа данных и коллекции значений параметров и фильтров, управляющих использованием и обработкой данных. Дополнительные сведения см. в разделе Модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
Модель интеллектуального анализа данных определяется на языке расширений интеллектуального анализа данных или с помощью мастера интеллектуального анализа данных в среде BI Development Studio. Дополнительные сведения об использовании мастера интеллектуального анализа данных см. в разделе Мастер интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных). Дополнительные сведения об использовании расширений интеллектуального анализа данных см. в разделе Справочник по расширениям интеллектуального анализа данных.
После определения структуры модели интеллектуального анализа данных выполняется ее обработка, состоящая в заполнении пустой структуры закономерностями, описывающими модель. Этот процесс известен как обучение модели. Закономерности выявляются путем применения к исходным данным некоторого математического алгоритма. Для настройки каждого алгоритма можно использовать параметры. Дополнительные сведения о выборе алгоритма интеллектуального анализа данных см. в разделе Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных). Дополнительные сведения о задании параметров отдельных алгоритмов интеллектуального анализа данных для тонкой настройки результатов модели см. в разделе Настройка модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
По мере построения новых моделей интеллектуального анализа данных они подвергаются итеративному тестированию путем составления прогнозов, а затем вносятся изменения, чтобы усовершенствовать результаты. К таким изменениям может относиться добавление данных или изменение параметров модели, позволяющие добиться лучшего соответствия данным. Сведения о проверке точности прогнозов см. в разделе Проверка моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
Развертывание
Конечной целью разработки интеллектуального анализа данных является создание модели, которая может использоваться конечными пользователями и аналитиками для составления прогнозов и выполнения углубленного анализа. Поэтому, когда модель обеспечивает удовлетворительные результаты, ее развертывают в рабочей среде. В рабочей среде модели интеллектуального анализа данных могут выполнять различные функции в зависимости от текущих задач. Далее приведен ряд примеров задач, которые можно выполнять с помощью модели интеллектуального анализа данных.
Применение моделей для создания прогнозов, которые затем можно использовать для принятия бизнес-решений. SQL Server предоставляет язык расширений интеллектуального анализа данных, который можно использовать для создания прогнозирующих запросов, и построитель прогнозирующих запросов для помощи в построении запросов.
Внедрение функций интеллектуального анализа данных непосредственно в приложение. Можно включать объекты AMO или сборку, содержащую набор объектов, которые выбранное приложение может использовать для создания, изменения, обработки и удаления структур и моделей интеллектуального анализа данных. Кроме того, можно отправлять сообщения XML для аналитики (XMLA) напрямую в экземпляр служб Службы Analysis Services.
Использование служб Integration Services для создания пакета, в котором модель интеллектуального анализа данных используется для интеллектуального распределения входящих данных по разным таблицам. Например, если база данных постоянно обновляется за счет добавления потенциальных клиентов, модель интеллектуального анализа данных может использоваться совместно со службами Integration Services для разбиения входящих данных на клиентов, которые с высокой долей вероятности купят товар, и клиентов, которые с высокой долей вероятности не купят товар.
Создание отчета, который позволит пользователям составлять прямые запросы к существующей модели интеллектуального анализа данных. Пользователям может понадобиться составлять различные прогнозы, а аналитикам может понадобиться доступ к содержимому модели интеллектуального анализа данных, чтобы просмотреть интересующие их закономерности в данных.
Обновление модели является составной частью стратегии развертывания. По мере возрастания объема данных, получаемых организацией, возникает необходимость повторной обработки моделей с целью повышения их эффективности. Дополнительные сведения см. в разделах Развертывание (службы Analysis Services — интеллектуальный анализ данных) и Создание прогнозирующих запросов расширений интеллектуального анализа данных.