Логическая архитектура (службы Analysis Services — интеллектуальный анализ данных)

Статья
07/30/2013

Интеллектуальный анализ данных — это процесс, сопряженный с взаимодействием нескольких компонентов.

Выполняется доступ к источникам данных в базе данных SQL Server или любому другому источнику данных, используемому для обучения, тестирования и прогнозирования.
Структуры и модели интеллектуального анализа данных определяются в среде SQL Server Data Tools (SSDT) или Visual Studio.
Среда Среда SQL Server Management Studio позволяет управлять объектами интеллектуального анализа данных, а также создавать прогнозы и запросы.
Законченное решение развертывается в экземпляре служб Analysis Services.

Процесс создания подобных объектов решения описан в других разделах документации. Дополнительные сведения см. в разделе Решения для интеллектуального анализа данных.

В следующих подразделах описывается логическая архитектура объектов в решении интеллектуального анализа данных.

Исходные данные для интеллектуального анализа

Структуры интеллектуального анализа данных

Модели интеллектуального анализа данных

Пользовательские объекты интеллектуального анализа данных

Исходные данные для интеллектуального анализа

Данные, используемые в интеллектуальном анализе, не хранятся в решении по интеллектуальному анализу данных. Сохраняются только привязки. Данные могут располагаться в базе данных, созданной в предыдущей версии SQL Server, в системе CRM или даже в неструктурированном файле. Во время обучения структуры или модели путем обработки создается статистическая сводка данных, которая сохраняется в кэше. Кэш можно сохранить для использования в дальнейших операциях или удалить после обработки. Дополнительные сведения см. в разделе Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Разрозненные данные объединяются в объекте служб Analysis Services, который называется представлением источников данных. Он образует дополнительный уровень абстракции относительно источника данных. Можно задавать соединения между таблицами и добавлять таблицы, имеющие связь «многие к одному», чтобы создавать столбцы вложенных таблиц. Определения этих объектов (источника данных и представления источника данных) хранятся в рамках решения в файлах с расширениями DS и DSV. Дополнительные сведения о создании и использовании источников данных и представлений источников данных в службах Analysis Services см. в разделе Поддерживаемые типы источников данных (многомерные службы SSAS).

Для определения и изменения источников данных и представлений источников данных также используются объекты AMO и XML для аналитики. Дополнительные сведения о работе с этими объектами программным образом см. в разделе Обзор логической архитектуры (службы Analysis Services — многомерные данные).

В начало

Структуры интеллектуального анализа данных

Структура интеллектуального анализа данных — это логический контейнер, определяющий область данных, на основе которой строятся модели интеллектуального анализа данных. Одна структура интеллектуального анализа данных может поддерживать несколько моделей интеллектуального анализа данных.

Когда необходимо использовать данные в решении по интеллектуальному анализу данных, службы Analysis Services считывают данные из источника и создают кэш для агрегатных выражений и других используемых данных. По умолчанию этот кэш сохраняется, что позволяет многократно использовать обучающие данные для поддержки дополнительных моделей. Чтобы удалить кэш, измените значение свойства CacheMode в объекте структуры интеллектуального анализа данных на ClearAfterProcessing. Дополнительные сведения см. в разделе Классы интеллектуального анализа данных объектов AMO.

Службы SQL Server 2012 Analysis Services (SSAS) дают также возможность разделить данные на набор данных для обучения и набор проверочных данных, что позволяет проверять модели интеллектуального анализа данных на случайно выбираемом репрезентативном наборе данных. В действительности данные не хранятся отдельно. Данные о вариантах в кэше структуры помечаются свойством, которое показывает, используется ли тот или иной вариант для обучения или для тестирования. Если кэш удаляется, то эти данные получить невозможно.

Дополнительные сведения см. в разделе Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Структура интеллектуального анализа данных может содержать вложенные таблицы. Вложенная таблица содержит дополнительные сведения о варианте, который моделируется в первичной таблице данных. Дополнительные сведения см. в разделе Вложенные таблицы (службы Analysis Services — интеллектуальный анализ данных).

В начало

Модели интеллектуального анализа данных

До обработки модель интеллектуального анализа данных представляет собой просто набор свойств метаданных. Эти свойства определяют структуру интеллектуального анализа данных, задают алгоритм интеллектуального анализа данных и определяют набор значений параметров и фильтров, управляющих обработкой данных. Дополнительные сведения см. в разделе Модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Во время обработки модели обучающие данные, хранящиеся в кэше структуры интеллектуального анализа данных, используются для построения закономерностей в зависимости от статистических свойств данных и от эвристических методов, определенных в алгоритме и его параметрах. Этот процесс известен как обучение модели.

Результатом обучения является набор сводных данных, который входит в содержимое модели. Этот набор описывает обнаруженные закономерности и включает правила, по которым создаются прогнозы. Дополнительные сведения см. в разделе Содержимое модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

При некоторых условиях также возможен экспорт логической структуры модели в файл, где формулы и привязки данных модели представлены в стандартном формате PMML (язык разметки прогнозирующих моделей). Такую логическую структуру можно импортировать в другие системы, использующие язык PMML, и описанная на этом языке модель будет использоваться для прогнозирования. Дополнительные сведения см. в разделе Основные сведения об инструкции SELECT (расширения интеллектуального анализа данных).

В начало

Пользовательские объекты интеллектуального анализа данных

Другие объекты, используемые в контексте проекта интеллектуального анализа данных, в том числе диаграммы точности и прогнозирующие запросы, не сохраняются в решении, но их можно включить в скрипты на языке ASSL или построить с помощью объектов AMO.

Кроме того, можно расширить функции и возможности, доступные в экземпляре служб Analysis Services, добавив следующие пользовательские объекты.

Пользовательские сборки
Сборки .NET можно определять на любом языке, совместимом с CLR или COM, а затем регистрировать в экземпляре SQL Server. Файлы сборки загружаются из места, определенного приложением, а копия этих файлов сохраняется на сервере вместе с данными. Копия файла сборки используется для загрузки сборки при каждом запуске службы.

Дополнительные сведения см. в разделе Управление сборками многомерной модели.
Пользовательские хранимые процедуры
В интеллектуальном анализе данных служб Analysis Services поддерживаются хранимые процедуры для работы с объектами интеллектуального анализа данных. Можно создавать собственные хранимые процедуры для расширения функций и упрощения работы с данными, возвращаемыми прогнозирующими запросами и запросами содержимого.

Определение хранимых процедур

Для выполнения перекрестной проверки поддерживаются следующие хранимые процедуры.

Хранимые процедуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Кроме того, в службы Analysis Services входит множество системных хранимых процедур, которые используются внутренним образом для интеллектуального анализа данных. Системные хранимые процедуры предназначены для внутреннего использования, но также могут оказаться полезными в качестве средства быстрого доступа к функциям. Корпорация Майкрософт оставляет за собой право изменять эти хранимые процедуры в случае необходимости, и поэтому для использования в рабочей среде рекомендуется создавать запросы с помощью расширений интеллектуального анализа данных, объектов AMO или XML для аналитики.
Пользовательские подключаемые алгоритмы
В службах Analysis Services предусмотрен механизм для создания собственных алгоритмов и добавления их в экземпляр сервера в качестве новой функции интеллектуального анализа данных.

Для связи с подключаемыми алгоритмами в службах Analysis Services используются COM-интерфейсы. Дополнительные сведения о реализации новых алгоритмов см. в разделе Подключаемые алгоритмы.

Перед использованием каждого нового алгоритма его необходимо зарегистрировать. Чтобы зарегистрировать алгоритм, добавьте необходимые метаданные в INI-файл экземпляра служб Analysis Services. Эти данные нужно добавить в каждый экземпляр, где планируется использовать новый алгоритм. После добавления алгоритма можно перезапустить экземпляр и использовать набор строк схемы MINING_SERVICES для просмотра нового алгоритма, включая параметры и поставщики, поддерживаемые алгоритмом.

В начало

См. также

Справочник

Справочник по расширениям интеллектуального анализа данных

Основные понятия

Обработка объектов многомерной модели

Поделиться через

Логическая архитектура (службы Analysis Services — интеллектуальный анализ данных)

Исходные данные для интеллектуального анализа

Структуры интеллектуального анализа данных

Модели интеллектуального анализа данных

Пользовательские объекты интеллектуального анализа данных

См. также

Справочник

Основные понятия

Дополнительные ресурсы