Проекты интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
В ходе разработки решения по интеллектуальному анализу данных в службах Analysis Services сначала создается проект служб Analysis Services. В этом проекте определяется источник данных, которые будут использоваться для анализа, а затем задается модель, которая включает алгоритм и специальные инструкции по обработке данных. В рамках проекта можно продолжить тестирование и доработку модели. Если решение обеспечивает удовлетворительные результаты, то его можно развернуть на другом сервере или использовать в приложении для прогнозирования или анализа.
В следующих разделах приведены описания средств и процессов для создания решения по интеллектуальному анализу данных и ссылки на ресурсы, которые используются на каждом из шагов.
Создание проекта служб Analysis Services
При разработке решения по интеллектуальному анализу данных сначала необходимо создать новый проект служб Analysis Services в среде Business Intelligence Development Studio. Каждый проект интеллектуального анализа данных содержит объекты следующих четырех типов: источники данных, представления источников данных (основаны на источниках данных), структуры интеллектуального анализа данных (определяют, каким образом данные используются в модели) и модели интеллектуального анализа данных (создают и хранят закономерности).
Дополнительные сведения см. в разделеОпределение проекта служб Analysis Services, Определение источника данных при помощи мастера источников данных (службы Analysis Services)
Определение источника данных
Источник данных определяет строку соединения и данные проверки подлинности, которые сервер служб Analysis Services будет использовать для соединения с источником данных. Источник данных может содержать несколько таблиц или представлений. Службы Analysis Services могут использовать наборы данных из реляционных баз данных и из баз данных оперативной аналитической обработки (OLAP), а также от внешних поставщиков.
После определения этого соединения с источником данных создается представление, которое определяет данные, относящиеся к модели. Представление источника данных также позволяет задать способ передачи данных, содержащихся в источнике, в модель интеллектуального анализа данных. Можно изменить структуру данных таким образом, чтобы она лучше подходила для задач проекта, или выбрать только данные определенных типов. Отфильтровать данные можно либо в представлении источника данных, либо с помощью фильтров, применяемых на уровне модели.
Требования к объему данных и к способам их очистки и форматирования будут различными в зависимости от алгоритма, используемого для анализа этих данных.
Дополнительные сведения см. в разделеОпределение представления источника данных (службы Analysis Services)
Добавление структур интеллектуального анализа данных к проекту служб Analysis Services
Когда данных становится достаточно для начала анализа, необходимо выбрать столбцы данных, которые больше всего подходят к решаемой бизнес-задаче, и добавить структуры интеллектуального анализа данных в проект. Структура интеллектуального анализа данных определяет столбцы данных и столбцы со вложенными таблицами, которые получаются из представления источника данных или из куба OLAP в проекте.
Чтобы добавить новую структуру интеллектуального анализа данных, запустите мастер интеллектуального анализа данных, который поможет выполнить определение данных, а при необходимости и создание первоначальной модели интеллектуального анализа данных. Кроме этого, при создании структуры можно секционировать данные, образовав набор данных для обучения, который используется для построения моделей, и проверочный набор данных, который используется для проверки всех моделей интеллектуального анализа данных, основанных на этой структуре. Для изменения существующих структур интеллектуального анализа данных, включая добавление столбцов и вложенных таблиц, можно использовать вкладку Структура интеллектуального анализа данных конструктора интеллектуального анализа данных.
Дополнительные сведения см. в разделеСоздание новой структуры интеллектуального анализа данных, Конструктор интеллектуального анализа данныхМастер интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
Работа с моделями интеллектуального анализа данных
В каждую структуру интеллектуального анализа данных добавляется одна или несколько моделей интеллектуального анализа данных. Модель интеллектуального анализа данных определяет алгоритм, то есть метод анализа, который будет применяться к данным. Обработка каждой модели заключается в обработке данных представления источника данных алгоритмом, в результате работы которого создается математическая модель данных. Этот процесс также называется обучением модели.
После обработки становится доступным просмотр модели интеллектуального анализа данных и создание прогнозирующих запросов к ней.
Службы Analysis Services предлагают несколько вариантов для обработки объектов модели интеллектуального анализа данных, включая возможность выбора объектов для обработки и метода обработки. Например, можно обработать структуру и поместить данные в кэш, а затем продолжить добавление новых моделей в структуру. Если данные находятся в кэше, то запросы детализации дают возможность получить подробные сведения о вариантах, используемых в модели.
Дополнительные сведения см. в разделеАлгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных), Обработка объектов служб Analysis Services, Использование детализации в моделях и структурах интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
Проверка моделей интеллектуального анализа данных
После создания модели можно изучить результаты и решить, какие модели работают лучше всего. На вкладке Средство просмотра моделей интеллектуального анализа данных в конструкторе интеллектуального анализа данных службы Analysis Services предлагают средства просмотра для каждого типа модели интеллектуального анализа данных. Эти средства можно использовать для просмотра моделей интеллектуального анализа данных.
На вкладке Диаграмма точности интеллектуального анализа данных конструктора службы Analysis Services предлагают средства, которые можно использовать для непосредственного сравнения моделей интеллектуального анализа данных, чтобы выбрать самую точную или самую полезную модель. К таким средствам относятся диаграмма точности прогнозов, диаграмма роста прибыли и матрица классификации.
Можно также воспользоваться новой функцией SQL Server 2008 — отчетом перекрестной проверки. Он позволяет выполнить итеративную усредняющую выборку данных, чтобы определить, является ли модель смещенной в отношении определенного набора данных. Статистика, представленная в отчете, может использоваться для объективного сравнения моделей и оценки качества обучающих данных.
Дополнительные сведения см. в разделеПросмотр модели интеллектуального анализа данных, Проверка моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
Создание прогнозов
Основной целью большинства проектов интеллектуального анализа данных является создание прогнозов с помощью модели интеллектуального анализа данных. После просмотра и сравнения моделей интеллектуального анализа данных можно воспользоваться одним из средств создания прогнозов. Расширения интеллектуального анализа данных (DMX) — это поддерживаемый службами Analysis Services язык запросов, который удобен для использования в сценариях и является основой для создания прогнозов. Чтобы упростить построение прогнозирующих DMX-запросов, SQL Server предоставляет построитель запросов, доступный в среде SQL Server Management Studio и среде Business Intelligence Development Studio, а также шаблоны расширений интеллектуального анализа данных для редактора запросов в среде Management Studio. В среде BI Development Studio доступ к построителю запросов производится через вкладку Прогноз модели интеллектуального анализа данных конструктора интеллектуального анализа данных.
Дополнительные сведения см. в разделеСоздание прогнозирующих запросов расширений интеллектуального анализа данных, Справка по инструкции расширений интеллектуального анализа данных
Среда SQL Server Management Studio.
После того, как модель интеллектуального анализа данных в проекте интеллектуального анализа данных построена в среде BI Development Studio, дальнейшая работа с ней и создание прогнозов производится в среде Management Studio. Средства создания запросов в среде SQL Server Management Studio позволяют просматривать данные в моделях, создавать сложные запросы содержимого и управлять объектами интеллектуального анализа данных, хранящимися в экземпляре SQL Server.
Дополнительные сведения см. в разделеИнтеллектуальный анализ данных в среде SQL Server Management Studio
SQL Server Reporting Services, службы
После создания модели интеллектуального анализа данных, может потребоваться передать результаты нескольким пользователям. Поскольку результаты интеллектуального анализа данных хранятся в согласованной схеме, доступ к которой возможен через запросы базы данных, разнообразные клиентские средства позволяют представлять результаты анализа, просматривать закономерности в модели и составлять прогнозы.
Создавать отчеты можно в конструкторе отчетов в службах MicrosoftSQL ServerReporting Services, который дает возможность представлять данные, содержащиеся в моделях интеллектуального анализа данных. В качестве основы для отчета можно использовать результаты любого DMX-запроса. При этом доступны все преимущества параметризации и форматирования служб Reporting Services.
Дополнительные сведения см. в разделеИспользование конструктора DMX-запросов служб Analysis Services (службы Reporting Services), Интеграция служб Reporting Services в приложения
Работа с интеллектуальным анализом данных программным путем
Службы Analysis Services предоставляют несколько средств для программирования интеллектуального анализа данных. Язык расширений интеллектуального анализа данных (DMX) содержит инструкции для создания, обучения и использования моделей интеллектуального анализа данных. Эти задачи можно также решить с помощью сочетания XML для аналитики (XMLA) и языка сценариев служб Analysis Services (ASSL), либо при помощи объектов AMO.
Доступ ко всем метаданным, связанным с интеллектуальным анализом данных, производится с помощью наборов строк схемы интеллектуального анализа данных. Например, их можно использовать для определения типов данных, поддерживаемых алгоритмом, или для определения имен моделей, имеющихся в базе данных.
Дополнительные сведения см. в разделеСправочник по расширениям интеллектуального анализа данных, Наборы строк схемы интеллектуального анализа данных, Использование XML для аналитики в службах Analysis Services (XMLA)