Поделиться через


Обработка структур и моделей (службы Analysis Services — интеллектуальный анализ данных)

До обработки объект интеллектуального анализа данных представляет собой просто пустой контейнер. Обработка модели интеллектуального анализа данных также называется обучением.

Обработка структур интеллектуального анализа данных.   Структура интеллектуального анализа данных получает данные из внешнего источника, определенного в привязках столбцов и метаданных использования, и считывает данные. Эти данные считываются полностью и затем подвергаются анализу, чтобы получить различную статистику. Службы Analysis Services сохраняют в локальном кэше компактное представление данных, которое удобно для анализа, проводимого алгоритмами интеллектуального анализа данных. После обработки моделей этот кэш можно сохранить или удалить. По умолчанию кэш сохраняется. Дополнительные сведения см. в разделе Как обработать структуру интеллектуального анализа данных.

Обработка моделей интеллектуального анализа данных.    До обработки модель интеллектуального анализа данных пуста и содержит только определения. Чтобы обработать модель интеллектуального анализа данных, необходимо обработать структуру интеллектуального анализа данных, на которой основана модель. Модель интеллектуального анализа данных получает данные из кэша структуры интеллектуального анализа данных, применяет все фильтры, созданные для модели, а затем передает набор данных алгоритму, чтобы выявить закономерности. После обработки модели сохраняются только результаты обработки, но не сами данные. Дополнительные сведения см. в разделе Как обработать модель интеллектуального анализа данных.

На следующей схеме показан поток данных во время обработки структуры интеллектуального анализа данных и во время обработки модели интеллектуального анализа данных.

Обработка данных: от источника до структуры и затем до модели

Запросы к реляционному хранилищу во время обработки

Обработка имеет три этапа: запрос к исходным данным, определение необработанной статистики и использование определения и алгоритма модели для обучения модели интеллектуального анализа данных.

Сервер служб Analysis Services выдает запросы к базе данных, предоставляющей необработанные данные. База данных может быть экземпляром SQL Server 2008 или более ранней версией компонента SQL Server Database Engine. Во время обработки структуры интеллектуального анализа данных данные из источника передаются в структуру интеллектуального анализа данных и сохраняются на диск в новом (сжатом) формате. Обработке подвергается не каждый столбец в источнике данных, а только столбцы, включенные в структуру интеллектуального анализа данных, как определено в привязках.

Используя эти данные, службы Analysis Services строят индекс по всем данным и дискретизированным столбцам, а также создают отдельный индекс по непрерывным столбцам. Чтобы создать такой индекс для всех вложенных таблиц, выполняется запрос и, кроме того, формируется дополнительный запрос для каждой вложенной таблицы, чтобы обработать связи между каждой вложенной таблицей и таблицей вариантов. Причина создания нескольких запросов заключается в необходимости оперативной аналитической обработки куба. Можно ограничить число запросов служб Analysis Services к реляционному хранилищу, установив свойство сервера DatabaseConnectionPoolMax. Дополнительные сведения см. в разделе Свойства OLAP.

Во время обработки модель не считывает повторно данные из источника, а получает сводку данных из структуры интеллектуального анализа данных. Совместно используя созданный куб, кэшированный индекс и данные таблицы вариантов, сервер создает независимые потоки для обучения моделей.

В выпуске SQL Server Enterprise вся обработка выполняется в параллельном режиме. В выпуске SQL Server Standard обработка сериализуется.

Просмотр результатов обработки

После обработки структура интеллектуального анализа данных содержит компактное представление данных для использования в статистическом анализе. Если кэш не очищен, доступ к хранящимся в нем данным можно получить следующими способами.

Модель интеллектуального анализа данных после обработки содержит только закономерности, полученные во время анализа, и сопоставления результатов модели с обучающими данными в кэше. Можно просмотреть или запросить результаты модели, называемые содержимым модели, или запросить варианты модели и структуры, если они помещены в кэш.

Содержимое каждой модели интеллектуального анализа данных зависит от алгоритма, использованного для ее создания. Например, если одна модель является моделью кластеризации, а другая — моделью дерева принятия решений, содержимое моделей будет сильно различаться, несмотря на то, что модели используют совершенно идентичный набор данных. Дополнительные сведения см. в разделе Содержимое модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).