Требования к обработке и связанные замечания (интеллектуальный анализ данных)

Статья
07/30/2013

В этом разделе рассматриваются некоторые технические вопросы, которые необходимо учитывать при обработке объектов интеллектуального анализа данных. Общее описание обработки и ее применения в интеллектуальном анализе данных см. в разделе Обработка объектов интеллектуального анализа данных.

Запросы к реляционному хранилищу

Обработка структур интеллектуального анализа данных

Обработка моделей интеллектуального анализа данных

Запросы к реляционному хранилищу во время обработки

В интеллектуальном анализе данных обработка состоит из трех этапов: запрос к исходным данным, определение необработанной статистики и использование определения и алгоритма модели для обучения модели интеллектуального анализа данных.

Сервер служб Analysis Services выдает запросы к базе данных, предоставляющей необработанные данные. База данных может быть экземпляром SQL Server 2012 или более ранней версией компонента SQL Server Database Engine. Во время обработки структуры интеллектуального анализа данных данные из источника передаются в структуру интеллектуального анализа данных и сохраняются на диск в новом (сжатом) формате. Обработке подвергается не каждый столбец в источнике данных, а только столбцы, включенные в структуру интеллектуального анализа данных, как определено в привязках.

Используя эти данные, службы Analysis Services строят индекс по всем данным и дискретизированным столбцам, а также создают отдельный индекс по непрерывным столбцам. Чтобы создать такой индекс для всех вложенных таблиц, выполняется запрос и, кроме того, формируется дополнительный запрос для каждой вложенной таблицы, чтобы обработать связи между каждой вложенной таблицей и таблицей вариантов. Причина создания нескольких запросов заключается в необходимости обработки специального внутреннего многомерного хранилища данных. Можно ограничить число запросов служб Analysis Services к реляционному хранилищу, установив свойство сервера DatabaseConnectionPoolMax. Дополнительные сведения см. в разделе Свойства OLAP.

Во время обработки модель не считывает повторно данные из источника, а получает сводку данных из структуры интеллектуального анализа данных. Совместно используя созданный куб, кэшированный индекс и данные таблицы вариантов, сервер создает независимые потоки для обучения моделей.

Дополнительные сведения о выпусках SQL Server, поддерживающих параллельную обработку моделей, см. в разделе Функции, поддерживаемые различными выпусками SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473).

Обработка структур интеллектуального анализа данных

Структуру интеллектуального анализа можно обрабатывать вместе со всеми зависимыми моделями или отдельно. Обработка структуры интеллектуального анализа данных отдельно от моделей может оказаться полезной, когда некоторые модели обрабатываются продолжительное время и эту операцию необходимо отложить.

Дополнительные сведения см. в разделе обработать структуру интеллектуального анализа данных.

Если экономия места на диске является важным вопросом, то необходимо учитывать, что службы Analysis Services помещают в локальный кэш структуру интеллектуального анализа данных. То есть записывают все обучающие данные на локальный жесткий диск. Если кэширование данных не нужно, можно изменить параметр по умолчанию. Для этоно нужно задать свойству MiningStructureCacheMode в структуре интеллектуального анализа данных значение ClearAfterProcessing. В результате кэш после обработки моделей будет удаляться. Однако при этом также будет отключена детализация в структуре интеллектуального анализа данных. Дополнительные сведения см. в разделе Запросы детализации (интеллектуальный анализ данных).

Кроме того, после очистки кэша нельзя будет использовать контрольный проверочный набор, если он был определен, и определение секции проверочного набора будет потеряно. Дополнительные сведения о контрольных проверочных наборах см. в разделе Обучающие и проверочные наборы данных.

Обработка моделей интеллектуального анализа данных

Модель интеллектуального анализа данных можно обрабатывать отдельно от связанной с ней структуры интеллектуального анализа данных либо можно обрабатывать одновременно все модели, основанные на структуре, вместе с самой структурой.

Дополнительные сведения см. в разделе обработать модель интеллектуального анализа данных.

Однако в средах SQL Server Data Tools (SSDT) и Среда SQL Server Management Studio выбрать несколько моделей интеллектуального анализа данных для обработки со структурой нельзя. Если необходимо определить список обрабатываемых моделей, их нужно выбрать по отдельности либо воспользоваться скриптами XMLA или DMX для последовательной обработки моделей.

Необходимость повторной обработки

Прежде чем приступить к работе с определяемыми моделями служб Analysis Services, необходимо их обработать. Также необходимо повторно обрабатывать модели интеллектуального анализа данных при любом изменении структуры интеллектуального анализа данных, обновлении обучающих данных, изменении существующей модели интеллектуального анализа данных или добавлении к структуре новой модели интеллектуального анализа данных.

Модели интеллектуального анализа данных также обрабатываются в следующих сценариях.

Развертывание проекта. В зависимости от настроек проекта и его текущего состояния модели интеллектуального анализа данных проекта обычно полностью обрабатываются при развертывании проекта.

После запуска развертывания обработка начинается автоматически при условии, что на сервере служб Analysis Services нет ранее обработанной версии, а также отсутствуют структурные изменения. Проект можно развернуть, выбрав в раскрывающемся списке пункт Развернуть решение или нажав клавишу F5. Можно

Дополнительные сведения о настройке свойств развертывания служб Analysis Services, определяющих развертывание моделей интеллектуального анализа данных, см. в разделе Развертывание решений интеллектуального анализа данных.

Перемещение модели интеллектуального анализа данных. При перемещении модели интеллектуального анализа данных с помощью команды EXPORT экспортируется только определение модели, включающее имя структуры интеллектуального анализа данных, которая должна предоставлять данные для модели.

Требования повторной обработки для следующих сценариев с использованием команд EXPORT и IMPORT.

Структура интеллектуального анализа данных существует в целевом экземпляре и находится в необработанном состоянии.

Необходимо повторно обработать и структуру и модель.
Структура интеллектуального анализа данных существует в целевом экземпляре, и она была обработана. Была экспортирована только модель интеллектуального анализа данных.

Модель можно использовать без обработки.
Определение структуры интеллектуального анализа данных также было экспортировано с помощью ключевого слова WITH DEPENDENCIES.

Необходимо повторно обработать и структуру и модель.

Дополнительные сведения см. в разделе Экспорт и импорт объектов интеллектуального анализа данных.

См. также

Основные понятия

Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Обработка объектов многомерной модели

Поделиться через

Требования к обработке и связанные замечания (интеллектуальный анализ данных)

Запросы к реляционному хранилищу во время обработки

Обработка структур интеллектуального анализа данных

Обработка моделей интеллектуального анализа данных

Необходимость повторной обработки

См. также

Основные понятия

Дополнительные ресурсы