Статья
09/28/2010

Распределения (расширения интеллектуального анализа данных)

В службах MicrosoftSQL ServerAnalysis Services можно задавать содержимое столбцов в структуре интеллектуального анализа данных и таким образом влиять на процесс обработки данных в указанных столбцах при создании моделей интеллектуального анализа данных. В некоторых алгоритмах лучше задавать распределение для всех столбцов, содержащих непрерывные данные, до начала обработки модели в случае, если указанные столбцы содержат общие распределения значений. Если распределения не заданы, создаваемые модели интеллектуального анализа данных могут работать менее точно, чем модели с заданными распределениями, так как на вход алгоритмов будет подаваться меньшее количество данных для анализа.

Алгоритмы интеллектуального анализа данных Microsoft могут работать с данными следующих типов:

NORMAL
На основе значений столбца, содержащего непрерывные данные, может быть построена гистограмма с нормальным Гауссовским распределением.
Log Normal
На основе значений столбца, содержащего непрерывные данные, может быть построена гистограмма с нормально распределенной функцией логарифма значений.
UNIFORM
На основе значений столбца непрерывных данных может быть сформирована плоская кривая, на которой все значения являются равновероятными.

Дополнительные сведения об алгоритмах интеллектуального анализа данных Microsoft см. в разделе Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных). Алгоритмы интеллектуального анализа данных третьих поставщиков могут также иметь возможность работы с другими типами распределений. Чтобы определить, какие типы распределения поддерживаются алгоритмом, используйте набор строк схемы SUPPORTED_DISTRIBUTION_FLAGS.

Дополнительные сведения о типах распределения см. в разделе Распределения столбцов (интеллектуальный анализ данных).