Поделиться через


Распределения (расширения интеллектуального анализа данных)

В службах MicrosoftSQL ServerAnalysis Services можно задавать содержимое столбцов в структуре интеллектуального анализа данных и таким образом влиять на процесс обработки данных в указанных столбцах при создании моделей интеллектуального анализа данных. В некоторых алгоритмах лучше задавать распределение для всех столбцов, содержащих непрерывные данные, до начала обработки модели в случае, если указанные столбцы содержат общие распределения значений. Если распределения не заданы, создаваемые модели интеллектуального анализа данных могут работать менее точно, чем модели с заданными распределениями, так как на вход алгоритмов будет подаваться меньшее количество данных для анализа.

Алгоритмы интеллектуального анализа данных Microsoft могут работать с данными следующих типов:

  • NORMAL
    На основе значений столбца, содержащего непрерывные данные, может быть построена гистограмма с нормальным Гауссовским распределением.

  • Log Normal
    На основе значений столбца, содержащего непрерывные данные, может быть построена гистограмма с нормально распределенной функцией логарифма значений.

  • UNIFORM
    На основе значений столбца непрерывных данных может быть сформирована плоская кривая, на которой все значения являются равновероятными.

Дополнительные сведения об алгоритмах интеллектуального анализа данных Microsoft см. в разделе Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных). Алгоритмы интеллектуального анализа данных третьих поставщиков могут также иметь возможность работы с другими типами распределений. Чтобы определить, какие типы распределения поддерживаются алгоритмом, используйте набор строк схемы SUPPORTED_DISTRIBUTION_FLAGS.

Дополнительные сведения о типах распределения см. в разделе Распределения столбцов (интеллектуальный анализ данных).

См. также

Справочник

Основные понятия