Поделиться через


Создание проверочного набора (Мастер интеллектуального анализа данных)

На странице Создание проверочного набора указывается, какая часть данных должна использоваться для обучения, а какая должна быть зарезервирована для применения в качестве проверочного набора. Благодаря разделению данных на обучающий и проверочный наборы при создании структуры интеллектуального анализа становится намного проще оценить точность моделей интеллектуального анализа данных, создаваемых в дальнейшем.

Можно указать количество проверочных данных в процентах или задать число, чтобы ограничить количество вариантов, используемых для проверки. Если указаны и процентная доля, и максимальное количество вариантов, используемых для проверки, то сравниваются оба параметра и в набор проверочных данных включается меньшее из двух значений количества вариантов. По умолчанию используется 30 процентов данных для проверки, 70 процентов — для обучения, и максимальное количество проверочных вариантов не устанавливается.

По умолчанию в службах Analysis Services формируется числовое начальное значение, которое используется для запуска секционирования. Это начальное значение определяется на основе имени структуры интеллектуального анализа данных. Если необходимо, чтобы секции оставались неизменными даже при изменении имени структуры интеллектуального анализа, можно указать величину начального значения, указав свойство HoldoutSeed структуры интеллектуального анализа данных. Если это начальное контрольное значение изменится, обработка структуры должна быть выполнена повторно.

Если в дальнейшем потребуется изменить количество проверочных или обучающих данных, можно изменить свойства HoldoutMaxCases и HoldoutMaxPercent структуры интеллектуального анализа данных с помощью окна Свойства. Однако после такого изменения необходимо выполнить повторную обработку структуры интеллектуального анализа и всех связанных с ней моделей интеллектуального анализа данных. Также действуют следующие ограничения.

  • Секционирование структуры интеллектуального анализа данных поддерживается только в том случае, если структура интеллектуального анализа данных хранится в SQL Server 2008. Более ранние версии служб SQL ServerAnalysis Services не поддерживают кэширование данных секций для структур интеллектуального анализа данных.

  • Секционирование структуры интеллектуального анализа данных невозможно, если структура интеллектуального анализа содержит ключевой столбец времени, который требуется для моделей интеллектуального анализа данных с временными рядами.

  • Секционировать данные невозможно, если предпринимается попытка прогнозирования значения, которое хранится во вложенной таблице.

Дополнительные сведения см. в разделах Проверка моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных), Создание новой структуры интеллектуального анализа данных, Учебник по основам интеллектуального анализа данных

Параметры

  • Процент проверочных данных
    Нажимайте кнопки со стрелками вверх и вниз, чтобы увеличить или уменьшить процентную долю данных, предназначенных для использования в качестве обучающего множества, или введите значение от 0 до 100 в текстовом поле.

  • Максимальное количество вариантов в наборе проверочных данных
    Введите число, ограничивающее количество вариантов, которые могут использоваться для проверки.

    Если указано число, превышающее фактическое количество вариантов в данных, будут использоваться все варианты.

    Значение по умолчанию — NULL. Это означает отсутствие какого-либо предела.