Поделиться через


Преобразование «Процентная выборка»

Изменения: 5 декабря 2005 г.

Преобразование «Процентная выборка» создает образец набора данных извлечением некоторого процента входных строк преобразования. Данные выборки извлекаются случайным образом из входа преобразования. За счет этого достигается репрезентативность выборки.

Преобразование «Процентная выборка» особенно полезно для интеллектуального анализа данных. С помощью этого преобразования можно случайным образом разделить набор данных на два набора: один — для изучения модели интеллектуального анализа данных, другой — для тестирования этой модели.

Преобразование «Процентная выборка» также полезно для создания образца набора данных, используемого при разработке пакета. Применяя преобразование «Процентная выборка» к потоку данных, можно уменьшить размер набора данных, сохраняя его статистические характеристики. Тестовый пакет можно выполнить быстрее, потому что он содержит меньший, но репрезентативный набор данных.

Можно изменить стартовое значение генератора случайных чисел, используемого для выборки строк. Если всегда использовать одинаковое стартовое значение для генератора, то результирующая выборка, при прочих равных условиях, будет тоже всегда одинаковая. Если начальное значение для создания случайного номера не указано, преобразование использует счетчик времени операционной системы. Поэтому можно выбрать постоянное стартовое значение для генератора во время отладки и случайное значение при передаче пакета в производственную эксплуатацию.

Это преобразование немного схоже с преобразованием «Выборка строк», которое создает выборку с заданным количеством строк. Дополнительные сведения см. в разделе Преобразование «Выборка строк».

Преобразование «Процентная выборка» содержит пользовательское свойство SamplingValue. Это свойство может быть обновлено выражением свойства при загрузке пакета. Дополнительные сведения см. в разделах Справочник выражений служб Integration Services, Использование выражений свойств в пакетах и Transformation Custom Properties.

Преобразование имеет один вход и два выхода. Выход ошибок не поддерживается.

ms139864.note(ru-ru,SQL.90).gifПримечание.
Помимо заданного количества процентов преобразование «Процентная выборка» использует алгоритм, определяющий возможность включения строки в результирующую выборку. Это означает, что количество строк в выборке может не соответствовать точно заданному количеству процентов. Например, определив 10 процентов от входного набора данных, содержащего 25000 строк, можно получить выборку, содержащую немного больше или немного меньше, чем 2500 строк.

Настройка преобразования «Процентная выборка»

Свойства задаются с помощью конструктора служб SSIS или программно.

Дополнительные сведения о свойствах, которые можно установить в диалоговом окне Редактор преобразования «Процентная выборка», см. в разделе Редактор преобразования «Процентная выборка».

Диалоговое окно Расширенный редактор содержит свойства, которые можно установить с помощью программных средств. Дополнительные сведения о свойствах, которые можно задать в диалоговом окне Расширенный редактор или программно, см. в следующих разделах.

Дополнительные сведения о настройке свойств см. в следующих разделах.

См. также

Основные понятия

Создание потока данных пакета
Преобразования служб Integration Services

Справка и поддержка

Получение помощи по SQL Server 2005

Журнал изменений

Версия Журнал

5 декабря 2005 г.

Новое содержимое
  • Добавлены сведения об использовании выражений свойств с пользовательским свойством SamplingValue.