Поделиться через


Компонент "Добавление столбцов"

В этой статье описывается компонент в конструкторе Машинного обучения Azure.

Этот компонент используется для сцепления двух наборов данных. Все столбцы из двух наборов данных, указанных в качестве входных данных, объединяются для создания одного набора данных. Если вам нужно сцепить более двух наборов данных, примените несколько экземпляров модуля Добавление столбцов.

Как настроить модуль "Добавление столбцов"

  1. Добавьте в конвейер компонент Добавление столбцов.

  2. Подключите к нему два набора данных, которые вы сцепляете. Если вам нужно объединить более двух наборов данных, создайте цепочку из нескольких комбинаций модулей Добавление столбцов.

    • Допускается объединение двух столбцов, которые содержат разное число строк. Строки выходного набора данных в этом случае будут содержать заполнители вместо недостающих значений в тех столбцах, которые получены из меньшего входного набора данных.

    • Не поддерживается выбор отдельных столбцов для добавления. При использовании модуля Добавление столбцов сцепляются все столбцы из каждого набора данных. Поэтому, если требуется добавить только подмножество столбцов, используйте модуль "Выбор столбцов в наборе данных" для создания набора данных с нужными столбцами.

  3. Отправьте конвейер.

Результаты

После запуска конвейера сделайте следующее:

  • Можно просмотреть первые строки нового набора данных, щелкнув правой кнопкой мыши компонент Добавление столбцов и выбрав действие "Визуализировать". Также можно выбрать этот компонент и перейти на вкладку Выходные данные на панели справа, щелкнуть значок гистограммы в области Port outputs (Портировать выходные данные), чтобы визуализировать результат.

Число столбцов в новом наборе данных равно сумме столбцов обоих входных наборов данных.

Если во входных наборах данных есть два столбца с одинаковыми именами, к именам таких столбцов добавляется числовой суффикс. Например, если есть два экземпляра столбца с именем TargetOutcome, то левый столбец получит имя TargetOutcome_1, а правый — TargetOutcome_2.

Следующие шаги

Ознакомьтесь с набором доступных компонентов для машинного обучения Azure.