Заметка
Доступ к этой странице требует авторизации. Вы можете попробовать войти в систему или изменить каталог.
Доступ к этой странице требует авторизации. Вы можете попробовать сменить директорию.
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
в этой статье описываются модули в Машинное обучение Studio (классическая модель), которые можно использовать для базовых операций с данными.
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Машинное обучение Studio (классическая модель) поддерживает задачи, относящиеся к машинному обучению, такие как нормализация или выбор компонентов. Модули в этой категории предназначены для более общих задач.
Задачи обработки данных
модули в этой категории предназначены для поддержки основных задач управления данными, которые, возможно, потребуется выполнить в Машинное обучение Studio (классическая модель). Следующие задачи являются примерами основных задач управления данными.
- Объедините два набора данных: с помощью соединений или путем слияния столбцов или строк.
- Создание новых категорий для группирования данных.
- Изменение заголовков столбцов, изменение типов данных столбцов или пометка столбцов как компонентов или меток.
- Проверьте отсутствующие значения и замените их соответствующими значениями.
Связанные задачи
- Выполните выборку или разделите набор данных на обучающий и проверочный наборы: используйте модули преобразования данных-Sample и Split .
- Масштабирование чисел, нормализация данных или помещение числовых значений в ячейки: используйте модули преобразования данных — масштабирование и уменьшение .
- Выполнение вычислений с полями числовых данных или создание часто используемой статистики: использование средств в статистических функциях.
Примеры
Примеры работы со сложными данными в экспериментах машинного обучения см. в следующих примерах в Коллекция решений ии Azure:
- Обработка и анализ данных: демонстрирует ключевые средства и процессы.
- Обнаружение рака молочной железы: показывает, как секционировать наборы данных, а затем применить специальную обработку к каждой секции.
Модули в этой категории
Категория управления преобразованием данных включает следующие модули:
- Добавить столбцы: добавляет набор столбцов из одного набора данных в другой.
- Добавить строки: добавляет набор строк из входного набора данных в конец другого набора данных.
- преобразование "применить SQL": выполняет запрос SQLite к входным наборам данных, чтобы преобразовать данные.
- Очистить отсутствующие данные: определяет способ управления значениями, отсутствующими в наборе данных. Этот модуль заменяет собой очистку отсутствующих значений, что является устаревшим.
- Преобразовать в значения индикатора: преобразует значения категорий в столбцы в значения индикаторов.
- Изменить метаданные: изменяет метаданные, связанные со столбцами в наборе данных.
- Группирование значенийпо категориям: группирует данные из нескольких категорий в новую категорию.
- Объединение данных: соединяет два набора данных.
- Удалить дублирующиеся строки: удаляет дублирующиеся строки из набора данных.
- Выбор столбцов в наборе данных: Выбор столбцов для включения в набор данных или исключение из набора данных в операции.
- Выбор столбцов преобразование: создает преобразование, которое выбирает то же подмножество столбцов, что и в указанном наборе данных.
- Смоте: увеличивает количество примеров с низкими недостатками в наборе данных с использованием искусственной избыточной доли миноритария.