Заметка
Доступ к этой странице требует авторизации. Вы можете попробовать войти в систему или изменить каталог.
Доступ к этой странице требует авторизации. Вы можете попробовать сменить директорию.
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
Типичный рабочий процесс для машинного обучения включает несколько этапов:
Определение проблемы, которую необходимо решить, и метрику для измерения результатов.
Поиск, очистка и подготовка соответствующих данных.
Определение лучших функций и проектирование новых функций.
Создание, оценка и настройка моделей.
Использование моделей для создания прогнозов, рекомендаций и других результатов.
Модули в этом разделе содержат средства для финальных этапов машинного обучения, в которых для обучения модели применяется алгоритм. На этих заключительных этапах вы также создаете оценки, а затем оцениваете точность и полезность модели.
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Список задач машинного обучения по категориям
-
Выберите один из множества настраиваемых алгоритмов машинного обучения, включая модели кластеризации, регрессии, классификациии обнаружения аномалий .
-
Предоставьте свои данные настроенной модели для изучения шаблонов и создания статистики, которую можно использовать для прогнозов.
-
Создание прогнозов с помощью обученных моделей.
-
Измерьте точность обученной модели или Сравните несколько моделей.
Подробное описание этого экспериментального рабочего процесса см. в пошаговом руководстве по решению кредитных рисков.
Предварительные требования
Прежде чем приступить к забавной части создания модели, необходимо выполнить массовую подготовку. в этом разделе приводятся ссылки на средства в Машинное обучение Studio (классическая модель), которые могут помочь в очистке данных, повышении качества ввода и предотвращении ошибок во время выполнения.
Исследование данных и качество данных
Убедитесь, что данные имеют правильный тип данных, правильное количество и качество для выбранного алгоритма. Изучите объем данных и их распределение. Существуют выбросы? Как они были созданы и что они означают? Существуют ли какие-либо повторяющиеся записи?
Обработку отсутствующих значений
Отсутствующие значения могут повлиять на результаты различными способами. Например, почти все статистические методы отбрасывают случаи с отсутствующими значениями. по умолчанию Машинное обучение следует этим правилам при обнаружении строк с отсутствующими значениями:
Если данные, используемые для обучения модели, имеют отсутствующие значения, пропускаются все строки с отсутствующими значениями.
Если данные, используемые в качестве входных данных при вычислении показателя для модели, не имеют значений, отсутствующие значения используются в качестве входных данных, но передаются значения NULL. Обычно это означает, что в результаты вместо допустимого прогноза вставляется значение null.
Обязательно проверьте данные перед обучением модели. Чтобы аппроксимация недостающие значения или исправить данные, используйте следующий модуль:
Выбор компонентов и уменьшение размерности
Машинное обучение Studio (классическая модель) поможет вам необходимости просеивания данные, чтобы найти наиболее полезные атрибуты.
Для определения столбцов данных с наибольшей степенью прогнозной мощности используются такие средства, как анализ Discriminantного линейного анализа или Выбор компонентов на основе фильтра . Эти средства также могут определять столбцы, которые должны быть удалены из-за утечки данных.
Создайте или спроектируйте функции из существующих данных. Нормализация данных или группирования данных в ячейки для создания новых группирований данных или стандартизации диапазона числовых значений перед анализом.
Уменьшите размерность путем группирования значений категорий, с помощью анализа основных компонентовили выборки.
Примеры
Примеры машинного обучения в действии см. в Коллекция решений ии Azure.
Советы и пошаговое руководство по типовым задачам препратион данных см. в разделе Пошаговые руководства по выполнению процесса обработки и анализа данных группы.