Поделиться через


Применение фильтра

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Применяет фильтр к указанным столбцам набора данных

Категория: Преобразование или фильтр данных

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Обзор модуля

в этой статье дескриес, как использовать модуль « применить фильтр » в Машинное обучение Studio (классическая модель) для преобразования столбца значений путем применения ранее определенного фильтра. Фильтры используются в обработке цифровых сигналов для уменьшения шума или выделения шаблона. Таким образом, преобразуемые значения всегда являются числовыми и обычно представляют некоторый тип звука или визуального сигнала.

Совет

Вы ищете другой тип фильтра? Studio (классическая модель) предоставляет эти модули для выборки данных, получения подмножества данных, удаления недопустимых значений или создания тестовых и обучающих наборов: разбиение данных, очистка отсутствующих данных, секционирование и выборку, применение преобразования SQL, отсечения значений. Если необходимо фильтровать данные по мере их считывания из источника, см. раздел Импорт данных. Параметры зависят от типа источника.

Определив, какой тип фильтра лучше подходит для источника данных, укажите параметры и используйте Фильтр применить для преобразования набора данных. Так как создание и применение фильтров — отдельные операции, фильтры можно использовать повторно. Например, если вы часто работаете с данными, используемыми для прогнозирования, можно создать фильтры среднего скользящего нескольких типов для обучения и сравнения нескольких моделей. Можно также сохранить фильтр для применения к другим экспериментам или к другим наборам данных.

Настройка фильтра применения

  1. Добавьте в эксперимент модуль Применить фильтр . Модуль фильтра IIR можно найти в разделе Преобразование данныхв категории фильтры .

  2. Чтобы установить правый вход, подключите набор данных, содержащий числовые значения, к одному входному.

  3. Для левого входа Подключите существующий фильтр. Можно повторно использовать сохраненный фильтр или настроить фильтр с помощью одного из следующих модулей фильтров: Фильтр порога, Фильтр скользящего среднего, медиана фильтр, Фильтр IIR, Фильтр FIR, Пользовательский фильтр.

  4. На панели свойствфильтра применить фильтрщелкните запустить селектор столбцов и выберите столбцы, к которым должен применяться фильтр.

  5. Запустите эксперимент или щелкните правой кнопкой мыши Применить фильтр и выберите команду Выполнить выбранное.

Результаты

Выходные данные содержат только данные из выбранных столбцов, преобразованные путем применения заданного предопределенного математического преобразования.

Если требуется просмотреть другие столбцы в наборе данных, можно использовать модуль Добавить столбцы для слияния исходных и отфильтрованных наборов данных.

Примечание

Значения в исходном столбце не были удалены или перезаписаны и по-прежнему доступны в эксперименте для справки. Однако вывод фильтра обычно более удобен для моделирования.

Примеры

Примеры использования фильтров в машинном обучении см. в Коллекция решений ии Azure:

  • Фильтры: демонстрируются все типы фильтров с использованием сконструированного набора данных волны.

Технические примечания

В этом разделе содержатся сведения и советы относительно реализации, а также ответы на часто задаваемые вопросы.

  • Модуль Применить фильтр привязывает указанный тип фильтра к выбранным столбцам. Если необходимо применить различные типы фильтров к разным столбцам, следует использовать Выбор столбцов в наборе данных для изоляции столбцов и применения различных типов фильтров в отдельных рабочих процессах. Дополнительные сведения см. в разделе Выбор столбцов в наборе данных.

  • Фильтры не проходят через столбцы данных, которые не обрабатываются фильтром. Поэтому выходные данные модуля Применение фильтра содержат только преобразованные числовые значения. Однако можно использовать модуль Добавить столбцы для объединения преобразованных значений с исходным набором данных.

Периоды фильтрации

Период фильтрации определяется по типу фильтра следующим образом:

  • Для таких фильтров, как КИХ, простое скользящее среднее и треугольное скользящее среднее, период фильтра конечный.

  • Для таких фильтров, как КИХ, экспоненциальное скользящее среднее и кумулятивное скользящее среднее, период фильтра бесконечный.

  • Для фильтров порогового значения период фильтра всегда 1.

  • В случае медианных фильтров вне зависимости от периода фильтра значения NaN и отсутствующие значения во входном сигнале не создают новые значения NaN в выходных данных.

Отсутствующие значения

В этом разделе описывается поведение при обнаружении отсутствующих значений по типу фильтра. В общем случае, когда фильтр обнаруживает NaN или отсутствующее значение во входном наборе данных, выходной набор данных преобразуется в развратил с значений NaN для некоторого следующего числа выборок в зависимости от периода фильтрации. Это приводит к следующим последствиям.

  • Для фильтров "FIR", простого скользящего среднего или треугольных скользящего среднего есть ограниченный период. В результате за любым отсутствующим значением будет следовать число значений NaN, равное порядковому номеру фильтра минус один.

  • Фильтры для IIR, экспоненциального скользящего среднего или кумулятивного скользящего среднего имеют бесконечный период. В результате, после обнаружения первого отсутствующего значения значений NaN будет продолжать распространяться бессрочно.

  • В фильтре порогов точка фильтра порогового значения равна 1. В результате отсутствующие значения и значений NaN не распространяются.

  • В случае медианных фильтров значения NaN и отсутствующие значения во входном сигнале не создают новые значения NaN в выходных данных вне зависимости от периода фильтра.

Ожидаемые входные данные

Имя Тип Description
Filter Интерфейс IFilter Реализация фильтра
Dataset Таблица данных Входной набор данных

список ошибок, относящихся к модулям студии (классическая версия), см. в разделе Машинное обучение коды ошибок.

список исключений API см. в разделе Машинное обучение REST API коды ошибок.

Параметры модуля

Имя Диапазон Тип По умолчанию Описание
Набор столбцов Любой Выбор столбцов NumericAll Выберите столбцы для фильтрации

Выходные данные

Имя Тип Описание
Набор данных результатов Таблица данных Выходной набор данных

См. также раздел

Фильтр
Список модулей в алфавитном порядке