Aplicar filtro
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
Aplica un filtro a las columnas especificadas de un conjunto de datos
Categoría: Transformación/filtro de datos
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Información general sobre el módulo
En este artículo se describe cómo usar el módulo Aplicar filtro en Machine Learning Studio (clásico) para transformar una columna de valores aplicando un filtro definido previamente. Los filtros se usan en el procesamiento de señales digitales para reducir el ruido o resaltar un patrón. Por lo tanto, los valores que se transforman siempre son numéricos y normalmente representan algún tipo de señal visual o de audio.
Sugerencia
¿Busca otro tipo de filtro? Studio (clásico) proporciona estos módulos para muestreo de datos, obtención de un subconjunto de datos, eliminación de valores no válidos o creación de conjuntos de prueba y entrenamiento: Dividirdatos, Limpiar datos que faltan, Partición y ejemplo, Aplicar SQL Transformación, Recortar valores. Si necesita filtrar los datos a medida que los lee desde un origen, consulte Importación de datos. Las opciones dependen del tipo de origen.
Después de determinar qué tipo de filtro es mejor para el origen de datos, especifique los parámetros y use Aplicar filtro para transformar el conjunto de datos. Dado que el diseño de filtros es independiente del proceso de aplicar un filtro, los filtros son reutilizables. Por ejemplo, si trabaja con frecuencia con datos que se usan para la previsión, podría diseñar varios tipos de filtros de media móvil para entrenar y comparar varios modelos. También puede guardar el filtro para aplicarlo a otros experimentos o a conjuntos de datos diferentes.
Cómo configurar Aplicar filtro
Agregue el módulo Aplicar filtro al experimento. Puede encontrar el módulo de filtro IIR en Transformación de datos, en la categoría Filtros.
A la entrada derecha, conecte un conjunto de datos que contenga valores numéricos a una entrada.
En la entrada izquierda, conecte un filtro existente. Puede volver a usar un filtro guardado o puede configurar uno de los siguientes módulos de filtro: Filtro de umbral, Filtro de media móvil, Filtro de mediana, Filtro IIR, Filtro FIR, Filtro definido por el usuario.
En el panel Propiedades de Aplicar filtro, haga clic en Iniciar selector de columnas y elija las columnas a las que se debe aplicar el filtro.
Ejecute el experimento o haga clic con el botón derecho en Aplicar filtro y haga clic en Ejecutar seleccionado.
Results
La salida contiene solo los datos de las columnas seleccionadas, transformados aplicando la transformación matemática predefinida especificada.
Si desea ver otras columnas del conjunto de datos, puede usar el módulo Agregar columnas para combinar los conjuntos de datos originales y filtrados.
Nota:
Los valores de la columna original no se han eliminado ni sobrescrito y siguen estando disponibles en el experimento como referencia. Sin embargo, la salida del filtro suele ser más útil para el modelado.
Ejemplos
Para obtener ejemplos de cómo se usan los filtros en el aprendizaje automático, consulte el Azure AI Gallery:
- Filtros: muestra todos los tipos de filtro mediante un conjunto de datos de forma de onda diseñado.
Notas técnicas
Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.
El módulo Aplicar filtro enlaza el tipo de filtro especificado a las columnas seleccionadas. Si necesita aplicar distintos tipos de filtros a columnas diferentes, debe usar Seleccionar columnas en el conjunto de datos para aislar las columnas y aplicar tipos de filtro diferentes en flujos de trabajo independientes. Para obtener más información, vea Seleccionar columnas en el conjunto de datos.
Los filtros no pasan las columnas de datos que no se ven afectadas por el filtro. Es decir, la salida de Aplicar filtro solo contiene los valores numéricos transformados. Sin embargo, puede usar el módulo Agregar columnas para unir valores transformados con el conjunto de datos de origen.
Períodos de filtro
El tipo de filtro determina parcialmente el período de filtro, como se muestra a continuación:
Para los filtros de respuesta finita al impulso (FIR), media móvil simple y media móvil triangular, el período de filtro es finito.
Para los filtros de respuesta infinita al impulso, media móvil exponencial y media móvil acumulativa, el período de filtro es infinito.
Para filtros de umbral, el período de filtro es siempre 1.
Para filtros de mediana, independientemente del período de filtro, NaN y los valores que faltan en la señal de entrada no producen nuevos NaN en la salida.
Valores que faltan
En esta sección se describe el comportamiento cuando se encuentran valores que faltan, por tipo de filtro. En general, cuando un filtro encuentra un NaN o un valor que falta en el conjunto de datos de entrada, el conjunto de datos de salida se convierte en filtrado con NaNs para el siguiente número de muestras, dependiendo del período de filtro. Esto tiene las siguientes consecuencias:
Los filtros FIR, media móvil simple o media móvil triangular tienen un período finito. Como resultado, cualquier valor que falte va seguido de un número de NaN igual al orden de filtro menos uno.
Los filtros IIR, media móvil exponencial o media móvil acumulativa tienen un período infinito. Como resultado, después de que se encuentre el primer valor que falta, los NaN seguirán propropagación indefinidamente.
En un filtro de umbral, el período de un filtro de umbral es 1. Como resultado, los valores que faltan y los NaN no se propagan.
Para filtros de mediana, NaN y los valores que faltan encontrados en el conjunto de datos de entrada no producen nuevos NaN en la salida, independientemente del período de los filtros.
Entradas esperadas
Nombre | Tipo | Descripción |
---|---|---|
Filter | Interfaz IFilter | Implementación del filtro |
Dataset | Tabla de datos | Conjunto de datos de entrada |
Para obtener una lista de errores específicos de los módulos de Studio (clásico), consulte Machine Learning códigos de error.
Para obtener una lista de excepciones de API, consulte Machine Learning códigos de error de la API REST.
Parámetros del módulo
Nombre | Intervalo | Tipo | Valor predeterminado | Descripción |
---|---|---|---|---|
Conjunto de columnas | Any | ColumnSelection | NumericAll | Seleccionar las columnas para filtrar |
Output
Nombre | Tipo | Descripción |
---|---|---|
Conjunto de datos de resultados | Tabla de datos | Conjunto de datos de salida |