Compartir a través de


Combinar la transformación de recuento

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Crea un conjunto de características basado en una tabla de recuentos

Categoría: Learning con recuentos

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo Transformación de recuento de mezcla en Machine Learning Studio (clásico) para combinar dos conjuntos de características basadas en recuento. Al combinar dos conjuntos de recuentos y características relacionados, puede mejorar potencialmente la cobertura y la distribución de las características.

Learning de recuentos es especialmente útil en grandes conjuntos de datos con características de alta cardinalidad. La capacidad de combinar varios conjuntos de datos en conjuntos de características basados en recuento sin tener que volver a procesar los conjuntos de datos facilita la recopilación de estadísticas en conjuntos de datos muy grandes y su aplicación a nuevos conjuntos de datos. Por ejemplo, las tablas de recuento se pueden usar para recopilar información sobre terabytes de datos. Puede volver a usar esas estadísticas para mejorar la precisión de los modelos predictivos en conjuntos de datos pequeños.

Para combinar dos conjuntos de características basadas en recuento, las características deben haber sido creadas con tablas que tengan el mismo esquema: es decir, ambos conjuntos deben usar las mismas columnas y tener los mismos nombres y tipos de datos.

Cómo configurar la transformación De recuento de mezcla

  1. Para usar la transformación Recuento de mezcla, debe haber creado al menos una transformación basada en recuento y esa transformación debe estar presente en el área de trabajo. Si guardó una transformación basada en recuento de un experimento diferente, busque en el grupo Transformaciones. Si creó la transformación en el experimento actual, conecte las salidas de los módulos siguientes:

    • Transformación Recuento de compilaciones. Crea una nueva transformación basada en recuento a partir de los datos de origen.

    • Modificar parámetros de tabla de recuento. Toma una transformación de recuento existente como entrada y genera una transformación actualizada.

    • Importar tabla de recuento. Este módulo admite la compatibilidad con versiones anteriores con experimentos anteriores que usaban el aprendizaje basado en recuento. Si usó Importar tabla de recuento para analizar la distribución de valores de un conjunto de datos y, a continuación, convirtió los valores en características mediante el módulo Desusado Desuso, use Importar tabla de recuento para convertir los resultados en una transformación.

  2. Agregue el módulo Merge Count Transform (Transformación de recuento de mezcla) al experimento y conecte una transformación a cada entrada.

    Sugerencia

    La segunda transformación es una entrada opcional: puede conectar la misma transformación dos veces o no conectar nada en el segundo puerto de entrada.

  3. Si no desea que el segundo conjunto de datos se pondera igual que el primero, especifique un valor para Factor de decadencia. El valor que escriba indica cómo se debe ponderar el conjunto de características de la segunda transformación.

    Por ejemplo, el valor predeterminado de 1 pondera ambos conjuntos de características por igual. Un valor de .5 significa que las características del segundo conjunto tendrían la mitad del peso de las del primer conjunto.

  4. Opcionalmente, agregue una instancia del módulo Aplicar transformación y aplique la transformación a un conjunto de datos.

Ejemplos

Para obtener ejemplos de cómo se usa este módulo, consulte el Azure AI Gallery:

  • Learning con recuentos: clasificación binaria: muestra cómo usar el aprendizaje con módulos de recuentos para generar características a partir de columnas de valores categóricos para un modelo de clasificación binaria.

  • Learning con recuentos: clasificación multiclase con datos de taxis de Nueva York: muestra cómo usar el aprendizaje con módulos de recuentos para realizar la clasificación multiclase en el conjunto de datos de taxis de Nueva York disponible públicamente. El ejemplo usa un aprendiz de regresión logística multiclase para modelar este problema.

  • Learning con recuentos: clasificación binaria con datos de taxis de Nueva York: muestra cómo usar el aprendizaje con módulos de recuentos para realizar la clasificación binaria en el conjunto de datos de taxis de Nueva York disponible públicamente. En el ejemplo se usa un aprendiz de regresión logística de dos clases para modelar el problema.

Entradas esperadas

Nombre Tipo Descripción
Transformación de recuento anterior Interfaz ITransform Transformación de recuento que se editará
Nueva transformación de recuento Interfaz ITransform Transformación de recuento que se agregará (opcional)

Parámetros del módulo

Nombre Tipo Intervalo Opcional Descripción Valor predeterminado
Factor de decadencia Float Obligatorio 1,0f Factor de decadencia que se va a multiplicar a la transformación de recuento en el puerto de entrada correcto

Salidas

Nombre Tipo Descripción
Transformación de recuento combinado Interfaz ITransform Transformación combinada

Excepciones

Excepción Descripción
Error 0003 Se produce una excepción si una o varias de las entradas son NULL o están vacías.
Error 0086 Se produce una excepción cuando una transformación de recuento no es válida.

Consulte también

Aprendizaje con recuentos