Compartir a través de


Importar una tabla de recuento

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Importa una tabla de recuentos creada previamente

Categoría: Learning recuentos

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo Importar tabla de recuento en Machine Learning Studio (clásico).

El propósito del módulo Importar tabla de recuento es permitir a los clientes que crearon una tabla de estadísticas basadas en recuentos con una versión anterior de Machine Learning actualizar su experimento. Este módulo combina las tablas de recuento existentes con nuevos datos.

Para obtener información general sobre las tablas de recuento y cómo se usan para crear características, vea Learning con recuentos.

Importante

Este módulo se proporciona únicamente por compatibilidad con versiones anteriores con experimentos que usan la tabla de recuento de compilación en desuso y los módulos de caracterizadores de recuento en desuso. Se recomienda actualizar el experimento para usar los módulos más recientes para aprovechar las nuevas características.

Para todos los experimentos nuevos, se recomienda usar los siguientes módulos:

Cómo configurar la tabla de recuento de importación

  1. En Machine Learning Studio (clásico), abra un experimento que contenga una tabla de recuento creada con el módulo de tabla de recuento de compilación en desuso.

  2. Agregue el módulo Importar tabla de recuento al experimento.

  3. Conectar las dos salidas del módulo Tabla de recuento de compilación (en desuso) a los puertos de entrada correspondientes de la tabla De recuento de importación.

    Si tiene otro conjunto de datos de recuentos que desea combinar con la tabla de recuentos importada, conéctelo a la entrada situada más a la derecha para el módulo Importar tabla de recuento .

  4. Use la opción Counting type ( Tipo de recuento) para especificar dónde y cómo se almacena la tabla count:

    • Conjunto de datos: los datos usados para generar recuentos se guardan como un conjunto de datos en Machine Learning Studio (clásico).

    • Blob: los datos que se usan para crear recuentos se almacenan como blob en bloques Windows Azure Storage.

    • MapReduce: los datos usados para generar recuentos se almacenan como un blob en Windows Azure Storage.

      Esta opción suele ser la preferida para conjuntos de datos muy grandes. Para acceder a los recuentos, debe activar el clúster de HDInsight. Se MapReduce trabajo para realizar el recuento. Ambas actividades pueden incurrir en costos de almacenamiento y proceso.

      Para más información, consulte HDInsight en Azure.

    Después de especificar el modo de almacenamiento de datos, es posible que tenga que proporcionar información de conexión adicional para los datos, incluso si anteriormente usó un módulo Importar datos en el experimento para acceder a los datos. Esto se debe a que el módulo Count Featurizer (en desuso) accede al almacenamiento de datos por separado para leer los datos y compilar las tablas necesarias.

  5. Use la opción Count table type ( Tipo de tabla count) para especificar el formato y el modo de almacenamiento de la tabla que se usa para almacenar recuentos.

    • Diccionario: usa una tabla de recuento de diccionarios.

      Todos los valores de columna de las columnas seleccionadas se tratan como cadenas y se les aplica un algoritmo hash mediante una matriz de bits de 31 bits de tamaño. Por tanto, todos los valores de columna se representan con un entero de 32 bits no negativo.

    • CMTch: usa una tabla guardada en la tabla de recuento mínimo de bocetos.

      Con este formato, se usan varias funciones hash independientes con un intervalo más pequeño para mejorar la eficacia de la memoria y reducir la posibilidad de colisiones de hash.

    En general, debe usar la opción Diccionario para conjuntos de datos más pequeños (<1 GB) y usar la opción CMTch para conjuntos de datos más grandes.

  6. Ejecute el experimento.

  7. Cuando haya terminado, haga clic con el botón derecho en la salida del módulo Importar tabla de recuento, seleccione Guardar como transformación y escriba un nombre para la transformación. Al hacerlo, las tablas de recuento combinadas y los parámetros de caracterización que pueda haber aplicado se guardan en un formato que se puede aplicar a un nuevo conjunto de datos.

Ejemplos

Explore ejemplos de caracterización basada en recuentos mediante estos experimentos de ejemplo en el Azure AI Gallery:

Nota:

Todos estos experimentos de la Galería se crearon con la versión anterior y ahora en desuso de la versión Learning con módulos Counts. Al abrir el experimento en Studio (clásico), el experimento se actualiza automáticamente para usar los módulos más recientes.

Entradas esperadas

Nombre Tipo Descripción
Metadatos de recuento Tabla de datos Metadatos de los recuentos
Tabla de recuento Tabla de datos La tabla de recuento
Conjunto de datos con recuento Tabla de datos Conjunto de datos usado para el recuento

Parámetros del módulo

Nombre Tipo Intervalo Opcional Valor predeterminado Descripción
Tipo de recuento CountingType Obligatorio Tipo de recuento

Salidas

Nombre Tipo Descripción
Transformación de recuento Interfaz ITransform Transformación de recuento

Excepciones

Excepción Descripción
Error 0003 Se produce una excepción si una o varias de las entradas son NULL o están vacías.
Error 0018 Se produce una excepción si el conjunto de datos de entrada no es válido.

Para obtener una lista de errores específicos de los módulos de Studio (clásico), consulte Machine Learning códigos de error.

Para obtener una lista de excepciones de API, consulte Machine Learning códigos de error de la API REST.

Consulte también

Aprendizaje con recuentos