Importar una tabla de recuento
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
Importa una tabla de recuentos creada previamente
Categoría: Learning recuentos
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Información general sobre el módulo
En este artículo se describe cómo usar el módulo Importar tabla de recuento en Machine Learning Studio (clásico).
El propósito del módulo Importar tabla de recuento es permitir a los clientes que crearon una tabla de estadísticas basadas en recuentos con una versión anterior de Machine Learning actualizar su experimento. Este módulo combina las tablas de recuento existentes con nuevos datos.
Para obtener información general sobre las tablas de recuento y cómo se usan para crear características, vea Learning con recuentos.
Importante
Este módulo se proporciona únicamente por compatibilidad con versiones anteriores con experimentos que usan la tabla de recuento de compilación en desuso y los módulos de caracterizadores de recuento en desuso. Se recomienda actualizar el experimento para usar los módulos más recientes para aprovechar las nuevas características.
Para todos los experimentos nuevos, se recomienda usar los siguientes módulos:
- Crear una transformación de recuento
- Modificar los parámetros de la tabla de recuento
- Combinar la transformación de recuento
Cómo configurar la tabla de recuento de importación
En Machine Learning Studio (clásico), abra un experimento que contenga una tabla de recuento creada con el módulo de tabla de recuento de compilación en desuso.
Agregue el módulo Importar tabla de recuento al experimento.
Conectar las dos salidas del módulo Tabla de recuento de compilación (en desuso) a los puertos de entrada correspondientes de la tabla De recuento de importación.
Si tiene otro conjunto de datos de recuentos que desea combinar con la tabla de recuentos importada, conéctelo a la entrada situada más a la derecha para el módulo Importar tabla de recuento .
Use la opción Counting type ( Tipo de recuento) para especificar dónde y cómo se almacena la tabla count:
Conjunto de datos: los datos usados para generar recuentos se guardan como un conjunto de datos en Machine Learning Studio (clásico).
Blob: los datos que se usan para crear recuentos se almacenan como blob en bloques Windows Azure Storage.
MapReduce: los datos usados para generar recuentos se almacenan como un blob en Windows Azure Storage.
Esta opción suele ser la preferida para conjuntos de datos muy grandes. Para acceder a los recuentos, debe activar el clúster de HDInsight. Se MapReduce trabajo para realizar el recuento. Ambas actividades pueden incurrir en costos de almacenamiento y proceso.
Para más información, consulte HDInsight en Azure.
Después de especificar el modo de almacenamiento de datos, es posible que tenga que proporcionar información de conexión adicional para los datos, incluso si anteriormente usó un módulo Importar datos en el experimento para acceder a los datos. Esto se debe a que el módulo Count Featurizer (en desuso) accede al almacenamiento de datos por separado para leer los datos y compilar las tablas necesarias.
Use la opción Count table type ( Tipo de tabla count) para especificar el formato y el modo de almacenamiento de la tabla que se usa para almacenar recuentos.
Diccionario: usa una tabla de recuento de diccionarios.
Todos los valores de columna de las columnas seleccionadas se tratan como cadenas y se les aplica un algoritmo hash mediante una matriz de bits de 31 bits de tamaño. Por tanto, todos los valores de columna se representan con un entero de 32 bits no negativo.
CMTch: usa una tabla guardada en la tabla de recuento mínimo de bocetos.
Con este formato, se usan varias funciones hash independientes con un intervalo más pequeño para mejorar la eficacia de la memoria y reducir la posibilidad de colisiones de hash.
En general, debe usar la opción Diccionario para conjuntos de datos más pequeños (<1 GB) y usar la opción CMTch para conjuntos de datos más grandes.
Ejecute el experimento.
Cuando haya terminado, haga clic con el botón derecho en la salida del módulo Importar tabla de recuento, seleccione Guardar como transformación y escriba un nombre para la transformación. Al hacerlo, las tablas de recuento combinadas y los parámetros de caracterización que pueda haber aplicado se guardan en un formato que se puede aplicar a un nuevo conjunto de datos.
Ejemplos
Explore ejemplos de caracterización basada en recuentos mediante estos experimentos de ejemplo en el Azure AI Gallery:
Predicción de retraso de vuelos: muestra cómo la caracterización basada en recuentos puede ser útil en un conjunto de datos muy grande.
Learning con recuentos: clasificación multiclase con datos de taxis de Nueva York: muestra el uso de características basadas en recuentos en una tarea de predicción multiclase.
Learning con recuentos: clasificación binaria con datos de taxis de Nueva York: usa características basadas en recuentos en una tarea de clasificación binaria.
Nota:
Todos estos experimentos de la Galería se crearon con la versión anterior y ahora en desuso de la versión Learning con módulos Counts. Al abrir el experimento en Studio (clásico), el experimento se actualiza automáticamente para usar los módulos más recientes.
Entradas esperadas
Nombre | Tipo | Descripción |
---|---|---|
Metadatos de recuento | Tabla de datos | Metadatos de los recuentos |
Tabla de recuento | Tabla de datos | La tabla de recuento |
Conjunto de datos con recuento | Tabla de datos | Conjunto de datos usado para el recuento |
Parámetros del módulo
Nombre | Tipo | Intervalo | Opcional | Valor predeterminado | Descripción |
---|---|---|---|---|---|
Tipo de recuento | CountingType | Obligatorio | Tipo de recuento |
Salidas
Nombre | Tipo | Descripción |
---|---|---|
Transformación de recuento | Interfaz ITransform | Transformación de recuento |
Excepciones
Excepción | Descripción |
---|---|
Error 0003 | Se produce una excepción si una o varias de las entradas son NULL o están vacías. |
Error 0018 | Se produce una excepción si el conjunto de datos de entrada no es válido. |
Para obtener una lista de errores específicos de los módulos de Studio (clásico), consulte Machine Learning códigos de error.
Para obtener una lista de excepciones de API, consulte Machine Learning códigos de error de la API REST.