Compartir a través de


Exportación de datos

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Escribe un conjunto de datos en varias formas de almacenamiento basado en la nube en Azure, como tablas, blobs y bases Azure SQL datos.

Categoría: Entrada y salida de datos

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo Exportar datos en Machine Learning Studio (clásico) para guardar resultados, datos intermedios y datos de trabajo de los experimentos en destinos de almacenamiento en la nube fuera de Machine Learning Studio (clásico).

Este módulo admite exportar o guardar los datos en los siguientes servicios de datos en la nube:

  • Exportar a consulta de Hive: escriba datos en una tabla de Hive en un clúster de Hadoop de HDInsight.

  • Exportar a Azure SQL Database: guarde los datos en Azure SQL Database o en Azure SQL Data Warehouse.

  • Exportar a tabla de Azure: guarde los datos en el servicio Table Storage en Azure. Table Storage es bueno para almacenar grandes cantidades de datos. Proporciona un formato tabular que es escalable, económico y de alta disponibilidad.

  • Exportar a Azure Blob Storage: guarda los datos en el Blob service en Azure. Esta opción es útil para imágenes, texto no estructurado o datos binarios. Los datos de Blob service se pueden compartir públicamente o guardar en almacenes de datos de la aplicación protegida.

Nota:

El módulo de exportación de datos no admite la conexión a la cuenta de Azure Blob Storage si está habilitada la opción "Se requiere transferencia segura".

  • Descargar datos: Para descargar los datos de forma que pueda abrirlos en Excel u otra aplicación, use un módulo como Convertir en CSV o Convertir en TSV para preparar los datos en un formato determinado y, a continuación, descargar los datos.

  • Puede descargar los resultados de cualquier módulo que genera un conjunto de datos haciendo clic con el botón derecho en la salida y seleccionando Descargar conjunto de datos. De forma predeterminada, los datos se exportan en formato CSV.

  • Descargue una definición de módulo o un gráfico de experimentos: Una nueva biblioteca de PowerShell le permite descargar los metadatos completos del experimento o los detalles de un módulo determinado. PowerShell para Machine Learning biblioteca es una versión experimental, pero tiene muchos cmdlets útiles:

    • Get-AmlExperiment enumera todos los experimentos de un área de trabajo.
    • Export-AmlExperimentGraph exporta una definición del experimento completo a un archivo JSON.
    • Download-AmlExperimentNodeOutput permite extraer la información proporcionada en los puertos de salida de cualquier módulo.

Procedimiento para configurar la exportación de datos

  1. Agregue el módulo Exportar datos al experimento en Studio (clásico). Puede encontrar este módulo en la categoría Entrada y salida.

  2. Conectar exportar datos al módulo que contiene los datos que desea exportar.

  3. Haga doble clic en Exportación de datos para abrir el panel Propiedades.

  4. Para Data destination (Destino de los datos), seleccione el tipo de almacenamiento en la nube donde guardará los datos. Si realiza cambios en esta opción, se restablecen todas las demás propiedades. Por tanto, asegúrese de elegir esta opción en primer lugar.

  5. Proporcione un método de autenticación y nombre de cuenta necesarios para acceder a la cuenta de almacenamiento especificada.

    Según el tipo de almacenamiento y si la cuenta está protegida, es posible que tenga que proporcionar el nombre de la cuenta, el tipo de archivo, la clave de acceso o el nombre del contenedor. En el caso de los orígenes que no requieren autenticación, por lo general es suficiente conocer la dirección URL.

    Para obtener ejemplos de cada tipo, vea los temas siguientes:

  6. La opción Usar resultados almacenados en caché permite repetir el experimento sin volver a escribir los mismos resultados cada vez.

    Si anula la selección de esta opción, los resultados se escriben en el almacenamiento cada vez que se ejecuta el experimento, independientemente de si los datos de salida han cambiado.

    Si selecciona esta opción, Exportar datos usa datos almacenados en caché, si está disponible. Los nuevos resultados solo se generan cuando hay un cambio ascendente que afectaría a los resultados.

  7. Ejecute el experimento.

Ejemplos

Para obtener ejemplos de cómo usar el módulo Exportar datos, vea el Azure AI Gallery:

  • Clasificación de texto: este ejemplo usa Exportar datos para guardar los resultados intermedios y, a continuación, usa Importar datos para obtenerlos del almacenamiento para los pasos posteriores del experimento.

  • Retail Forecasting Step 1 of 6 - data preprocessing ( Preprocesamiento de datos: la plantilla de previsión de minoristas muestra una tarea de aprendizaje automático basada en los datos almacenados en Azure SQL Database. Muestra varias técnicas útiles, como crear una base de datos de Azure SQL para el aprendizaje automático, mediante la base de datos Azure SQL para pasar conjuntos de datos entre experimentos en diferentes cuentas, guardando y combinando previsiones.

  • Compilación e implementación de un modelo de aprendizaje automático mediante SQL Server en una máquina virtual de Azure: en este artículo se muestra cómo puede usar una base de datos de SQL Server hospedada en una máquina virtual de Azure como origen para almacenar datos de entrenamiento y las predicciones generadas por el experimento. También se muestra cómo se puede usar la base de datos relacional para la ingeniería de características y la selección de características.

  • Uso de Azure ML con Azure SQL Data Warehouse: en este artículo se muestra cómo puede crear un modelo de aprendizaje automático mediante datos en Azure SQL Data Warehouse.

Notas técnicas

Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.

Detalles de la implementación

  • Este módulo se denominaba anteriormente Escritor. Si tiene un experimento existente que usa el módulo Escritor , el nombre del módulo se cambia a Exportar datos al actualizar el experimento.

  • No todos los módulos generan una salida compatible con destinos de exportación de datos. Por ejemplo, Exportar datos no puede guardar un conjunto de datos que se haya convertido al formato SVMLight. Exportar datos admite estos formatos:

    • Conjunto de datos (formato interno ML Azure)
    • DataTable de .NET
    • CSV con o sin encabezados
    • TSV con o sin encabezados

Problemas conocidos

  • Al seleccionar Tabla de Azure como ubicación para generar los datos, en ocasiones puede haber un error al escribir en la tabla especificada. Cuando esto sucede, es posible que los datos se escriban en un blob en su lugar.

    Si se produce este error y posteriormente no puede leer de la tabla esperada, intente usar una utilidad de almacenamiento de Azure para comprobar los blobs del contenedor especificado en la cuenta de almacenamiento.

  • Actualmente, no se puede guardar un blob en una tabla de Hive especificada. Si necesita escribir resultados intermedios, evite usar una tabla de Hive en HDInsight y, en su lugar, use Blob Storage o Table Storage.

  • Actualmente, si selecciona HDFS como ubicación para guardar los datos de salida, se devuelve este mensaje de error: "Microsoft.Analytics.Exceptions.ErrorMapping+ModuleException".

Entradas esperadas

Nombre Tipo Descripción
Dataset Tabla de datos El conjunto de datos que se desea escribir.

Parámetros del módulo

En esta tabla se enumeran los parámetros que se aplican a todas las opciones exportar datos. Otros parámetros son dinámicos y cambian en función del destino de datos que seleccione.

Nombre Intervalo Tipo Valor predeterminado Descripción
Especifique el destino de los datos Lista DataSourceOrSink Servicio Blob del Almacenamiento de Azure Indique si el destino de datos es un archivo de la Blob service, un archivo de Table service, una base de datos SQL en Azure o una tabla de Hive.
Uso de resultados almacenados en caché TRUE/FALSE Boolean FALSE Seleccione esta opción para evitar volver a escribir los resultados innecesariamente. Si algo cambia ascendentemente en el experimento, Exportar datos siempre ejecutará y escribirá nuevos resultados. Sin embargo, si no ha cambiado nada y ha seleccionado esta opción, Exportar datos no se ejecutará para evitar volver a escribir los mismos resultados.

Excepciones

Excepción Descripción
Error 0057 Se produce una excepción al intentar crear un archivo o blob que ya existe.
Error 0001 Se produce una excepción si no se encuentran una o varias de las columnas especificadas del conjunto de datos.
Error 0027 Se produce una excepción cuando dos objetos tienen que ser del mismo tamaño pero no lo son.
Error 0079 Se produce una excepción si el nombre de contenedor del Almacenamiento de Azure se especifica incorrectamente.
Error 0052 Se produce una excepción si la clave de acceso de almacenamiento para la cuenta de Azure se especifica incorrectamente.
Error 0064 Se produce una excepción si el nombre de cuenta o la clave de acceso de almacenamiento de la cuenta de Azure se especifican incorrectamente.
Error 0071 Se produce una excepción si las credenciales proporcionadas son incorrectas.
Error 0018 Se produce una excepción si el conjunto de datos de entrada no es válido.
Error 0029 Se produce una excepción cuando se pasa un URI no válido.
Error 0003 Se produce una excepción si una o varias de las entradas son nulas o están vacías.

Para obtener una lista de errores específicos de los módulos de Studio (clásico), consulte Machine Learning códigos de error.

Para obtener una lista de excepciones de API, consulte Machine Learning códigos de error de la API REST.

Consulte también

Import Data
Entrada y salida de datos
Transformación de datos
Comparación del Almacenamiento de Tabla de Azure y la Base de datos SQL de Azure
Lista de módulos A-Z