Mapa de datos en Azure Synapse Analytics

¿Qué es la herramienta Mapa de datos?

La herramienta Mapa de datos es un proceso guiado para ayudar a los usuarios a crear asignaciones de extracción, transformación y carga de datos y flujos de datos de asignación desde sus datos de origen a tablas de base de datos de lago de Synapse sin escribir código. El inicio de este proceso es que el usuario elige las tablas de destino en las bases de datos de lago de Synapse y, después, asigna sus datos de origen a estas tablas.

Para obtener más información sobre las bases de datos de lago de Synapse, consulte la introducción a las plantillas de base de datos de Azure Synapse: Azure Synapse Analytics | Microsoft Docs

Mapa de datos proporciona una experiencia guiada en la que el usuario puede generar un flujo de datos de asignación sin necesidad de empezar con un lienzo en blanco. Después, puede generar rápidamente un flujo de datos de asignación escalable que se puede ejecutar en las canalizaciones de Synapse.

Introducción

La herramienta Mapa de datos se inicia desde la experiencia de base de datos de lago de Synapse. Ahí puede seleccionar la herramienta Mapa de datos para comenzar el proceso.

Captura de pantalla en la que se muestra cómo abrir Mapa de datos.

Mapa de datos necesita proceso disponible para ayudar a los usuarios a obtener una vista previa de los datos y a leer el esquema de sus archivos de origen. Después de usar Mapa de datos por primera vez en una sesión, tendrá que preparar un clúster. Captura de pantalla en la que se muestran los clústeres de depuración.

Para empezar, elija el origen de datos que desea asignar a las tablas de la base de datos de lago. Los orígenes de datos admitidos actualmente son las bases de datos de lago de Azure Data Lake Storage Gen 2 y Synapse. Captura de pantalla en la que se muestran los orígenes.

Opciones de tipo de archivo

Al elegir un almacén de archivos como Azure Data Lake Storage Gen 2, se admiten los siguientes tipos de archivo:

  • Common Data Model
  • Texto delimitado
  • Parquet

Creación de una asignación de datos

Configure la asignación de datos con el tipo de origen seleccionado. Captura de pantalla en la que se muestran los valores de configuración del archivo de mapa de datos.

Nota

Puede elegir una carpeta o un único archivo. Si elige una carpeta, podrá asignar varios archivos a las tablas de base de datos del lago. Si elige una carpeta, después de seleccionar Continuar, también se le pedirá que incluya solo archivos específicos, si quiere.

Asigne un nombre a la asignación de datos y seleccione el destino de la base de datos de lago de Synapse. Captura de pantalla en la que se muestran la nomenclatura y el destino.

Asignación de origen a destino

Elija una tabla de origen principal para asignarla a la tabla de destino de la base de datos de lago de Synapse. Captura de pantalla en la que se muestran las reglas de Mapa de datos.

Asignación nueva

Use el botón Nueva asignación para agregar un método de asignación para crear una asignación o transformación.

Origen adicional

Use el botón Origen adicional para unirse y agregar otro origen a la asignación.

Vista previa de los datos

La pestaña Vista previa de los datos proporciona una instantánea interactiva de los datos de cada transformación. Para más información, consulte Vista previa de los datos en modo de depuración.

Métodos de asignación

Estos son los métodos de asignación que se admiten:

Creación de una canalización

Una vez que haya terminado con las transformaciones de Mapa de datos, seleccione el botón Crear canalización para generar un flujo de datos de asignación y una canalización para depurar y ejecutar la transformación.