Tutorial de Lakehouse: Ingesta de datos en lakehouse

En este tutorial, ingerirá tablas dimensionales y de hechos adicionales de Wide World Importers (WWI) en el lago.

Importante

Microsoft Fabric se encuentra actualmente en versión preliminar. Esta información está relacionada con un producto en versión preliminar que puede modificarse considerablemente antes de su lanzamiento. Microsoft no ofrece ninguna garantía, expresa o implícita, con respecto a la información que se ofrece aquí.

Requisitos previos

Ingerir datos

En esta sección, usará la actividad Copiar datos de la canalización de Data Factory para ingerir datos de ejemplo de una cuenta de almacenamiento de Azure en la sección Archivos de la instancia de Lakehouse que creó anteriormente.

  1. Elija el área de trabajo que creó en el control flotante Área de trabajo de la izquierda. En el botón +Nuevo de la página del área de trabajo, seleccione Canalización de datos.

    Captura de pantalla que muestra cómo crear una nueva canalización de datos.

  2. En el cuadro de diálogo Nueva canalización , especifique el nombre como IngestDataFromSourceToLakehouse y seleccione Crear. Se crea y abre una nueva canalización de factoría de datos.

  3. En la canalización de factoría de datos recién creada, seleccione Agregar actividad de canalización para agregar una actividad a la canalización y seleccione Copiar datos. Esto agrega la actividad de copia de datos al lienzo de la canalización.

    Captura de pantalla que muestra dónde seleccionar Agregar actividad de canalización y Copiar datos.

  4. Seleccione la actividad de copia de datos recién agregada en el lienzo. Muestra las propiedades de actividad en la parte inferior. En la pestaña General , especifique el nombre de la actividad de copia de datos Copia de datos en Lakehouse.

    Captura de pantalla que muestra dónde agregar el nombre de la actividad de copia en la pestaña General.

  5. En la pestaña Origen de la actividad de copia de datos seleccionada, seleccione Externo como tipo de almacén de datos y, a continuación, seleccione + Nuevo para crear una nueva conexión al origen de datos.

    Captura de pantalla que muestra dónde seleccionar Externo y + Nuevo en la pestaña Origen.

  6. En este tutorial, todos los datos de ejemplo están disponibles en un contenedor público de Azure Blob Storage. Se conecta a este contenedor para copiar datos de él. En el Asistente para nueva conexión, seleccione Azure Blob Storage y, a continuación, seleccione Continuar.

    Captura de pantalla del Asistente para nueva conexión, en la que se muestra dónde seleccionar Azure Blob Storage.

  7. En la siguiente pantalla del Asistente para nueva conexión , escriba los detalles siguientes y seleccione Crear para crear la conexión al origen de datos.

    Propiedad Value
    Nombre de cuenta o URI https://azuresynapsestorage.blob.core.windows.net/sampledata
    Conexión Creación de una nueva conexión
    Nombre de conexión wwisampledata
    Tipo de autenticación Anónimas

    Captura de pantalla de la pantalla Configuración de conexión, en la que se muestra dónde escribir los detalles y seleccionar Crear.

  8. Una vez creada la nueva conexión, vuelva a la pestaña Origen de la actividad de copia de datos y la conexión recién creada está seleccionada de forma predeterminada. Especifique las siguientes propiedades antes de pasar a la configuración de destino.

    Propiedad Value
    Tipo de almacén de datos Externo
    Conexión wwisampledata
    Tipo de ruta de acceso de archivo Ruta de acceso del archivo
    Ruta de acceso del archivo Nombre del contenedor (primer cuadro de texto): sampledata
    Nombre del directorio (segundo cuadro de texto): WideWorldImportersDW/parquet
    Recursively Activada
    Formato de archivo Binario

    Captura de pantalla de la pestaña de origen en la que se muestra dónde especificar los detalles específicos.

  9. En la pestaña Destino de la actividad de copia de datos seleccionada, especifique las siguientes propiedades:

    Propiedad Value
    Tipo de almacén de datos Área de trabajo
    Tipo de almacén de datos del área de trabajo Lakehouse
    Lakehouse wwilakehouse
    Carpeta raíz Archivos
    Ruta de acceso del archivo Nombre del directorio (primer cuadro de texto): wwi-raw-data
    Formato de archivo Binario

    Captura de pantalla de la pestaña Destino, en la que se muestra dónde especificar detalles específicos.

  10. Ya ha terminado de configurar la actividad de copia de datos. Seleccione el botón Guardar en Inicio para guardar los cambios realizados y seleccione Ejecutar para ejecutar la canalización y su actividad. También puede programar canalizaciones para actualizar los datos a intervalos definidos para satisfacer los requisitos empresariales. En este tutorial, ejecutaremos la canalización solo una vez haciendo clic en el botón Ejecutar .

    Esto desencadena la copia de datos del origen de datos subyacente al lago especificado y puede tardar hasta un minuto en completarse. Puede supervisar la ejecución de la canalización y su actividad en la pestaña Salida , que aparece al hacer clic en cualquier lugar del lienzo. Opcionalmente, puede seleccionar el icono de gafas para ver los detalles de la transferencia de datos.

    Captura de pantalla que muestra dónde seleccionar Guardar y ejecutar y dónde encontrar los detalles de ejecución y el icono de gafas en la pestaña Salida.

  11. Una vez copiados los datos, vaya a la vista de elementos del área de trabajo y seleccione wwilakehouse para iniciar el explorador de Lakehouse para esta instancia de Lakehouse seleccionada.

    Captura de pantalla que muestra dónde seleccionar lakehouse para iniciar el explorador de Lakehouse.

  12. Compruebe que, en la vista del explorador de Lakehouse , se ha creado una nueva carpeta wwi-raw-data y se han copiado allí los datos de todas las tablas.

    Captura de pantalla que muestra que los datos de origen se copian en el explorador de Lakehouse.

Pasos siguientes

Pase al siguiente artículo para obtener información sobre