Tutorial de Lakehouse: Ingesta de datos en lakehouse
En este tutorial, ingerirá tablas dimensionales y de hechos adicionales de Wide World Importers (WWI) en el lago.
Importante
Microsoft Fabric se encuentra actualmente en versión preliminar. Esta información está relacionada con un producto en versión preliminar que puede modificarse considerablemente antes de su lanzamiento. Microsoft no ofrece ninguna garantía, expresa o implícita, con respecto a la información que se ofrece aquí.
Requisitos previos
Ingerir datos
En esta sección, usará la actividad Copiar datos de la canalización de Data Factory para ingerir datos de ejemplo de una cuenta de almacenamiento de Azure en la sección Archivos de la instancia de Lakehouse que creó anteriormente.
Elija el área de trabajo que creó en el control flotante Área de trabajo de la izquierda. En el botón +Nuevo de la página del área de trabajo, seleccione Canalización de datos.
En el cuadro de diálogo Nueva canalización , especifique el nombre como IngestDataFromSourceToLakehouse y seleccione Crear. Se crea y abre una nueva canalización de factoría de datos.
En la canalización de factoría de datos recién creada, seleccione Agregar actividad de canalización para agregar una actividad a la canalización y seleccione Copiar datos. Esto agrega la actividad de copia de datos al lienzo de la canalización.
Seleccione la actividad de copia de datos recién agregada en el lienzo. Muestra las propiedades de actividad en la parte inferior. En la pestaña General , especifique el nombre de la actividad de copia de datos Copia de datos en Lakehouse.
En la pestaña Origen de la actividad de copia de datos seleccionada, seleccione Externo como tipo de almacén de datos y, a continuación, seleccione + Nuevo para crear una nueva conexión al origen de datos.
En este tutorial, todos los datos de ejemplo están disponibles en un contenedor público de Azure Blob Storage. Se conecta a este contenedor para copiar datos de él. En el Asistente para nueva conexión, seleccione Azure Blob Storage y, a continuación, seleccione Continuar.
En la siguiente pantalla del Asistente para nueva conexión , escriba los detalles siguientes y seleccione Crear para crear la conexión al origen de datos.
Propiedad Value Nombre de cuenta o URI https://azuresynapsestorage.blob.core.windows.net/sampledata
Conexión Creación de una nueva conexión Nombre de conexión wwisampledata Tipo de autenticación Anónimas Una vez creada la nueva conexión, vuelva a la pestaña Origen de la actividad de copia de datos y la conexión recién creada está seleccionada de forma predeterminada. Especifique las siguientes propiedades antes de pasar a la configuración de destino.
Propiedad Value Tipo de almacén de datos Externo Conexión wwisampledata Tipo de ruta de acceso de archivo Ruta de acceso del archivo Ruta de acceso del archivo Nombre del contenedor (primer cuadro de texto): sampledata
Nombre del directorio (segundo cuadro de texto): WideWorldImportersDW/parquetRecursively Activada Formato de archivo Binario En la pestaña Destino de la actividad de copia de datos seleccionada, especifique las siguientes propiedades:
Propiedad Value Tipo de almacén de datos Área de trabajo Tipo de almacén de datos del área de trabajo Lakehouse Lakehouse wwilakehouse Carpeta raíz Archivos Ruta de acceso del archivo Nombre del directorio (primer cuadro de texto): wwi-raw-data Formato de archivo Binario Ya ha terminado de configurar la actividad de copia de datos. Seleccione el botón Guardar en Inicio para guardar los cambios realizados y seleccione Ejecutar para ejecutar la canalización y su actividad. También puede programar canalizaciones para actualizar los datos a intervalos definidos para satisfacer los requisitos empresariales. En este tutorial, ejecutaremos la canalización solo una vez haciendo clic en el botón Ejecutar .
Esto desencadena la copia de datos del origen de datos subyacente al lago especificado y puede tardar hasta un minuto en completarse. Puede supervisar la ejecución de la canalización y su actividad en la pestaña Salida , que aparece al hacer clic en cualquier lugar del lienzo. Opcionalmente, puede seleccionar el icono de gafas para ver los detalles de la transferencia de datos.
Una vez copiados los datos, vaya a la vista de elementos del área de trabajo y seleccione wwilakehouse para iniciar el explorador de Lakehouse para esta instancia de Lakehouse seleccionada.
Compruebe que, en la vista del explorador de Lakehouse , se ha creado una nueva carpeta wwi-raw-data y se han copiado allí los datos de todas las tablas.
Pasos siguientes
Pase al siguiente artículo para obtener información sobre