Obtención de datos de OneLake

Artículo
02/04/2025

En este artículo, aprenderá a obtener datos de OneLake en una tabla nueva o existente.

Prerrequisitos

Un área de trabajo con una capacidad habilitada para Microsoft Fabric
Un almacén de lago
Una base de datos KQL con permisos de edición

Copia de la ruta de acceso del archivo desde Lakehouse

En el área de trabajo, seleccione el entorno de Lakehouse que contiene el origen de datos que desea usar.
Coloque el cursor sobre el archivo deseado y seleccione el menú Más (...) y, a continuación, seleccione Propiedades.
Importante
- No se admiten rutas de acceso de carpeta.
- No se admiten los caracteres comodín (*).
En URL, seleccione el icono Copiar en el portapapeles y guárdelo en un lugar para recuperarlo en un paso posterior.
Vuelva al área de trabajo y seleccione una base de datos KQL.

Fuente

En la cinta inferior de la base de datos KQL, seleccione Obtener datos.

En la ventana Obtener datos, se selecciona la pestaña Origen.
Seleccione el origen de datos de la lista disponible. En este ejemplo, va a ingerir datos de OneLake.

Configuración

Seleccione una tabla de destino. Si desea ingerir datos en una nueva tabla, seleccione +Nueva tabla y escriba un nombre de tabla.

Nota

Los nombres de tabla pueden tener hasta 1024 caracteres, incluidos espacios, alfanuméricos, guiones y caracteres de subrayado. No se admiten caracteres especiales.
En archivo OneLake, pegue la ruta de acceso del archivo del Lakehouse que copió en Copia de la ruta de acceso del archivo desde Lakehouse.

Nota

Puede agregar hasta 10 elementos de hasta 1 GB de tamaño sin comprimir cada uno.
Seleccione Siguiente.

Inspeccionar

La pestaña Inspeccionar se abre con una vista previa de los datos.

Para completar el proceso de ingesta, seleccione Finalizar.

Opcionalmente:

Seleccione visor de comandos para ver y copiar los comandos automáticos generados a partir de las entradas.
Use la lista desplegable Archivo de definición de esquema para cambiar el archivo del que se deduce el esquema.
Cambie el formato de datos inferido automáticamente seleccionando el formato deseado en la lista desplegable. Para obtener más información, consulte Formatos de datos compatibles con Real-Time Intelligence.
Editar columnas.
Explore las Opciones avanzadas basadas en el tipo de datos.

Editar columnas

Nota

En el caso de formatos tabulares (CSV, TSV, PSV), no se puede asignar una columna dos veces. Para asignar a una columna existente, elimine primero la nueva columna.
No se puede cambiar un tipo de columna existente. Si intenta asignar a una columna con un formato diferente, puede acabar con columnas vacías.

Los cambios que puede realizar en una tabla dependen de los parámetros siguientes:

El tipo de tabla es nuevo o existente
El tipo de mapeo es nuevo o existente

Tipo de tabla	Tipo de mapeo	Ajustes disponibles
Nueva tabla	Nuevo mapeo	Cambio del nombre de columna, cambio del tipo de datos, cambio del origen de datos, la transformaciones de asignación, adición de columna, eliminación de columna
Tabla existente	Nuevo mapeo	Agregar columna (en la que puede cambiar el tipo de datos, cambiar el nombre y actualizar)
Tabla existente	Asignación existente	ninguno

Transformaciones de mapeo

Algunas asignaciones de formato de datos (Parquet, JSON y Avro) admiten transformaciones sencillas al momento de la ingestión. Para aplicar transformaciones de asignación, cree o actualice una columna en la ventana Editar columnas.

Las transformaciones de asignación se pueden realizar en una columna de tipo string o datetime, con un origen con un tipo de datos int o long. Las transformaciones de asignación que se admiten son las siguientes:

DateTimeFromUnixSeconds
DateTimeFromUnixMilliseconds
DateTimeFromUnixMicroseconds
DateTimeFromUnixNanoseconds

Opciones avanzadas basadas en el tipo de datos

Tabular (CSV, TSV, PSV):

Si va a ingerir formatos tabulares en una tabla existente, puede seleccionar Opciones avanzadas>Mantener esquema de tabla. Los datos tabulares no incluyen necesariamente los nombres de columna que se usan para asignar datos de origen a las columnas existentes. Cuando se activa esta opción, el mapeo se realiza por orden, y el esquema de la tabla permanece igual. Si esta opción está desactivada, se crean nuevas columnas para los datos entrantes, independientemente de la estructura de datos.
Para usar la primera fila como nombres de columna, seleccione Avanzado>La primera fila es el encabezado de columna.

JSON:

Para determinar la división de columnas de los datos JSON, seleccione Niveles avanzados anidados>, de 1 a 100.
Si selecciona Opciones avanzadas>Omitir líneas JSON con errores, los datos se ingieren en formato JSON. Si deja esta casilla sin seleccionar, los datos se ingieren en formato multijson.

Resumen

En la ventana Preparación de datos, los tres pasos se marcan con marcas de verificación verdes cuando la ingesta de datos finaliza correctamente. Puede seleccionar una tarjeta para consultar, quitar los datos ingeridos o ver un panel del resumen de la ingesta.

Compartir a través de

Obtención de datos de OneLake

Prerrequisitos

Copia de la ruta de acceso del archivo desde Lakehouse

Fuente

Configuración

Inspeccionar

Editar columnas

Transformaciones de mapeo

Opciones avanzadas basadas en el tipo de datos

Resumen

Comentarios

Recursos adicionales

Compartir a través de

Obtención de datos de OneLake

Prerrequisitos

Copia de la ruta de acceso del archivo desde Lakehouse

Fuente

Configuración

Inspeccionar

Editar columnas

Transformaciones de mapeo

Opciones avanzadas basadas en el tipo de datos

Resumen

Contenido relacionado

Comentarios

Recursos adicionales