¿Qué es un almacén de lago en Microsoft Fabric?
Microsoft Fabric Lakehouse es una plataforma de arquitectura de datos para almacenar, administrar y analizar datos estructurados y no estructurados en una sola ubicación. Es una solución flexible y escalable que permite a las organizaciones manejar grandes volúmenes de datos utilizando diversas herramientas y marcos para procesar y analizar esos datos. Se integra con otras herramientas de administración y análisis de datos para proporcionar una solución completa para la ingeniería y el análisis de datos.
Punto de conexión de análisis SQL de Lakehouse
El Lakehouse crea una capa de servicio generando automáticamente un punto de conexión análisis SQL y un modelo semántico predeterminado durante la creación. Esta nueva funcionalidad transparente permite al usuario trabajar directamente sobre las tablas Delta del lago para ofrecer una experiencia sin fricciones y de alto rendimiento, desde la ingesta de datos hasta la elaboración de informes.
Es importante tener en cuenta que el punto de conexión de análisis SQL es una experiencia de solo lectura y no admite el área expuesta completa de T-SQL de un almacenamiento de datos transaccional.
Nota:
Solo las tablas en formato Delta están disponibles en el punto de conexión de análisis SQL. No se pueden consultar parquet, CSV y otros formatos mediante el punto de conexión de análisis SQL. Si no ve la tabla, necesitará convertirla en formato Delta.
Detección y registro automáticos de tablas
La detección y el registro automáticos de tablas es una característica de Lakehouse que proporciona una experiencia de archivo a tabla totalmente administrada para ingenieros de datos y científicos de datos. Puedes soltar un archivo en el área gestionada de Lakehouse y el sistema lo valida automáticamente para los formatos estructurados admitidos, y lo registra en el metastore con los metadatos necesarios, como nombres de columnas, formatos, compresión, etc. (Actualmente, el único formato admitido es la tabla Delta). Luego, puede hacer referencia al archivo como una tabla y usar la sintaxis de SparkSQL para interactuar con los datos.
Interacción con el elemento de Lakehouse
Un ingeniero de datos puede interactuar con el almacén de lago y los datos dentro de él de varias maneras:
El explorador de Lakehouse: el explorador es la página de interacción principal de Lakehouse. Con el explorador de objetos, puedes cargar datos y explorarlos en Lakehouse, establecer etiquetas MIP y mucho más. Más información sobre la experiencia del explorador: Navegación por el explorador de Lakehouse.
Cuadernos: los ingenieros de datos pueden usar el cuaderno para escribir código para leer, transformar y escribir directamente en Lakehouse como tablas o carpetas. Puede obtener más información sobre cómo aprovechar los cuadernos en Lakehouse: Explorar los datos del almacén de lago con un cuaderno y Cómo usar un cuaderno para cargar datos en el almacén de lago.
Canalizaciones: los ingenieros de datos pueden usar herramientas de integración de datos como la herramienta de copia de canalización para extraer datos de otros orígenes y copiarlos en Lakehouse. Obtenga más información sobre cómo usar la actividad de copia: Cómo copiar datos mediante la actividad de copia.
Definiciones de trabajos de Apache Spark: los ingenieros de datos pueden desarrollar aplicaciones sólidas y organizar la ejecución de trabajos de Spark compilados en Java, Scala y Python. Más información sobre los trabajos de Spark: ¿Qué es una definición de trabajo de Apache Spark?
Dataflows Gen 2: Los ingenieros de datos pueden utilizar Dataflows Gen 2 para ingerir y preparar sus datos. Obtenga más información sobre la carga de datos mediante flujos de datos en: Creación del primer flujo de datos para obtener y transformar datos.
Obtenga más información sobre las distintas formas de cargar datos en lakehouse: Opciones para obtener datos en Fabric Lakehouse.
Multitarea con almacén de datos
La experiencia de multitarea proporciona un diseño de pestaña del explorador que le permite abrir y cambiar entre varios elementos sin problemas, lo que le permite administrar su almacén de lago de datos de forma más eficaz que nunca. No más malabarismos entre diferentes ventanas o pérdida del seguimiento de las tareas. Lakehouse proporciona una experiencia de multitarea mejorada para que el recorrido de administración de datos sea lo más eficaz y fácil de usar posible con las siguientes funcionalidades:
Conservar las operaciones en ejecución: puede cargar o ejecutar la operación de carga de datos en una pestaña y comprobar otra tarea en otra pestaña. Con las tareas múltiples mejoradas, las operaciones en ejecución no se cancelan al navegar entre pestañas. Puede centrarse en su trabajo sin interrupciones.
Conservar el contexto: los objetos seleccionados, las tablas de datos o los archivos permanecen abiertos y disponibles fácilmente al cambiar entre pestañas. El contexto de su almacén de lago de datos siempre está a su alcance.
Recarga de lista sin bloqueo: mecanismo de recarga sin bloqueo para la lista de archivos y tablas. Puede seguir trabajando mientras la lista se actualiza en segundo plano. Garantiza que tiene los datos más recientes a la vez que proporciona una experiencia fluida e ininterrumpida.
Notificaciones claramente definidas: las notificaciones del sistema especifican de qué almacén de lago proceden, lo que facilita el seguimiento de los cambios y las actualizaciones en el entorno de varias tareas.
Diseño de almacén de lago accesible
La accesibilidad siempre ha sido una prioridad máxima para garantizar que Lakehouse sea inclusivo y fácil de usar para todos. Estas son las iniciativas clave que hemos implementado hasta ahora para admitir la accesibilidad:
Compatibilidad con lectores de pantalla: puede trabajar sin problemas con lectores de pantalla populares, lo que permite a los usuarios con discapacidades visuales navegar e interactuar con nuestra plataforma de forma eficaz.
Reflujo de texto diseño dinámico que se adapta a diferentes tamaños y orientaciones de pantalla. Reflujo de texto y contenido de forma dinámica, lo que facilita a los usuarios ver e interactuar con nuestra aplicación en una variedad de dispositivos.
Navegación por teclado: se ha mejorado la navegación por el teclado para permitir que los usuarios se muevan a través del almacén de lago sin depender de un mouse, lo que mejora la experiencia de los usuarios con discapacidades motoras.
Texto alternativo para imágenes: todas las imágenes ahora incluyen un texto alternativo descriptivo, lo que permite a los lectores de pantalla transmitir información significativa.
Campos de formulario y etiquetas: todos los campos de formulario tienen etiquetas asociadas, lo que simplifica la entrada de datos para todos los usuarios, incluidos los que usan lectores de pantalla.
Contenido relacionado
En esta información general, obtendrá una comprensión básica de los almacenes de lago. Avanza al siguiente artículo para aprender a crear y utilizar tu propia casa del lago:
- Para empezar a utilizar las casas lago, consulta Crear una casa lago en Microsoft Fabric.