Che cos'è una lakehouse in Microsoft Fabric?

Microsoft Fabric Lakehouse è una piattaforma di architettura dei dati per l'archiviazione, la gestione e l'analisi di dati strutturati e non strutturati in un'unica posizione. Si tratta di una soluzione flessibile e scalabile che consente alle organizzazioni di gestire grandi volumi di dati usando vari strumenti e framework per elaborare e analizzare tali dati. Si integra con altri strumenti di gestione e analisi dei dati per offrire una soluzione completa per l'ingegneria e l'analisi dei dati.

Gif of overall lakehouse experience.

Endpoint di analisi SQL di Lakehouse

Lakehouse crea un livello di servizio generando automaticamente un endpoint di analisi SQL e un modello semantico predefinito durante la creazione. Questa nuova funzionalità di visualizzazione consente all'utente di lavorare direttamente sulle tabelle Delta nel lake per offrire un'esperienza senza problemi e prestazioni ottimale, dall'inserimento dati alla creazione di report.

È importante notare che l'endpoint di analisi SQL è un'esperienza di sola lettura e non supporta la superficie di attacco T-SQL completa di un data warehouse transazionale.

Nota

Solo le tabelle in formato Delta sono disponibili nell'endpoint di analisi SQL. Non è possibile eseguire query su Parquet, CSV e altri formati usando l'endpoint di analisi SQL. Se la tabella non viene visualizzata, sarà necessario convertirla in formato Delta.

Individuazione e registrazione automatica delle tabelle

L'individuazione e la registrazione automatica delle tabelle è una funzionalità di Lakehouse che fornisce un file completamente gestito per l'esperienza di tabella per data engineer e data scientist. È possibile eliminare un file nell'area gestita di Lakehouse e il sistema lo convalida automaticamente per i formati strutturati supportati e lo registra nel metastore con i metadati necessari, ad esempio nomi di colonna, formati, compressione e altro ancora. Attualmente l'unico formato supportato è la tabella Delta. È quindi possibile fare riferimento al file come tabella e usare la sintassi SparkSQL per interagire con i dati.

Interazione con l'elemento Lakehouse

Un data engineer può interagire con il lakehouse e i dati all'interno del lakehouse in diversi modi:

  • Lakehouse explorer: Lo strumento di esplorazione è la pagina di interazione principale di Lakehouse. È possibile caricare i dati in Lakehouse, esplorare i dati in Lakehouse usando Esplora oggetti, impostare etichette MIP e altre cose. Altre informazioni sull'esperienza di esplorazione: Esplorare Fabric Lakehouse Explorer.

  • Notebook: i data engineer possono usare il notebook per scrivere codice per leggere, trasformare e scrivere direttamente in Lakehouse come tabelle e/o cartelle. Per altre informazioni su come usare i notebook per Lakehouse, vedere Esplorare i dati nel lakehouse con un notebook e Come usare un notebook per caricare i dati nel lakehouse.

  • Pipeline: i data engineer possono usare strumenti di integrazione dei dati come lo strumento di copia della pipeline per eseguire il pull dei dati da altre origini e atterrare in Lakehouse. Altre informazioni su come usare l'attività di copia: Come copiare i dati usando l'attività di copia.

  • Definizioni di processi Apache Spark: i data engineer possono sviluppare applicazioni affidabili e orchestrare l'esecuzione di processi Spark compilati in Java, Scala e Python. Altre informazioni sui processi Spark: Che cos'è una definizione di processo Apache Spark?

  • Flussi di dati Gen 2: i data engineer possono usare Dataflows Gen 2 per inserire e preparare i dati. Per altre informazioni sul caricamento dei dati con flussi di dati, vedere Creare il primo flusso di dati per ottenere e trasformare i dati.

Altre informazioni sui diversi modi per caricare i dati nel lakehouse: opzioni per ottenere i dati in Fabric Lakehouse.

Multitasking con lakehouse

L'esperienza multitasking offre una struttura a schede del browser che consente di aprire e passare tra più elementi, consentendo di gestire il data lakehouse in modo più efficiente che mai. Nessun altro gioco tra finestre diverse o perdere traccia delle attività. Lakehouse offre un'esperienza multitasking avanzata per rendere il percorso di gestione dei dati il più efficiente e intuitivo possibile con le funzionalità seguenti:

  • Mantieni le operazioni in esecuzione: è possibile caricare o eseguire un'operazione di caricamento dei dati in una scheda e controllare un'altra attività in una scheda diversa. Con il multi-tasking avanzato, le operazioni in esecuzione non vengono annullate quando si passa da una scheda all'altro. È possibile concentrarsi sul lavoro senza interruzioni.

  • Mantieni il contesto: gli oggetti selezionati, le tabelle dati o i file rimangono aperti e facilmente disponibili quando si passa da una scheda all'altra. Il contesto del data lakehouse è sempre a portata di mano.

  • Ricaricamento dell'elenco non bloccante: meccanismo di ricaricamento non bloccante per i file e gli elenchi di tabelle. È possibile continuare a lavorare mentre l'elenco viene aggiornato in background. Garantisce di avere i dati più recenti, offrendo al tempo stesso un'esperienza senza interruzioni e senza interruzioni.

  • Notifiche chiaramente definite: le notifiche di tipo avviso popup specificano da quale lakehouse provengono, rendendo più semplice tenere traccia delle modifiche e degli aggiornamenti nell'ambiente con più attività.

Progettazione di lakehouse accessibile

L'accessibilità è sempre stata una priorità assoluta per garantire che Lakehouse sia inclusivo e intuitivo per tutti. Ecco le iniziative chiave implementate finora per supportare l'accessibilità:

  • Compatibilità con l'utilità per la lettura dello schermo: è possibile lavorare senza problemi con le utilità per la lettura dello schermo, consentendo agli utenti con problemi visivi di spostarsi e interagire con la piattaforma in modo efficace.

  • Progettazione reattiva del reflow del testo che si adatta a diverse dimensioni e orientamenti dello schermo. Il flusso di testo e contenuto viene eseguito in modo dinamico, rendendo più semplice per gli utenti visualizzare e interagire con l'applicazione in un'ampia gamma di dispositivi.

  • Spostamento tramite tastiera: spostamento tramite tastiera migliorato per consentire agli utenti di spostarsi attraverso il lago senza basarsi su un mouse, migliorando l'esperienza per coloro che hanno disabilità motorie.

  • Testo alternativo per le immagini: tutte le immagini includono ora un testo alternativo descrittivo, consentendo alle utilità per la lettura dello schermo di trasmettere informazioni significative.

  • Campi modulo ed Etichette: tutti i campi modulo hanno etichette associate, semplificando l'input dei dati per tutti, inclusi quelli che usano le utilità per la lettura dello schermo.

In questa panoramica si ottiene una conoscenza di base di una lakehouse. Passare all'articolo successivo per informazioni su come creare e usare il proprio lakehouse: