Eventi
31 mar, 23 - 2 apr, 23
Il più grande evento di apprendimento di Fabric, Power BI e SQL. 31 marzo - 2 aprile. Usare il codice FABINSIDER per salvare $400.
Iscriviti oggi stessoQuesto browser non è più supportato.
Esegui l'aggiornamento a Microsoft Edge per sfruttare i vantaggi di funzionalità più recenti, aggiornamenti della sicurezza e supporto tecnico.
Microsoft Fabric Lakehouse è una piattaforma di architettura dei dati per l'archiviazione, la gestione e l'analisi di dati strutturati e non strutturati in un'unica posizione. È una soluzione flessibile e scalabile che consente alle organizzazioni di gestire grandi volumi di dati usando vari strumenti e framework per elaborare e analizzare tali dati. Si integra con altri strumenti di gestione e analisi dei dati per offrire una soluzione completa per l’analisi e l'ingegneria dei dati. Un lakehouse combina la scalabilità di un data lake con le prestazioni e la struttura di un data warehouse, fornendo una piattaforma unificata per l'archiviazione, la gestione e l'analisi dei dati.
Lakehouse crea un livello di servizio generando automaticamente un endpoint di Analisi SQL e un modello semantico predefinito durante la creazione. Questa nuova funzionalità trasparente consente all'utente di lavorare direttamente sulle tabelle Delta nel lake per offrire un'esperienza priva di problemi e ad alte prestazioni, dall'inserimento dati alla creazione di report.
È importante notare che l'endpoint di Analisi SQL è un'esperienza di sola lettura e non supporta la superficie di attacco T-SQL completa di un data warehouse transazionale.
Nota
Solo le tabelle in formato Delta sono disponibili nell'endpoint di Analisi SQL. Non è possibile eseguire query su Parquet, CSV e altri formati usando l'endpoint di Analisi SQL. Se la tabella non viene visualizzata, sarà necessario convertirla in formato Delta.
L'individuazione e la registrazione automatica delle tabelle è una funzionalità di Lakehouse che fornisce un file completamente gestito per l'esperienza delle tabelle per data engineer e data scientist. È possibile eliminare un file nell'area gestita del lakehouse; il sistema lo convalida automaticamente per i formati strutturati supportati e lo registra nel metastore con i metadati necessari, ad esempio nomi colonna, formati, compressione e altro. Attualmente, l'unico formato supportato è la tabella Delta. È quindi possibile fare riferimento al file come tabella e usare la sintassi SparkSQL per interagire con i dati.
Un data engineer può interagire con il lakehouse e i dati all'interno del lakehouse in diversi modi:
Esplora lakehouse: Esplora è la pagina di interazione principale di Lakehouse. È possibile caricare i dati nel lakehouse, esplorare i dati nel lakehouse usando Esplora oggetti, impostare etichette MIP ed eseguire altre operazioni. Altre informazioni sull'esperienza di esplorazione: Spostarsi in Esplora lakehouse di Fabric.
Notebook: i data engineer possono usare il notebook per scrivere codice per la lettura, la trasformazione o la scrittura direttamente in Lakehouse come tabelle e/o cartelle. Per altre informazioni su come usare i notebook per Lakehouse, vedere Esplorare i dati nel lakehouse con un notebook e Come usare un notebook per caricare dati nel lakehouse.
Pipeline: i data engineer possono usare strumenti di integrazione dei dati come lo strumento Copia pipeline per eseguire il pull dei dati da altre origini con destinazione Lakehouse. Altre informazioni su come usare l'attività Copy: Come copiare dati usando l'attività Copy.
Definizioni processo Apache Spark: i data engineer possono sviluppare applicazioni solide e orchestrare l'esecuzione di processi Spark compilati in Java, Scala e Python. Altre informazioni sui processi Spark: Che cos'è una definizione processo Apache Spark?
Flussi di dati Gen 2: i data engineer possono usare flussi di dati Gen 2 per inserire e preparare i dati. Per altre informazioni sul caricamento dei dati usando flussi di dati, vedere Creare il primo flusso di dati per ottenere e trasformare i dati.
Altre informazioni sui diversi modi per caricare dati nel lakehouse: opzioni per ottenere i dati in Fabric Lakehouse.
L'esperienza di multitasking offre una struttura a schede del browser che consente di aprire e passare da un elemento all’altro senza soluzione di continuità, consentendo di gestire il data lakehouse in modo più efficiente che mai. È possibile passare con facilità da una finestra all’altra senza perdere la traccia delle attività. Lakehouse offre un'esperienza di multitasking avanzata per rendere il percorso di gestione dei dati il più efficiente e intuitivo possibile con le funzionalità seguenti:
Mantieni le operazioni in esecuzione: è possibile caricare o eseguire un'operazione di caricamento dati in una scheda e controllare un'altra attività in un’altra scheda. Con il multitasking avanzato, le operazioni in esecuzione non vengono annullate quando si passa da una scheda all'altra. È possibile concentrarsi sul lavoro senza interruzioni.
Mantieni il contesto: gli oggetti selezionati, le tabelle dati o i file rimangono aperti e facilmente disponibili quando si passa da una scheda all'altra. Il contesto del data lakehouse è sempre a portata di mano.
Ricaricamento dell'elenco che non blocca: un meccanismo di ricaricamento che non blocca, per elenchi di tabelle e file. È possibile continuare a lavorare mentre l'elenco viene aggiornato in background. Garantisce di avere i dati più recenti, offrendo al tempo stesso un'esperienza uniforme e senza interruzioni.
Notifiche chiaramente definite: le notifiche di tipo avviso popup specificano da quale lakehouse provengono, rendendo più semplice tenere traccia delle modifiche e degli aggiornamenti nell'ambiente multitasking.
L'accessibilità è sempre stata una priorità assoluta per garantire che Lakehouse sia inclusivo e intuitivo per tutti. Di seguito sono indicate le iniziative chiave implementate finora per supportare l'accessibilità:
Compatibilità con l'utilità per la lettura dello schermo: è possibile lavorare senza soluzione di continuità con le utilità per la lettura dello schermo, per cui gli utenti con problemi visivi possono navigare nella piattaforma e interagire in modo efficace.
Adattare dinamicamicamente il contenuto del testo: progettazione reattiva che si adatta a diverse dimensioni e orientamenti dello schermo. L’adattamento dinamica del testo e del contenuto facilita agli utenti la visualizzazione e l’interazione con l'applicazione in un'ampia gamma di dispositivi.
Spostamento tramite tastiera: spostamento tramite tastiera migliorato per consentire agli utenti di spostarsi nel lakehouse senza basarsi su un mouse, migliorando l'esperienza per coloro che sono affetti da disabilità motorie.
Testo alternativo per le immagini: tutte le immagini ora includono un testo alternativo descrittivo, consentendo alle utilità per la lettura dello schermo di trasmettere informazioni significative.
Campi modulo ed etichette: tutti i campi modulo hanno etichette associate, semplificando l'input dei dati per tutti, inclusi coloro che usano utilità per la lettura dello schermo.
In questa panoramica si ottiene una conoscenza di base di un lakehouse. Passare all'articolo successivo per informazioni su come creare e usare un lakehouse:
Eventi
31 mar, 23 - 2 apr, 23
Il più grande evento di apprendimento di Fabric, Power BI e SQL. 31 marzo - 2 aprile. Usare il codice FABINSIDER per salvare $400.
Iscriviti oggi stessoFormazione
Modulo
Introduzione ai lakehouse in Microsoft Fabric - Training
Introduzione ai lakehouse in Microsoft Fabric
Certificazione
Microsoft Certified: Fabric Data Engineer Associate - Certifications
In qualità di specialista di dati, dovresti avere competenze nei modelli di caricamento dei dati, architetture dei dati e processi di orchestrazione.
Documentazione
Creare una lakehouse in Microsoft Fabric - Microsoft Fabric
Informazioni su come creare una lakehouse dalla home page Ingegneria dei dati, dalla vista Area di lavoro o dalla pagina Crea.
Guida alle decisioni di Microsoft Fabric: scegliere tra warehouse e Lakehouse - Microsoft Fabric
Altre informazioni sulle decisioni relative ai dati nei carichi di lavoro Warehouse o Lakehouse in Microsoft Fabric.
Opzioni per ottenere i dati nel lakehouse - Microsoft Fabric
Informazioni su come caricare i dati in un lakehouse tramite un caricamento di file, librerie Apache Spark nel codice del notebook e lo strumento Copia nelle pipeline.