OneLake, OneDrive per i dati

OneLake è un singolo data lake unificato e logico per l'intera organizzazione. Come OneDrive, OneLake viene fornito automaticamente con ogni tenant di Microsoft Fabric ed è progettato per essere l'unica posizione per tutti i dati di analisi. OneLake offre ai clienti:

  • Un data lake per l'intera organizzazione
  • Una copia dei dati da usare con più motori analitici

Un data lake per l'intera organizzazione

Prima di OneLake, era più facile per i clienti creare più laghi per gruppi di business diversi anziché collaborare su un singolo lago, anche con il sovraccarico aggiuntivo della gestione di più risorse. OneLake si concentra sulla rimozione di queste sfide migliorando la collaborazione. Ogni tenant del cliente ha esattamente un OneLake. Non ci possono mai essere più di uno e se si ha Fabric, non può mai essere zero. Ogni tenant di Fabric effettua automaticamente il provisioning di OneLake, senza risorse aggiuntive da configurare o gestire.

Regolamentato per impostazione predefinita con la proprietà distribuita per la collaborazione

Il concetto di tenant è un vantaggio unico di un servizio SaaS. Conoscere dove inizia e termina l'organizzazione di un cliente fornisce un limite naturale di governance e conformità, che è sotto il controllo di un amministratore tenant. Tutti i dati terreni in OneLake sono regolati per impostazione predefinita. Anche se tutti i dati sono entro i limiti impostati dall'amministratore tenant, è importante che questo amministratore non diventi un gatekeeper centrale che impedisce ad altre parti dell'organizzazione di contribuire a OneLake.

All'interno di un tenant è possibile creare un numero qualsiasi di aree di lavoro. Le aree di lavoro consentono a diverse parti dell'organizzazione di distribuire i criteri di proprietà e di accesso. Ogni area di lavoro fa parte di una capacità associata a un'area specifica e viene fatturata separatamente.

Diagram showing the function and structure of OneLake.

All'interno di un'area di lavoro è possibile creare elementi di dati e accedere a tutti i dati in OneLake tramite elementi di dati. Analogamente a come Office archivia i file di Word, Excel e PowerPoint in OneDrive, Fabric archivia lakehouse, magazzini e altri elementi in OneLake. Gli elementi possono offrire esperienze personalizzate per ogni persona, ad esempio l'esperienza di sviluppo Spark in una lakehouse.

Per altre informazioni su come iniziare a usare OneLake, vedere Creazione di una lakehouse con OneLake.

Apri a ogni livello

OneLake è aperto a ogni livello. OneLake è basato su Azure Data Lake Archiviazione (ADLS) Gen2 e può supportare qualsiasi tipo di file, strutturato o non strutturato. Tutti gli elementi di dati di Fabric, ad esempio data warehouse e lakehouse, archiviano automaticamente i dati in OneLake in formato Delta Parquet. Se un data engineer carica i dati in un lakehouse usando Spark e quindi uno sviluppatore SQL usa T-SQL per caricare i dati in un data warehouse completamente transazionale, entrambi contribuiscono allo stesso data lake. OneLake archivia tutti i dati tabulari in formato Delta Parquet.

OneLake supporta le stesse API e GLI SDK di ADLS Gen2 per essere compatibili con le applicazioni ADLS Gen2 esistenti, tra cui Azure Databricks. È possibile gestire i dati in OneLake come se fosse un account di archiviazione ADLS di grandi dimensioni per l'intera organizzazione. Ogni area di lavoro viene visualizzata come contenitore all'interno di tale account di archiviazione e gli elementi di dati diversi vengono visualizzati come cartelle all'interno di tali contenitori.

Diagram showing how you can access OneLake data with APIs and SDKs.

Per altre informazioni sulle API e gli endpoint, vedere Accesso e API di OneLake. Per esempi di integrazioni di OneLake con Azure, vedere gli articoli Azure Synapse Analytics, Azure Storage Explorer, Azure Databricks e Azure HDInsight .

Esplora file OneLake per Windows

OneLake è OneDrive per i dati. Proprio come OneDrive, è possibile esplorare facilmente i dati di OneLake da Windows usando OneLake File Explorer per Windows. È possibile esplorare tutte le aree di lavoro e gli elementi di dati, caricare, scaricare o modificare file in modo semplice come in Office. OneLake File Explorer semplifica l'uso dei data lake, consentendo anche agli utenti aziendali non tecnici di usarli.

Per altre informazioni, vedere OneLake File Explorer.

Una copia dei dati

OneLake mira a offrire il massimo valore possibile da una singola copia di dati senza spostamento o duplicazione dei dati. Non è più necessario copiare i dati solo per usarli con un altro motore o per suddividere i silo in modo da poter analizzare i dati con i dati di altre origini.

I collegamenti connettono i dati tra domini senza spostamento dei dati

I collegamenti consentono all'organizzazione di condividere facilmente i dati tra utenti e applicazioni senza dover spostare e duplicare le informazioni inutilmente. Quando i team lavorano in modo indipendente in aree di lavoro separate, i collegamenti consentono di combinare i dati in diversi gruppi e domini aziendali in un prodotto dati virtuale in base alle esigenze specifiche di un utente.

Un collegamento è un riferimento ai dati archiviati in altri percorsi di file. Questi percorsi di file possono trovarsi all'interno della stessa area di lavoro o in aree di lavoro diverse, all'interno di OneLake o esterni a OneLake in ADLS, S3 o Dataverse, con altre posizioni di destinazione presto disponibili. Indipendentemente dal percorso, i collegamenti rendono i file e le cartelle come se avrai archiviato in locale.

Diagram showing how shortcuts connect data across workspaces and items.

Per altre informazioni su come usare i tasti di scelta rapida, vedere Collegamenti a OneLake.

Una copia dei dati con più motori analitici

Anche se le applicazioni potrebbero avere una separazione dell'archiviazione e dell'elaborazione, i dati sono spesso ottimizzati per un singolo motore, il che rende difficile riutilizzare gli stessi dati per più applicazioni. Con Fabric, i diversi motori analitici (T-SQL, Spark, Analysis Services e così via) archiviano i dati nel formato Delta Parquet aperto per consentire di usare gli stessi dati tra più motori.

Non è più necessario copiare i dati solo per usarli con un altro motore. Sei sempre in grado di scegliere il motore migliore per il lavoro che stai cercando di fare. Si supponga, ad esempio, di avere un team di tecnici SQL che creano un data warehouse completamente transazionale. Possono usare il motore T-SQL e tutte le potenzialità di T-SQL per creare tabelle, trasformare i dati e caricare i dati nelle tabelle. Se un data scientist vuole usare questi dati, non è più necessario usare un driver Spark/SQL speciale. OneLake archivia tutti i dati in formato Delta Parquet. I data scientist possono usare tutta la potenza del motore Spark e le librerie open source direttamente sui dati.

Gli utenti aziendali possono creare report di Power BI direttamente su OneLake usando la nuova modalità Direct Lake nel motore di Analysis Services. Il motore di Analysis Services è ciò che alimenta i modelli semantici di Power BI e offre sempre due modalità di accesso ai dati: importazione e query diretta. La modalità Direct Lake offre agli utenti tutta la velocità di importazione senza dover copiare i dati, combinando il meglio dell'importazione e della query diretta. Per altre informazioni, vedere Direct Lake.

Diagram showing how multiple items and engines use the same copy of data.

Diagramma di esempio che mostra il caricamento dei dati con Spark, l'esecuzione di query con T-SQL e la visualizzazione dei dati in un report di Power BI.