Che cos'è OneLake?

Microsoft OneLake è un data lake unificato per l'intera organizzazione. Ogni tenant Microsoft Fabric include automaticamente OneLake ed è l'unica posizione per tutti i dati di analisi. Si tratta di un repository centrale in cui è possibile archiviare, gestire e gestire tutti i dati per i carichi di lavoro di analisi e intelligenza artificiale nell'organizzazione.

OneLake è basato su Azure Data Lake Storage e archivia tabelle in formato Delta Parquet o Iceberg, due standard aperti che qualsiasi strumento può leggere. Questo approccio indica che i dati non sono bloccati in formati proprietari.

OneLake fornisce:

Archiviazione unificata dei dati per l'intera organizzazione con governance e sicurezza predefinite
Una copia dei dati da usare con più motori analitici senza duplicazione
Connettività flessibile tramite Esplora file, API ADLS Gen2 e integrazioni del servizio Azure
Protezione e monitoraggio dei dati con ridondanza predefinita, ripristino di emergenza e diagnostica di accesso

Archiviazione unificata dei dati

Prima di OneLake, le organizzazioni spesso crearono più laghi per diversi gruppi aziendali, con un sovraccarico aggiuntivo per la gestione di più risorse. Questo approccio siloed rendeva difficile collaborare tra team, rallentare i progetti di dati e aumentare il rischio di duplicazione.

OneLake risolve queste sfide offrendo un punto di accesso ai dati centrale per l'intera organizzazione. Ogni tenant Fabric dispone di una singola istanza di OneLake. Non è possibile eliminare OneLake o creare più OneLake e non è disponibile alcuna infrastruttura di cui eseguire il provisioning o la gestione. I reparti, i team e i progetti possono archiviare o connettersi ai dati in questo lake unificato e organizzarli usando domini Fabric, sottodomini e aree di lavoro, ognuno con il proprio amministratore. Questo modello mantiene la proprietà dei dati e abilita la governance federata, consentendo comunque agli utenti autorizzati di individuare e usare i dati senza attriti.

Gestito centralmente con la proprietà distribuita

I dati di Fabric sono presenti nella seguente gerarchia ai fini dell'organizzazione e della governance:

Tenant: i criteri a livello di tenant proteggono automaticamente tutti i dati inseriti in OneLake per la sicurezza, la conformità e la gestione dei dati.
Area di lavoro: è possibile creare un numero qualsiasi di aree di lavoro nel tenant per organizzare i dati. Le aree di lavoro consentono a diverse parti dell'organizzazione di distribuire i criteri di titolarità e di accesso. Ogni area di lavoro fa parte di una capacità associata a un'area specifica e fatturata separatamente.
Elementi dati: le aree di lavoro contengono elementi dati come lakehouse, warehouse, eventhouse e database KQL. Ogni tipo di elemento è progettato per carichi di lavoro specifici, come l'analisi basata su Spark, le query T-SQL, lo streaming in tempo reale e altro ancora.

Per altre informazioni, vedere Aree di lavoro.

Scoprire e gestire con il catalogo OneLake

Il catalogo OneLake è l'unica posizione in cui i professionisti dei dati e gli utenti aziendali possono individuare, gestire e gestire i dati di cui sono proprietari e possono accedere a OneLake.

Gli utenti possono filtrare in base a dominio, area di lavoro, tipo di elemento, approvazioni e altro ancora per individuare esattamente ciò di cui hanno bisogno, con ogni elemento di dati arricchito da metadati come descrizioni, proprietari, schema, derivazione e metriche di utilizzo.

I proprietari dei dati possono ottenere informazioni dettagliate e azioni consigliate per migliorare la qualità e la conformità dei dati, inclusa la visibilità sulla copertura delle etichette di riservatezza, l'assegnazione di tag, l'approvazione e la posizione dei dati.

Per altre informazioni, vedere Catalogo di OneLake.

Security

Il modello di sicurezza di OneLake consente di condividere i dati su larga scala senza esporre informazioni riservate. Usando i ruoli di sicurezza di OneLake, è possibile definire autorizzazioni granulari per gli elementi di dati, fino a cartelle, tabelle o persino righe e colonne specifiche. Ad esempio, è possibile condividere un set di dati di vendita con un team, ma limitare l'accesso Cost alla colonna oppure consentire a un partner di visualizzare solo le righe in cui Region = "US". OneLake archivia questi ruoli e li applica automaticamente in tutte le esperienze di analisi. Pertanto, se un utente ha accesso solo a una parte di un set di dati, tale regola si applica indipendentemente dal fatto che esegua una query tramite SQL, esegua un notebook Spark o visualizzi un report Power BI. OneLake garantisce che vedano solo ciò che sono autorizzati a vedere.

Questo approccio unificato alla sicurezza significa che gli utenti non devono mantenere autorizzazioni separate tra motori diversi. Significa anche che i proprietari di dati originali mantengono sempre il controllo su chi può accedere all'origine dati, anche se i dati vengono passati a una lakehouse o a un'area di lavoro di proprietà di un altro utente.

È possibile applicare etichette di riservatezza agli elementi OneLake esattamente come si farebbe con un documento e tali etichette applicano restrizioni di crittografia o di accesso anche se i dati vengono esportati in Excel o in un altro strumento. Analogamente, i criteri di prevenzione della perdita dei dati (DLP) possono rilevare i caricamenti o i download di dati sensibili da OneLake e impedire o inviare avvisi su potenziali perdite di dati.

Per altre informazioni, vedere Introduzione alla protezione dei dati in OneLake.

Una copia dei dati

Tutti i motori di analisi Fabric funzionano con i dati direttamente in OneLake. Non è necessario copiare i dati per usarli con un altro motore o analizzare i dati da più origini.

Scorciatoie

Un collegamento è un riferimento ai dati archiviati in altre posizioni di file. Questi percorsi di file possono trovarsi all'interno della stessa area di lavoro, in un'area di lavoro diversa in OneLake o esterna a OneLake. È possibile usare le scorciatoie per OneLake, Azure Data Lake Storage, Archiviazione BLOB di Azure, Amazon S3 e origini compatibili con S3, origini compatibili con Iceberg, Microsoft Dataverse, origini locali e altro ancora. Indipendentemente dalla posizione, i collegamenti fanno sembrare che i file e le cartelle siano stati archiviati in locale.

I collegamenti consentono all'organizzazione di unificare i dati tra cloud e domini senza copiarli. Teams può lavorare in modo indipendente in aree di lavoro separate e usare i tasti di scelta rapida per condividere i dati tra loro anziché duplicarli. Ad esempio, un team può creare un collegamento a un set di dati nell'area di lavoro di un altro team o a un bucket S3 esterno e quindi combinare i dati con i propri in OneLake. Il collegamento punta all'origine, quindi quando i dati di origine vengono aggiornati, le modifiche sono immediatamente visibili tramite OneLake. In questo modo, è possibile creare prodotti virtuali o visualizzazioni che estraggono dati da più gruppi aziendali per soddisfare esigenze specifiche, senza spostare o duplicare i dati. Usando le trasformazioni rapide, è anche possibile applicare modifiche automatiche ai dati, ad esempio la conversione del formato dei dati o la rimozione di informazioni personali personali.

Per ulteriori informazioni su come utilizzare i collegamenti rapidi, consulta Collegamenti a OneLake.

Mirroring

Il mirroring in Fabric è una soluzione a bassa latenza a basso costo che replica continuamente i dati da vari sistemi in OneLake. È possibile connettersi in modo sicuro a un'origine dati esterna e eseguire automaticamente il mirroring (copia) di tabelle o database selezionati nel formato aperto di OneLake, mantenendoli sincronizzati quasi in tempo reale. I dati con mirroring vengono archiviati in formato Delta Parquet in OneLake e sono quindi immediatamente pronti per essere analizzati da qualsiasi motore di Fabric.

Il mirroring supporta origini come database SQL di Azure, Azure Cosmos DB, Database di Azure per PostgreSQL, Azure Databricks (catalogo Unity), Snowflake e altro ancora. Le modifiche nell'origine dati vengono propagate continuamente, quindi la copia di OneLake rimane aggiornata senza processi ETL manuali. È possibile eseguire report di analisi, intelligenza artificiale o Power BI su dati aggiornati senza eseguire direttamente query sull'origine di produzione.

Per altre informazioni, vedere Che cos'è il mirroring in Fabric?

Collaborare su più motori di analisi

I motori analitici di Fabric (T-SQL, Apache Spark, Analysis Services e altri) archiviano tutti i dati in OneLake nel formato Delta Parquet aperto. Questa standardizzazione consente di usare gli stessi dati tra più motori. Non è necessario copiare i dati solo per usarli con un altro motore o sentirsi bloccati con l'uso di un motore specifico perché questo è il punto in cui si trovano i dati.

Ad esempio, un team di ingegneri SQL crea un data warehouse completamente transazionale. Usano il motore T-SQL per creare tabelle, trasformare i dati e caricare i dati nelle tabelle. Se un data scientist vuole usare questi dati, può collegare un notebook Spark a OneLake e leggere direttamente tali tabelle. Poiché OneLake archivia le tabelle in formato Delta, Spark può caricarle senza connettori speciali o esportazioni di dati. Sia le query SQL che i processi Spark operano su una copia dei dati in OneLake.

Inoltre, gli utenti aziendali possono creare report Power BI su OneLake usando la modalità Direct Lake nel motore di Analysis Services. La modalità Direct Lake è una modalità di accesso ai dati che carica e aggiorna rapidamente grandi volumi di dati senza creare una copia. Per altre informazioni, vedere Panoramica di Direct Lake.

Interoperabilità in formato tabella aperta

OneLake supporta sia i formati di tabella Delta Lake che Apache Iceberg tramite la virtualizzazione dei metadati. Questa funzionalità genera automaticamente metadati virtuali in modo che le tabelle Iceberg possano essere lette come tabelle Delta Lake tra carichi di lavoro Fabric e le tabelle Delta Lake possono essere lette da lettori iceberg esterni. È possibile scrivere tabelle Iceberg direttamente in OneLake o creare collegamenti alle tabelle Iceberg archiviate esternamente e OneLake le rende disponibili per tutti i motori Fabric senza conversione manuale. Analogamente, è possibile accedere a qualsiasi tabella Delta Lake in OneLake tramite servizi compatibili con Iceberg, ad esempio Snowflake.

Per maggiori informazioni, consulta Use Iceberg tables with OneLake.

Connettersi a OneLake

È possibile accedere ai dati di OneLake dal portale di Fabric, Windows, dagli strumenti di Azure esistenti o da qualsiasi applicazione che supporta le API DI ADLS Gen2.

Esplora file di OneLake per Windows

È possibile esplorare i dati di OneLake da Windows usando OneLake File Explorer per Windows. È possibile esplorare tutte le aree di lavoro e gli elementi di dati, caricare, scaricare o modificare file in modo semplice come in Office. OneLake File Explorer semplifica l'uso dei data lake, quindi anche gli utenti aziendali non tecnici possono usarli.

Per altre informazioni, vedere OneLake File Explorer.

API e SDK di ADLS Gen2

OneLake supporta le API e gli SDK di Azure Data Lake Storage Gen2 (ADLS), in modo da poter usare applicazioni ADLS Gen2 esistenti. Ogni area di lavoro viene visualizzata come contenitore e gli elementi di dati vengono visualizzati come cartelle all'interno di tali contenitori. Per altre informazioni, vedere Accesso a OneLake e API.

Poiché OneLake è compatibile con le applicazioni ADLS Gen2, è possibile connettersi a OneLake dai servizi di Azure. Per esempio:

Protezione e monitoraggio dei dati

OneLake include funzionalità predefinite per proteggere i dati e offrire visibilità su come vengono usati.

Ripristino di emergenza e protezione dei dati

OneLake protegge automaticamente i tuoi dati con ridondanza integrata. Nelle regioni che supportano le zone di disponibilità, OneLake usa l'archiviazione con ridondanza della zona (ZRS) per replicare i dati tra più data center. In altre aree usa l'archiviazione con ridondanza locale. Per una protezione aggiuntiva dalle interruzioni a livello di area, è possibile abilitare la continuità aziendale e il ripristino di emergenza (BCDR) in una capacità per replicare geograficamente i dati in un'area di Azure abbinata. OneLake supporta anche l'eliminazione temporanea, che conserva i file eliminati per sette giorni, in modo da poter eseguire il ripristino da eliminazioni accidentali.

Per altre informazioni, vedere Ripristino di emergenza e protezione dei dati per OneLake.

Diagnostica

La diagnostica di OneLake offre visibilità sulla modalità di accesso ai dati e sull'uso nell'ambiente di Fabric. Quando si abilita la diagnostica a livello di spazio di lavoro, gli eventi di accesso ai dati vengono inviati sotto forma di log a un lakehouse. È possibile tenere traccia di chi ha eseguito l'accesso ai dati, quando e come. Questa registrazione illustra le azioni degli utenti nell'interfaccia utente Fabric, l'accesso a livello di codice tramite API e motori di analisi e l'accesso tra aree di lavoro tramite collegamenti.

Per altre informazioni, vedere Diagnostica di OneLake.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-06-24