Novità e pianificazione di OneLake in Microsoft Fabric
Importante
I piani di versione descrivono le funzionalità che potrebbero essere state rilasciate o meno. Le sequenze temporali di consegna e le funzionalità proiettate possono cambiare o non essere spedite. Per altre informazioni, vedere Criteri Microsoft.
OneLake è un singolo data lake unificato e logico per l'intera organizzazione. Come OneDrive, OneLake viene fornito automaticamente con ogni tenant di Microsoft Fabric ed è progettato per essere l'unica posizione per tutti i dati di analisi.
Tutti i dati in OneLake funzionano con la governance predefinita, ad esempio la derivazione dei dati, la protezione dei dati, la certificazione, l'integrazione del catalogo e così via, ed è infine sotto il controllo di un amministratore tenant. All'interno di un tenant, le aree di lavoro consentono a diverse parti dell'organizzazione di lavorare in modo indipendente, pur contribuendo allo stesso data lake.
OneLake è aperto a ogni livello. OneLake supporta le stesse API e SDK di ADLS Gen2 per essere compatibili con le applicazioni ADLS Gen2 esistenti e può supportare qualsiasi tipo di file, strutturato o non strutturato.
OneLake mira a offrire il massimo valore possibile da una singola copia di dati. Con i collegamenti a OneLake è possibile unificare i dati tra domini, cloud e account creando un riferimento ai dati archiviati in altri percorsi di file, ad esempio altri percorsi di OneLake o ADLS o S3 senza spostamento o duplicazione dei dati. È anche possibile usare gli stessi dati in più motori analitici perché i motori fabric archiviano tutti i dati tabulari nei formati parquet aperti. Non è più necessario copiare i dati solo per usarli con un altro motore.
Per altre informazioni, vedere la documentazione.
Aree di investimento
Funzionalità | Sequenza temporale di rilascio stimata |
---|---|
Collegamenti a OneLake ai dati locali | Q2 2024 |
Collegamenti di tabella OneLake ai dati di Iceberg | Q3 2024 |
Disponibilità generale dei ruoli di accesso ai dati OneLake | Q4 2024 |
Modello di sicurezza OneLake | Q1 2025 |
Memorizzazione nella cache intelligente per i collegamenti amazon S3 | Spedito (Q4 2023) |
API collegamenti | Spedito (Q1 2024) |
Collegamenti all'archiviazione cloud di Google | Spedito (Q1 2024) |
Collegamenti a OneLake ai dati locali
Sequenza temporale di rilascio stimata: Q2 2024
Tipo di versione: anteprima pubblica
I collegamenti a Microsoft OneLake si espandono per includere origini dati locali e con restrizioni di rete. Con questa funzionalità, è possibile unificare i dati locali e cloud in OneLake.
Durante la creazione di collegamenti a AWS S3, Google Cloud Archiviazione o bucket compatibili con S3, sarà possibile selezionare facoltativamente un gateway dati locale (OPDG) per stabilire la connettività.
Collegamenti di tabella OneLake ai dati di Iceberg
Sequenza temporale di rilascio stimata: Q3 2024
Tipo di versione: anteprima pubblica
Con Microsoft OneLake sarà possibile creare collegamenti di tabella ai dati di Iceberg in altre posizioni e questi dati verranno visualizzati automaticamente con il formato Delta Lake.
OneLake produce automaticamente metadati Delta Lake virtualizzati e lo rende disponibile tramite il collegamento OneLake. Ciò significa che è possibile usare i dati di Iceberg con tutti i carichi di lavoro di Fabric che funzionano con dati formattati Delta Lake.
Disponibilità generale dei ruoli di accesso ai dati OneLake
Sequenza temporale di rilascio stimata: Q4 2024
Tipo di versione: disponibilità generale
I ruoli di accesso ai dati di OneLake si basano sulle funzionalità esistenti del modello di sicurezza di OneLake per aumentare la granularità in base alla quale è possibile applicare la sicurezza all'interno di un elemento di dati di Fabric. Questa funzionalità aggiunge un modello di controllo degli accessi in base al ruolo ereditabile (controllo degli accessi in base al ruolo) che semplifica la gestione degli utenti e delle autorizzazioni per i dati in OneLake. È possibile definire ruoli di sicurezza che concedono l'accesso in lettura a cartelle specifiche in OneLake e assegnarli a utenti o gruppi. Le autorizzazioni di accesso determinano le cartelle visualizzate dagli utenti quando accedono alla visualizzazione lake dei dati, tramite l'esperienza utente, i notebook o le API OneLake di lakehouse.
Modello di sicurezza OneLake
Sequenza temporale di rilascio stimata: Q1 2025
Tipo di versione: anteprima pubblica
La gestione della sicurezza dei dati tra più motori analitici e copie dei dati è complessa. OneLake e Fabric semplificano questa operazione abilitando l'uso di una singola copia dei dati in più motori analitici senza spostamento o duplicazione dei dati. Prendendo ulteriormente il concetto di "copia singola", OneLake sta migliorando la sicurezza con un modello più granulare, consentendo l'accesso a tabelle e cartelle oltre alla sicurezza a livello di riga e colonna. Queste definizioni di sicurezza usano i dati e passano attraverso collegamenti a qualsiasi posizione in cui vengono usati i dati. La sicurezza definita in OneLake viene applicata universalmente indipendentemente dal motore analitico usato per accedere ai dati.
Funzionalità spedite
Memorizzazione nella cache intelligente per i collegamenti amazon S3
Spedito (Q4 2023)
Tipo di versione: anteprima pubblica
La memorizzazione intelligente nella cache per i collegamenti Amazon S3 riduce i costi di uscita e migliora le prestazioni portando i dati più vicini al motore di calcolo. La memorizzazione intelligente nella cache egresserà i dati da S3 una sola volta, memorizzarli nella cache in locale in OneLake per un determinato periodo. In questo modo si elimina la necessità di recuperare dati ripetuti da S3. I dati memorizzati nella cache possono essere riutilizzati tra più utenti, motori di analisi e scenari che ottimizzano il valore di un singolo uscita.
API collegamenti
Spedito (Q1 2024)
Tipo di versione: anteprima pubblica
UN'API REST pubblica per automatizzare la creazione e la gestione degli scenari di scelta rapida.
Collegamenti all'archiviazione cloud di Google
Spedito (Q1 2024)
Tipo di versione: anteprima pubblica
OneLake espanderà il supporto dei collegamenti a Google Cloud Archiviazione, consentendo la virtualizzazione dei dati senza spostarli o duplicarli. Ciò consente l'integrazione dei dati di Google Cloud Archiviazione con servizi Microsoft come ADLS gen2, OneLake, Dataverse e Amazon S3. I dati verranno visualizzati e funzionano come se fossero in OneLake e offrono un semplice data lake in grado di estendersi su cloud.