Disponibilità di OneLake di Eventhouse
È possibile creare una copia logica dei dati del database KQL in una eventhouse attivando la disponibilità di OneLake. L'attivazione della disponibilità di OneLake consente di eseguire query sui dati nel database KQL in formato Delta Lake tramite altri motori di infrastruttura, ad esempio la modalità Direct Lake in Power BI, Warehouse, Lakehouse, Notebook e altro ancora.
Delta Lake è un formato di tabella data lake unificato che consente di ottenere l'accesso ai dati senza problemi in tutti i motori di calcolo in Microsoft Fabric. Per altre informazioni su Delta Lake, vedere Che cos'è Delta Lake?.
Questo articolo illustra come attivare la disponibilità dei dati del database KQL in OneLake.
Funzionamento
La tabella seguente descrive il comportamento del database e delle tabelle KQL quando si attiva o si disattiva la disponibilità di OneLake.
Attivato | Spento | |
---|---|---|
KQL Database | - Le tabelle esistenti non sono interessate. Le nuove tabelle vengono rese disponibili in OneLake. - I criteri di conservazione dei dati del database KQL vengono applicati anche ai dati in OneLake. I dati rimossi dal database KQL alla fine del periodo di conservazione vengono rimossi anche da OneLake. |
- Le tabelle esistenti non sono interessate. Le nuove tabelle non saranno disponibili in OneLake. |
Tabella nel database KQL | - I nuovi dati vengono resi disponibili in OneLake. - I dati esistenti non vengono riempiti. - I dati non possono essere eliminati, troncati o eliminati. - Non è possibile modificare lo schema della tabella e non è possibile rinominare la tabella. |
- I nuovi dati non vengono resi disponibili in OneLake. - I dati possono essere eliminati, troncati o eliminati. - Lo schema della tabella può essere modificato e la tabella può essere rinominata. - I dati vengono eliminati softmente da OneLake. |
Importante
La visualizzazione dei dati in OneLake può richiedere fino a poche ore. Per altre informazioni, vedere Comportamento adattivo.
Non sono previsti costi di archiviazione aggiuntivi per attivare la disponibilità di OneLake. Per altre informazioni, vedere Utilizzo delle risorse.
Prerequisiti
- Un'area di lavoro con una capacità abilitata per Microsoft Fabric
- Un database KQL con autorizzazioni di modifica e dati
Attivare la disponibilità di OneLake
È possibile attivare la disponibilità di OneLake a livello di database KQL o di tabella.
Per attivare la disponibilità di OneLake, passare alla pagina dei dettagli del database o della tabella KQL.
Accanto a Disponibilità di OneLake nel riquadro Dettagli database selezionare l'icona Modifica (matita).
Attivare la funzionalità attivando o disattivando il pulsante su Attivo, quindi selezionare Fine. Il database viene aggiornato automaticamente.
È stata attivata la disponibilità di OneLake nel database KQL. È ora possibile accedere a tutti i nuovi dati aggiunti al database nel percorso OneLake specificato in formato Delta Lake. È anche possibile scegliere di creare un collegamento OneLake da lakehouse, data warehouse o eseguire query sui dati direttamente tramite la modalità Direct Lake di Power BI.
Comportamento adattivo
Eventhouse offre un meccanismo affidabile che raggruppa in modo intelligente i flussi di dati in ingresso in uno o più file Parquet, strutturati per l'analisi. L'invio in batch dei flussi di dati è importante quando si gestiscono i dati con trucco. La scrittura di molti file Parquet di piccole dimensioni nel lago può risultare inefficiente con costi più elevati e prestazioni scarse.
Il meccanismo adattivo di Eventhouse può ritardare le operazioni di scrittura fino a poche ore se non sono presenti dati sufficienti per creare file Parquet ottimali. Ciò garantisce che i file Parquet siano di dimensioni ottimali e rispettino le procedure consigliate di Delta Lake. Il meccanismo adattivo Eventhouse garantisce che i file Parquet siano primi per l'analisi e bilanciano la necessità di richiedere la disponibilità dei dati con considerazioni sui costi e sulle prestazioni.
È possibile monitorare quanto tempo fa sono stati aggiunti nuovi dati nel lake controllando la latenza dei dati usando il comando .show table mirroring operations.
I risultati vengono misurati dall'ultima volta in cui sono stati aggiunti i dati. Quando la latenza restituisce 00:00:00, tutti i dati nel database KQL sono disponibili in OneLake.
Visualizza file
Quando si attiva la disponibilità di OneLake in una tabella, viene creata una cartella di log delta insieme ai file JSON e Parquet corrispondenti. È possibile visualizzare i file resi disponibili in OneLake e le relative proprietà mentre rimangono all'interno di Intelligence in tempo reale.
Per visualizzare i file, passare il puntatore del mouse su una tabella nel riquadro Explorer e quindi selezionare il menu Altro [...]>Visualizzare i file.
Per visualizzare le proprietà della cartella del log delta o dei singoli file, passare il puntatore del mouse sulla cartella o sul file e quindi selezionare il menu Altro [...]>Proprietà.
Per visualizzare i file nella cartella di log delta:
- Selezionare la cartella _delta_log .
- Selezionare un file per visualizzare i metadati e lo schema della tabella. L'editor aperto è in formato di sola lettura.
Criteri di mirroring dell'accesso
Per impostazione predefinita, quando la disponibilità di OneLake è attivata, viene abilitato un criterio di mirroring. È possibile usare i criteri per monitorare la latenza dei dati o modificarla in tabelle differenziali di partizione.
Nota
Se si disattiva la disponibilità di OneLake, la proprietà del criterio di IsEnabled
mirroring è impostata su false (IsEnabled=false
).
Tabelle delta delle partizioni
È possibile partizionare le tabelle delta per migliorare la velocità delle query. Per informazioni su quando partizionare i file OneLake, vedere Quando partizionare le tabelle. Ogni partizione è rappresentata come colonna separata usando PartitionName elencato nell'elenco Partizioni . Ciò significa che la copia di OneLake contiene più colonne rispetto alla tabella di origine.
Per partizionare le tabelle delta, usare il comando di mirroring dei criteri della tabella alter-merge.
Contenuto correlato
- Per esporre i dati in OneLake, vedere Creare un collegamento in OneLake
- Per creare un collegamento OneLake in Lakehouse, vedere Che cosa sono i collegamenti in lakehouse?
- Per eseguire query sui dati a cui si fa riferimento da OneLake nel database o nella tabella KQL, vedere Creare un collegamento a OneLake nel database KQL
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per