Introduzione

Completato

Linux Foundation Delta Lake è un livello di archiviazione open source per Spark che abilita le funzionalità del database relazionale per i dati in batch e streaming. Usando Delta Lake, è possibile implementare un'architettura di tipo data lakehouse in Spark per consentire la semantica di manipolazione dei dati basata su SQL con supporto per le transazioni e l'imposizione dello schema. Il risultato è un archivio dati analitici che offre molti dei vantaggi di un sistema di database relazionale con la flessibilità dell'archiviazione di file di dati in un data lake.

Contenuto del modulo:

  • Descrivere le caratteristiche e le funzionalità principali di Delta Lake.
  • Creare e usare tabelle di Delta Lake in Azure Databricks.
  • Creare tabelle del catalogo Spark per i dati di Delta Lake.
  • Usare tabelle di Delta Lake per i dati in streaming.

Nota

La versione di Delta Lake disponibile in un cluster di Azure Databricks dipende dalla versione di Databricks Runtime in uso. Le informazioni contenute in questo modulo riflettono la versione 3.x di Delta Lake installata con Spark 3.5.0 in Databricks Runtime versione 14.3.