Introduzione

Completato

Linux Foundation Delta Lake è un livello di archiviazione open source per Spark che abilita le funzionalità del database relazionale per i dati in batch e streaming. Usando Delta Lake, è possibile implementare un'architettura di tipo data lakehouse in Spark per consentire la semantica di manipolazione dei dati basata su SQL con supporto per le transazioni e l'imposizione dello schema. Il risultato è un archivio dati analitici che offre molti dei vantaggi di un sistema di database relazionale con la flessibilità dell'archiviazione di file di dati in un data lake.

Contenuto del modulo:

  • Descrivere le caratteristiche e le funzionalità principali di Delta Lake.
  • Creare e usare tabelle di Delta Lake in un pool di Spark di Synapse Analytics.
  • Creare tabelle del catalogo Spark per i dati di Delta Lake.
  • Usare tabelle di Delta Lake per i dati in streaming.
  • Eseguire query sulle tabelle di Delta Lake da un pool SQL di Synapse Analytics.

Nota

La versione di Delta Lake disponibile in un pool di Azure Synapse Analytics dipende dalla versione di Spark specificata nella configurazione del pool. Le informazioni contenute in questo modulo riflettono la versione 1.0 di Delta Lake installata con Spark 3.1.