Usare Delta Lake in Azure Databricks

Intermedio
Data engineer
Azure Databricks

Delta Lake è un'area di archiviazione relazionale open source per Spark che è possibile usare per implementare un'architettura data lakehouse in Azure Databricks.

Obiettivi di apprendimento

Contenuto del modulo:

  • Descrivere le caratteristiche e le funzionalità principali di Delta Lake.
  • Creare e usare tabelle di Delta Lake in Azure Databricks.
  • Creare tabelle del catalogo Spark per i dati di Delta Lake.
  • Usare tabelle di Delta Lake per i dati in streaming.

Prerequisiti

Prima di iniziare questo modulo, è necessario sapere come usare Apache Spark in Azure Databricks. È consigliabile completare il modulo Usare Apache Spark in Azure Databricks prima di questo.