Azure Databricks에서 Delta Lake 사용

중급
데이터 엔지니어
Azure Databricks

Delta Lake는 Azure Databricks에서 데이터 레이크하우스 아키텍처를 구현하는 데 사용할 수 있는 Spark용 오픈 소스 관계형 스토리지 영역입니다.

학습 목표

이 모듈에서는 다음을 수행하는 방법을 알아봅니다.

  • Delta Lake의 주요 특징 및 기능에 대해 설명합니다.
  • Azure Databricks에서 Delta Lake 테이블을 만들고 사용합니다.
  • Delta Lake 데이터에 대한 Spark 카탈로그 테이블을 만듭니다.
  • 스트리밍 데이터에 Delta Lake 테이블을 사용합니다.

사전 요구 사항

이 모듈을 시작하기 전에 Azure Databricks에서 Apache Spark를 사용하는 방법을 알아야 합니다. 이 모듈 이전에 Azure Databricks 모듈에서 Apache Spark 사용을 완료하는 것이 좋습니다.