Azure Databricks에서 Apache Spark 사용

중급
데이터 엔지니어
Azure Databricks

Azure Databricks는 Apache Spark를 기반으로 하며 데이터 엔지니어와 분석가가 Spark 작업을 실행하여 대규모로 데이터를 변환, 분석 및 시각화할 수 있도록 지원합니다.

학습 목표

이 모듈에서는 다음 방법을 알아봅니다.

  • Apache Spark 아키텍처의 주요 요소를 설명합니다.
  • Spark 클러스터를 만들고 구성합니다.
  • Spark의 사용 사례를 설명합니다.
  • Spark를 사용하여 파일에 저장된 데이터를 처리하고 분석합니다.
  • Spark를 사용하여 데이터를 시각화합니다.

사전 요구 사항

이 모듈을 시작하기 전에 Azure Databricks에 대한 기본 지식이 있어야 합니다. 이 모듈을 시작하기 전에 Azure Databricks 탐색 모듈을 완료하는 것이 좋습니다.