요약
Apache Spark는 데이터 변환 및 빅 데이터 분석에 사용되는 핵심 기술입니다. Azure Databricks의 Spark 지원을 통해 Spark에서 빅 데이터 처리를 대규모 데이터 분석과 결합할 수 있습니다.
이 모듈에서 학습한 내용은 다음과 같습니다.
- Apache Spark 아키텍처의 주요 요소를 설명합니다.
- Spark 클러스터를 만들고 구성합니다.
- Spark의 사용 사례를 설명합니다.
- Spark를 사용하여 파일에 저장된 데이터를 처리하고 분석합니다.
- Spark를 사용하여 데이터를 시각화합니다.