Sử dụng Apache Spark trong Azure Databricks

Người có trình độ trung bình
Data Engineer
Azure Databricks

Azure Databricks được xây dựng trên Apache Spark và cho phép các kỹ sư và nhà phân tích dữ liệu chạy công việc Spark để chuyển đổi, phân tích và trực quan hóa dữ liệu ở quy mô lớn.

Mục tiêu học tập

Trong mô-đun này, bạn sẽ tìm hiểu cách:

  • Mô tả các yếu tố chính của kiến trúc Apache Spark.
  • Tạo và cấu hình một cụm Spark.
  • Mô tả các trường hợp sử dụng cho Spark.
  • Sử dụng Spark để xử lý và phân tích dữ liệu được lưu trữ trong tệp.
  • Sử dụng Spark để trực quan hóa dữ liệu.

Điều kiện tiên quyết

Trước khi bắt đầu mô-đun này, bạn nên có kiến thức cơ bản về Azure Databricks. Hãy cân nhắc việc hoàn thành mô-đun Explore Azure Databricks trước mô-đun này.