Sử dụng Apache Spark trong Azure Databricks

Mô-đun
9 Đơn vị

Người có trình độ trung bình

Data Engineer

Azure Databricks

Azure Databricks được xây dựng trên Apache Spark và cho phép các kỹ sư và nhà phân tích dữ liệu chạy công việc Spark để chuyển đổi, phân tích và trực quan hóa dữ liệu ở quy mô lớn.

Mục tiêu học tập

Trong mô-đun này, bạn sẽ tìm hiểu cách:

Mô tả các yếu tố chính của kiến trúc Apache Spark.
Tạo và cấu hình một cụm Spark.
Mô tả các trường hợp sử dụng cho Spark.
Sử dụng Spark để xử lý và phân tích dữ liệu được lưu trữ trong tệp.
Sử dụng Spark để trực quan hóa dữ liệu.

Điều kiện tiên quyết

Trước khi bắt đầu mô-đun này, bạn nên có kiến thức cơ bản về Azure Databricks. Hãy cân nhắc việc hoàn thành mô-đun Explore Azure Databricks trước mô-đun này.

Giới thiệu min
Tìm hiểu Spark min
Tạo cụm Tia lửa min
Sử dụng Tia lửa trong sổ tay min
Sử dụng Spark để làm việc với tệp dữ liệu min
Trực quan hóa dữ liệu min
Bài tập - Sử dụng Spark trong Azure Databricks min
Bài đánh giá mô-đun min
Tóm tắt min

Bắt đầu