Quản lý dữ liệu bằng Delta Lake
Người có trình độ trung bình
Data Analyst
Azure Databricks
Delta Lake là giải pháp quản lý dữ liệu trong Azure Databricks cung cấp các tính năng bao gồm giao dịch ACID, thực thi sơ đồ và du hành thời gian đảm bảo tính nhất quán, tính toàn vẹn và khả năng lập phiên bản dữ liệu.
Mục tiêu học tập
Trong mô-đun này, bạn sẽ học được:
- Delta Lake là gì
- Làm thế nào để quản lý giao dịch ACID bằng cách sử dụng Delta Lake
- Cách sử dụng lập phiên bản sơ đồ và du hành thời gian trong Delta Lake
- Cách duy trì tính toàn vẹn dữ liệu với Delta Lake
Điều kiện tiên quyết
Trước khi bắt đầu mô-đun này, bạn nên biết cách sử dụng Apache Spark trong Azure Databricks. Hãy cân nhắc việc hoàn Sử dụng Apache Spark trong Azure Databricks mô-đun trước mô-đun này.