Sử dụng Tia lửa trong sổ tay

Đã hoàn thành

Bạn có thể chạy nhiều loại ứng dụng khác nhau trên Spark, bao gồm mã trong tập lệnh Python hoặc Scala, mã Java được biên soạn dưới dạng Java Archive (JAR) và các ứng dụng khác. Tia lửa thường được sử dụng trong hai loại khối lượng công việc:

  • Các công việc xử lý theo lô hoặc dòng để thu thập, dọn sạch và chuyển đổi dữ liệu - thường chạy như một phần của quy trình tự động.
  • Phiên phân tích tương tác để khám phá, phân tích và trực quan hóa dữ liệu.

Chạy mã Spark trong sổ tay

Azure Databricks bao gồm một giao diện sổ tay tích hợp để làm việc với Spark. Sổ tay cung cấp cách thức trực quan để kết hợp mã với ghi chú Markdown, thường được các nhà khoa học dữ liệu và nhà phân tích dữ liệu sử dụng. Giao diện của trải nghiệm sổ tay tích hợp trong Azure Databricks tương tự như của sổ tay Jupyter - một nền tảng sổ tay nguồn mở phổ biến.

Ảnh chụp màn hình sổ tay trong Azure Databricks.

Sổ ghi chép bao gồm một hoặc nhiều ô, mỗi ô chứa mã hoặc đánh dấu. Các ô mã trong sổ tay có một số tính năng có thể giúp bạn làm việc hiệu quả hơn, bao gồm:

  • Hỗ trợ lỗi và tô sáng cú pháp.
  • Mã tự động hoàn tất.
  • Trực quan hóa dữ liệu tương tác.
  • Khả năng xuất kết quả.

Mẹo

Để biết thêm thông tin về cách làm việc với sổ tay trong Azure Databricks, hãy xem bài viết Notebooks trong tài liệu Azure Databricks.