Get started với Azure Databricks
Để sử dụng Azure Databricks, bạn phải tạo một không gian làm việc Azure Databricks trong đăng ký Azure của mình. Không gian làm việc là triển khai Azure Databricks trong tài khoản dịch vụ đám mây. Nó cung cấp một môi trường thống nhất để làm việc với tài sản Azure Databricks cho một nhóm người dùng cụ thể.
Bạn có thể tạo không gian làm việc Azure Databricks bằng cách:
- Sử dụng giao diện người dùng cổng thông tin Azure.
- Sử dụng mẫu Azure Resource Manager (ARM), Bicep hoặc Terraform.
- Sử dụng lệnh ghép ngắn Azure PowerShell New-AzDatabricksWorkspace.
- Sử dụng không gian làm việc az databricks tạo lệnh giao diện dòng lệnh (CLI) Azure.
Khi tạo không gian làm việc, bạn phải chỉ định:
- Tên không gian làm việc.
- Chọn một khu vực có sẵn. Để biết các khu vực có sẵn, hãy xem các dịch vụ Azure có sẵn theo khu vực.
-
Bậc giá:
- Tiêu chuẩn - Các chức năng cốt lõi của Apache Spark với tích hợp Microsoft Entra ID.
- Premium - Kiểm soát truy cập dựa trên vai trò và các tính năng cấp doanh nghiệp khác.
- Dùng thử - Dùng thử miễn phí 14 ngày của không gian làm việc cấp cao cấp
- Tên Nhóm tài nguyên được quản lý (tùy chọn): một nhóm tài nguyên được tạo tự động trong đó Azure cung cấp và quản lý các tài nguyên cơ sở hạ tầng cần thiết cho không gian làm việc Databricks của bạn.
Nếu bạn quyết định tạo triển khai Azure Databricks bằng Azure CLI, đây sẽ là lệnh az databricks workspace cần nhớ:
az databricks workspace create
--resource-group myresourcegroup \
--name mydatabricksws \
--location westus2 \
--sku standard
Lệnh ghép ngắn PowerShell New-AzDatabricksWorkspace tương đương:
New-AzDatabricksWorkspace -Name mydatabricksws -ResourceGroupName myresourcegroup -Location westus2 -ManagedResourceGroupName databricks-group -Sku standard
Điều hướng giao diện người dùng Azure Databricks Workspace
Sau khi cung cấp không gian làm việc Azure Databricks, bạn có thể sử dụng giao diện người dùng không gian làm việc để làm việc với dữ liệu và tài nguyên điện toán. Giao diện người dùng không gian làm việc là giao diện người dùng dựa trên web, nơi bạn có thể tạo và quản lý tài nguyên không gian làm việc, chẳng hạn như cụm Spark, đồng thời sử dụng sổ ghi chép và truy vấn để làm việc với dữ liệu trong tệp và bảng.
Trang chủ cung cấp các phím tắt đến các tác vụ phổ biến và đối tượng không gian làm việc để giúp bạn bắt đầu. Bạn có thể nhập dữ liệu, tạo sổ ghi chép, tạo truy vấn và đặt cấu hình thử nghiệm AutoML.
Thanh bên hiển thị các danh mục Databricks phổ biến (Không gian làm việc, Gần đây, Danh mục, Công việc & Quy trình, Điện toán, Marketplace). Sau đó, nó chia nhỏ theo khu vực sản phẩm:
- SQL: Trình soạn thảo SQL, Truy vấn, Bảng điều khiển, Genie, Cảnh báo, Lịch sử truy vấn, Kho SQL
- Kỹ thuật dữ liệu: Chạy công việc, nhập dữ liệu
- Machine Learning: Sân chơi, Thử nghiệm, Tính năng, Mô hình, Phân phối
Chọn + Mới để:
- Tạo các đối tượng không gian làm việc như sổ ghi chép, truy vấn, kho lưu trữ, bảng thông tin, cảnh báo, công việc, quy trình, thử nghiệm, mô hình và điểm cuối phân phối.
- Tạo tài nguyên điện toán như cụm, kho SQL và điểm cuối ML.
Sử dụng thanh trên cùng để tìm kiếm các đối tượng không gian làm việc như sổ ghi chép, truy vấn, bảng thông tin, cảnh báo, tệp, thư mục, thư viện, bảng đã đăng ký trong Unity Catalog, công việc và kho lưu trữ ở một nơi duy nhất. Bạn cũng có thể truy cập các đối tượng đã xem gần đây trong thanh tìm kiếm.
Không gian làm việc có sẵn bằng nhiều ngôn ngữ. Để thay đổi ngôn ngữ không gian làm việc, hãy chọn tên người dùng của bạn trên thanh điều hướng trên cùng, chọn Cài đặt và chuyển đến tab Tùy chọn .
Nhận trợ giúp từ Trợ lý Databricks
Databricks Assistant là một công cụ hỗ trợ và lập trình ghép đôi được hỗ trợ bởi AI giúp bạn làm việc hiệu quả hơn trong Databricks bằng cách tạo, giải thích và sửa mã hoặc truy vấn trực tiếp trong sổ ghi chép, bảng điều khiển và tệp.
Nó có thể hỗ trợ nhiều tác vụ, bao gồm xác định và sửa lỗi, tạo trực quan hóa dữ liệu, chẩn đoán các vấn đề công việc và lọc hoặc phân tích dữ liệu bằng lời nhắc ngôn ngữ tự nhiên. Trợ lý có thể hiển thị hướng dẫn có liên quan từ tài liệu Azure Databricks.
Bằng cách sử dụng siêu dữ liệu Unity Catalog, nó cá nhân hóa phản hồi dựa trên tài sản dữ liệu của tổ chức bạn—bảng, cột và mô tả—giúp khám phá và làm việc với dữ liệu của bạn dễ dàng hơn.