Khám phá Python SDK

Đã hoàn thành

Quan trọng

Hiện tại, có hai phiên bản của Python SDK: phiên bản 1 (v1) và phiên bản 2 (v2). Đối với bất kỳ dự án mới nào, bạn nên sử dụng v2 và do đó, dung trong đơn vị này chỉ bao gồm v2. Tìm hiểu thêm về quyết định giữa v1 và v2.

Các nhà khoa học dữ liệu có thể sử dụng Azure Machine Learning để đào tạo, theo dõi và quản lý các mô hình máy học. Là nhà khoa học dữ liệu, chủ yếu bạn sẽ làm việc với các tài sản trong không gian làm việc Azure Machine Learning cho khối lượng công việc học máy của mình.

Như hầu hết các nhà khoa học dữ liệu đã quen thuộc với Python, Azure Machine Learning cung cấp một bộ phát triển phần mềm (SDK) để bạn có thể tương tác với không gian làm việc bằng cách sử dụng Python.

Python SDK cho Azure Machine Learning là một công cụ lý tưởng cho các nhà khoa học dữ liệu có thể được sử dụng trong bất kỳ môi trường Python nào. Cho dù bạn thường làm việc với sổ tay Jupyter, Visual Studio Code, bạn có thể cài đặt Python SDK và kết nối với không gian làm việc.

Cài đặt Python SDK

Để cài đặt Python SDK trong môi trường Python của bạn, bạn cần Python 3.7 trở lên. Bạn có thể cài đặt gói với pip:

pip install azure-ai-ml

Ghi

Khi làm việc với sổ tay trong Azure Machine Learning studio, Python SDK mới đã được cài đặt khi sử dụng Python 3.10 trở lên. Bạn có thể sử dụng Python SDK v2 với các phiên bản Python cũ hơn, nhưng bạn sẽ phải cài đặt nó trước tiên.

Kết nối với không gian làm việc

Sau khi đã cài đặt Python SDK, bạn sẽ cần kết nối với không gian làm việc. Bằng cách kết nối, bạn sẽ xác thực môi trường của mình để tương tác với không gian làm việc nhằm tạo và quản lý tài nguyên và tài nguyên.

Để xác thực, bạn cần các giá trị cho ba tham số cần thiết:

  • subscription_id: ID đăng ký của bạn.
  • resource_group: Tên nhóm tài nguyên của bạn.
  • workspace_name: Tên của không gian làm việc của bạn.

Tiếp theo, bạn có thể xác định xác thực bằng cách sử dụng mã sau:

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)

Sau khi xác định xác thực, bạn cần gọi điện MLClient cho môi trường để kết nối với không gian làm việc. Bạn sẽ gọi cho MLClient bất cứ khi nào bạn muốn tạo hoặc cập nhật tài sản hoặc tài nguyên trong không gian làm việc.

Ví dụ: bạn sẽ kết nối với không gian làm việc khi tạo công việc mới để đào tạo mô hình:

from azure.ai.ml import command

# configure job
job = command(
    code="./src",
    command="python train.py",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    experiment_name="train-model"
)

# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)

Sử dụng tài liệu tham khảo

Để làm việc hiệu quả với Python SDK, bạn sẽ cần sử dụng tài liệu tham khảo. Trong tài liệu tham khảo, bạn sẽ tìm thấy tất cả các lớp học, phương pháp và tham số có sẵn trong Python SDK.

Tài liệu tham khảo trên MLClient lớp gồm các phương pháp bạn có thể sử dụng để kết nối và tương tác với không gian làm việc. Hơn nữa, nó cũng liên kết đến các hoạt động có thể cho các thực thể khác nhau như làm thế nào để danh sách các kho dữ liệu hiện có trong không gian làm việc của bạn.

Tài liệu tham khảo cũng bao gồm danh sách các lớp cho tất cả các thực thể bạn có thể tương tác với. Ví dụ: các lớp riêng biệt tồn tại khi bạn muốn tạo một kho dữ liệu liên kết đến Azure Blob Storage hoặc Azure Data Lake Gen 2.

Bằng cách chọn một lớp cụ thể như AmlCompute từ danh sách các thực thể, bạn có thể tìm thấy một trang chi tiết hơn về cách sử dụng lớp và các tham số mà nó chấp nhận.