Bagikan melalui


Siapkan lingkungan pengembangan Python untuk Azure Machine Learning

BERLAKU UNTUK: Python SDK azure-ai-ml v2 (saat ini)

Pelajari cara mengonfigurasi lingkungan pengembangan Python untuk Azure Machine Learning.

Tabel berikut ini memperlihatkan setiap lingkungan pengembangan yang tercakup dalam artikel ini, bersama dengan pro dan kontra.

Lingkungan Pro Kontra
Lingkungan lokal Kontrol penuh atas lingkungan pengembangan dan dependensi Anda. Jalankan dengan alat build, lingkungan, atau IDE yang Anda pilih. Butuh waktu lebih lama untuk memulai. Paket SDK yang diperlukan harus diinstal, dan lingkungan juga harus diinstal jika Anda belum memilikinya.
Instans Komputasi Azure Machine Learning Cara termudah untuk memulai. SDK sudah diinstal di VM ruang kerja Anda, dan tutorial notebook telah dikloning sebelumnya dan siap dijalankan. Kurangnya kontrol atas lingkungan pengembangan dan dependensi Anda. Biaya dikeluarkan untuk VM Linux (VM dapat dihentikan ketika tidak digunakan untuk menghindari biaya). Lihat detail harga.
Data Science Virtual Machine (DSVM) Mirip dengan instans komputasi berbasis cloud (Python telah diinstal sebelumnya), tetapi dengan ilmu data populer lainnya dan alat pembelajaran mesin yang telah diinstal sebelumnya. Mudah diskalakan dan digabungkan dengan alat dan alur kerja kustom lainnya. Pengalaman memulai yang lebih lambat dibandingkan dengan instans komputasi berbasis cloud.

Artikel ini juga menyediakan tips penggunaan lain untuk alat berikut:

  • Jupyter Notebooks: Jika sudah menggunakan Jupyter Notebooks, SDK memiliki beberapa tambahan yang harus Anda instal.

  • Visual Studio Code: Jika Anda menggunakan Visual Studio Code, ekstensi Azure Pembelajaran Mesin menyertakan dukungan bahasa untuk Python, dan fitur untuk membuat bekerja dengan Azure Pembelajaran Mesin jauh lebih nyaman dan produktif.

Prasyarat

Lokal dan DSVM saja: Membuat file konfigurasi ruang kerja

Berkas konfigurasi ruang kerja adalah berkas JSON yang memberi instruksi kepada SDK tentang cara berkomunikasi dengan ruang kerja Azure Machine Learning Anda. File diberi nama config.json, dan memiliki format berikut:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

File JSON ini harus berada dalam struktur direktori yang berisi skrip Python atau Jupyter Notebook Anda. Ini dapat berada di direktori yang sama, subdirektori bernama.azureml*, atau di direktori induk.

Untuk menggunakan file ini dari kode Anda, gunakan MLClient.from_config metode . Kode ini memuat informasi dari file dan terhubung ke ruang kerja Anda.

Buat file konfigurasi ruang kerja dengan salah satu cara berikut:

  • Studio Azure Machine Learning

    Unduh file:

    1. Masuk ke Studio Azure Machine Learning
    2. Di toolbar studio Azure Machine Learning, di kanan atas, pilih nama ruang kerja Anda.
    3. Pilih tautan Unduh file konfigurasi.

    Cuplikan layar memperlihatkan cara mengunduh file konfigurasi Anda.

  • Azure Machine Learning Python SDK

    Buat skrip untuk menyambungkan ke ruang kerja Azure Pembelajaran Mesin Anda. Pastikan untuk mengganti subscription_id, resource_group, dan workspace_name dengan milik Anda sendiri.

    BERLAKU UNTUK: Python SDK azure-ai-ml v2 (saat ini)

    #import required libraries
    from azure.ai.ml import MLClient
    from azure.identity import DefaultAzureCredential
    
    #Enter details of your Azure Machine Learning workspace
    subscription_id = '<SUBSCRIPTION_ID>'
    resource_group = '<RESOURCE_GROUP>'
    workspace = '<AZUREML_WORKSPACE_NAME>'
    
    #connect to the workspace
    ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
    

Komputer lokal atau lingkungan komputer virtual jarak jauh

Anda dapat mengatur lingkungan di komputer lokal atau mesin virtual jarak jauh, seperti instans komputasi Azure Machine Learning atau Data Science VM.

Untuk mengonfigurasi lingkungan pengembangan lokal atau komputer virtual jarak jauh:

  1. Buat lingkungan virtual Python (virtualenv, conda).

    Catatan

    Meskipun tidak diperlukan, kami sarankan Anda menggunakan Anaconda atau Miniconda untuk mengelola lingkungan virtual Python dan menginstal paket.

    Penting

    Jika Anda menggunakan Linux atau macOS dan menggunakan {i>shellbashbash perintah untuk memulai shell bash baru dan jalankan perintah di sana.

  2. Aktifkan lingkungan virtual Python yang baru dibuat.

  3. Instal Azure Machine Learning Python SDK.

  4. Untuk mengonfigurasi lingkungan lokal Anda untuk menggunakan ruang kerja Azure Pembelajaran Mesin Anda, buat file konfigurasi ruang kerja atau gunakan yang sudah ada.

Setelah menyiapkan lingkungan lokal, Anda siap untuk mulai bekerja dengan Azure Machine Learning. Lihat Tutorial: Azure Machine Learning dalam sehari untuk memulai.

Jupyter Notebooks

Saat menjalankan server Jupyter Notebook lokal, kami sarankan Anda membuat kernel IPython untuk lingkungan virtual Python Anda. Proses ini membantu memastikan perilaku impor kernel dan paket yang diharapkan.

  1. Aktifkan kernel IPython khusus lingkungan

    conda install notebook ipykernel
    
  2. Buat kernel untuk lingkungan virtual Python Anda. Pastikan untuk mengganti <myenv> dengan nama lingkungan virtual Python Anda.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. Luncurkan server Jupyter Notebook

Petunjuk / Saran

Misalnya notebook, lihat repositori AzureML-Examples . Contoh SDK terletak di bawah /sdk/python. Misalnya, contoh Notebook konfigurasi.

Visual Studio Code

Untuk menggunakan Visual Studio Code untuk pengembangan:

  1. Instal Visual Studio Code.
  2. Instalasi ekstensi Azure Machine Learning Visual Studio Code (pratinjau).

Setelah ekstensi Visual Studio Code terinstal, gunakan ekstensi tersebut untuk:

Instans komputasi Azure Machine Learning

Instans komputasi Azure Pembelajaran Mesin adalah stasiun kerja Azure berbasis cloud yang aman yang menyediakan server Jupyter Notebook, JupyterLab, dan lingkungan pembelajaran mesin yang dikelola sepenuhnya.

Tidak ada yang perlu diinstal atau dikonfigurasi untuk instans komputasi.

Buat kapan saja dari dalam ruang kerja Azure Machine Learning Anda. Berikan nama saja dan tentukan jenis Azure VM. Coba sekarang dengan Buat sumber daya untuk memulai.

Untuk mempelajari selengkapnya tentang instans komputasi, termasuk cara menginstal paket, lihat Membuat instans komputasi Azure Machine Learning.

Petunjuk / Saran

Untuk mencegah dikenakannya biaya untuk instance komputasi yang tidak digunakan, aktifkan matikan otomatis.

Selain server Jupyter Notebook dan JupyterLab, Anda dapat menggunakan instans komputasi di fitur notebook terintegrasi di dalam studio Azure Pembelajaran Mesin.

Anda juga dapat menggunakan ekstensi Azure Machine Learning Visual Studio Code untuk terhubung ke instans komputasi jarak jauh menggunakan VS Code.

Data Science Virtual Machine

Data Science VM adalah gambar mesin virtual (VM) khusus yang dapat Anda gunakan sebagai lingkungan pengembangan. Ini dirancang untuk pekerjaan ilmu data dengan alat dan perangkat lunak yang telah dikonfigurasi sebelumnya seperti:

  • Paket seperti TensorFlow, PyTorch, Scikit-learn, XGBoost, dan Azure Machine Learning SDK
  • Alat ilmu data populer seperti Spark Standalone dan Drill
  • Alat Azure seperti Azure CLI, AzCopy, dan Storage Explorer
  • Lingkungan pengembangan terintegrasi (IDEs) seperti Visual Studio Code dan PyCharm
  • Jupyter Notebook Server

Untuk daftar alat yang lebih komprehensif, lihat panduan alat Data Science VM.

Penting

Jika Anda berencana menggunakan Data Science VM sebagai target komputasi untuk pelatihan atau tugas inferensi Anda, hanya Ubuntu yang didukung.

Untuk menggunakan Data Science VM sebagai lingkungan pengembangan:

  1. Buat Data Science VM menggunakan salah satu metode berikut:

    • Gunakan portal Microsoft Azure untuk membuat Ubuntu atauWindows DSVM.

    • Buat Data Science VM menggunakan templat ARM.

    • Menggunakan Azure CLI

      Untuk membuat Ubuntu Data Science VM, gunakan perintah berikut:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      Untuk membuat Windows DSVM, gunakan perintah berikut:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Buat lingkungan conda untuk SDK Machine Learning Azure:

    conda create -n py310 python=310
    
  3. Setelah lingkungan dibuat, aktifkan dan instal SDK

    conda activate py310
    pip install azure-ai-ml azure-identity
    
  4. Untuk mengonfigurasi VM Ilmu Data untuk menggunakan ruang kerja Azure Pembelajaran Mesin Anda, buat file konfigurasi ruang kerja atau gunakan yang sudah ada.

    Petunjuk / Saran

    Mirip dengan lingkungan lokal, Anda dapat menggunakan Visual Studio Code dan ekstensi Azure Machine Learning Visual Studio Code untuk berinteraksi dengan Azure Machine Learning.

    Selengkapnya, lihat Data Science Virtual Machines.

Langkah berikutnya