Konfigurowanie środowiska deweloperskiego języka Python dla usługi Azure Machine Learning

Dowiedz się, jak skonfigurować środowisko deweloperskie języka Python dla usługi Azure Machine Learning.

W poniższej tabeli przedstawiono każde środowisko projektowe omówione w tym artykule wraz z zaletami i wadami.

Środowisko Zalety Wady
Środowisko lokalne Pełna kontrola nad środowiskiem projektistycznym i zależnościami. Uruchom polecenie za pomocą dowolnego wybranego narzędzia kompilacji, środowiska lub środowiska IDE. Rozpoczęcie pracy trwa dłużej. Wymagane pakiety zestawu SDK muszą być zainstalowane, a środowisko musi być również zainstalowane, jeśli jeszcze go nie masz.
Data Science Virtual Machine (DSVM) Podobnie jak w przypadku wystąpienia obliczeniowego opartego na chmurze (język Python jest wstępnie zainstalowany), ale z dodatkowymi popularnymi narzędziami do nauki o danych i uczenia maszynowego wstępnie zainstalowanymi. Łatwe skalowanie i łączenie z innymi niestandardowymi narzędziami i przepływami pracy. Wolniejsze środowisko rozpoczynania pracy w porównaniu z wystąpieniem obliczeniowym opartym na chmurze.
Wystąpienie obliczeniowe usługi Azure Machine Learning Najprostszym sposobem rozpoczęcia pracy. Zestaw SDK jest już zainstalowany na maszynie wirtualnej obszaru roboczego, a samouczki dotyczące notesów są wstępnie sklonowane i gotowe do uruchomienia. Brak kontroli nad środowiskiem projektistycznym i zależnościami. Dodatkowe koszty związane z maszyną wirtualną z systemem Linux (maszyna wirtualna może zostać zatrzymana, gdy nie jest używana w celu uniknięcia opłat). Zobacz szczegóły cennika.

Ten artykuł zawiera również dodatkowe porady dotyczące użycia dla następujących narzędzi:

  • Notesy Jupyter Notebook: jeśli korzystasz już z notesów Jupyter Notebook, zestaw SDK zawiera pewne dodatki, które należy zainstalować.

  • Visual Studio Code: Jeśli używasz Visual Studio Code, rozszerzenie Usługi Azure Machine Learning obejmuje obsługę języka Python i funkcje, aby pracować z usługą Azure Machine Learning znacznie wygodniej i wydajniej.

Wymagania wstępne

Tylko maszyny wirtualne lokalne i DSVM: tworzenie pliku konfiguracji obszaru roboczego

Plik konfiguracji obszaru roboczego to plik JSON, który informuje zestaw SDK, jak komunikować się z obszarem roboczym usługi Azure Machine Learning. Plik ma nazwę config.json i ma następujący format:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Ten plik JSON musi znajdować się w strukturze katalogów zawierającej skrypty języka Python lub notesy Jupyter Notebook. Może znajdować się w tym samym katalogu, podkatalogu o nazwie.azureml*lub w katalogu nadrzędnym.

Aby użyć tego pliku z kodu, użyj MLClient.from_config metody . Ten kod ładuje informacje z pliku i łączy się z obszarem roboczym.

Utwórz plik konfiguracji obszaru roboczego w jednej z następujących metod:

  • Studio uczenia maszynowego Azure

    Pobierz plik:

    1. Zaloguj się do Azure Machine Learning studio
    2. Na prawym górnym pasku narzędzi Azure Machine Learning studio wybierz nazwę obszaru roboczego.
    3. Wybierz link Pobierz plik konfiguracji .

    Zrzut ekranu przedstawiający sposób pobierania pliku konfiguracji.

  • Azure Machine Learning Python SDK

    Utwórz skrypt umożliwiający nawiązanie połączenia z obszarem roboczym usługi Azure Machine Learning. Pamiętaj, aby zastąpić subscription_idciąg ,resource_group i workspace_name własnym.

    DOTYCZY: Zestaw SDK języka Python azure-ai-ml w wersji 2 (bieżący)

    #import required libraries
    from azure.ai.ml import MLClient
    from azure.identity import DefaultAzureCredential
    
    #Enter details of your Azure Machine Learning workspace
    subscription_id = '<SUBSCRIPTION_ID>'
    resource_group = '<RESOURCE_GROUP>'
    workspace = '<AZUREML_WORKSPACE_NAME>'
    
    #connect to the workspace
    ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
    

Komputer lokalny lub środowisko zdalnej maszyny wirtualnej

Środowisko można skonfigurować na komputerze lokalnym lub zdalnej maszynie wirtualnej, takiej jak wystąpienie obliczeniowe usługi Azure Machine Learning lub maszyna wirtualna Nauka o danych.

Aby skonfigurować lokalne środowisko programistyczne lub zdalną maszynę wirtualną:

  1. Tworzenie środowiska wirtualnego języka Python (virtualenv, conda).

    Uwaga

    Mimo że nie jest to wymagane, zaleca się używanie rozwiązania Anaconda lub Miniconda do zarządzania środowiskami wirtualnymi języka Python i instalowania pakietów.

    Ważne

    Jeśli korzystasz z systemu Linux lub macOS i używasz powłoki innej niż powłoka bash (na przykład zsh), podczas uruchamiania niektórych poleceń mogą wystąpić błędy. Aby obejść ten problem, użyj bash polecenia , aby uruchomić nową powłokę powłoki bash i uruchomić tam polecenia.

  2. Aktywuj nowo utworzone środowisko wirtualne języka Python.

  3. Zainstaluj zestaw SDK języka Python usługi Azure Machine Learning.

  4. Aby skonfigurować środowisko lokalne do korzystania z obszaru roboczego usługi Azure Machine Learning, utwórz plik konfiguracji obszaru roboczego lub użyj istniejącego.

Po skonfigurowaniu środowiska lokalnego możesz rozpocząć pracę z usługą Azure Machine Learning. Zobacz Samouczek: Usługa Azure Machine Learning w ciągu dnia , aby rozpocząć pracę.

Notesy programu Jupyter

Podczas uruchamiania lokalnego serwera Jupyter Notebook zaleca się utworzenie jądra IPython dla środowiska wirtualnego języka Python. Pomaga to zapewnić oczekiwane zachowanie jądra i importowania pakietów.

  1. Włączanie jądra IPython specyficznych dla środowiska

    conda install notebook ipykernel
    
  2. Utwórz jądro dla środowiska wirtualnego języka Python. Pamiętaj, aby zastąpić <myenv> ciąg nazwą środowiska wirtualnego języka Python.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. Uruchamianie serwera Jupyter Notebook

Porada

Na przykład notesy można znaleźć w repozytorium AzureML-Examples . Przykłady zestawu SDK znajdują się w obszarze /sdk/python. Na przykład przykład notesu konfiguracji .

Visual Studio Code

Aby użyć Visual Studio Code do programowania:

  1. Zainstaluj Visual Studio Code.
  2. Zainstaluj rozszerzenie usługi Azure Machine Learning Visual Studio Code (wersja zapoznawcza).

Po zainstalowaniu rozszerzenia Visual Studio Code użyj go do:

Wystąpienie obliczeniowe usługi Azure Machine Learning

Wystąpienie obliczeniowe usługi Azure Machine Learning to bezpieczna, oparta na chmurze stacja robocza platformy Azure, która udostępnia analitykom danych serwer Jupyter Notebook, JupyterLab i w pełni zarządzane środowisko uczenia maszynowego.

Nie ma nic do zainstalowania ani skonfigurowania dla wystąpienia obliczeniowego.

Utwórz jeden w dowolnym momencie z poziomu obszaru roboczego usługi Azure Machine Learning. Podaj tylko nazwę i określ typ maszyny wirtualnej platformy Azure. Wypróbuj teraz pozycję Utwórz zasoby, aby rozpocząć pracę.

Aby dowiedzieć się więcej na temat wystąpień obliczeniowych, w tym sposobu instalowania pakietów, zobacz Tworzenie wystąpienia obliczeniowego usługi Azure Machine Learning.

Porada

Aby zapobiec naliczaniu opłat za nieużywane wystąpienie obliczeniowe, włącz zamykanie bezczynności.

Oprócz serwera Jupyter Notebook i narzędzia JupyterLab można używać wystąpień obliczeniowych w funkcji zintegrowanego notesu wewnątrz Azure Machine Learning studio.

Możesz również użyć rozszerzenia usługi Azure Machine Learning Visual Studio Code, aby nawiązać połączenie z zdalnym wystąpieniem obliczeniowym przy użyciu programu VS Code.

Maszyna wirtualna do analizy danych

Maszyna wirtualna Nauka o danych to dostosowany obraz maszyny wirtualnej, którego można użyć jako środowiska programistycznego. Jest ona przeznaczona do pracy nad nauką o danych, która jest wstępnie skonfigurowanymi narzędziami i oprogramowaniem, takimi jak:

  • Pakiety takie jak TensorFlow, PyTorch, Scikit-learn, XGBoost i Azure Machine Learning SDK
  • Popularne narzędzia do nauki o danych, takie jak Autonomiczna platforma Spark i przechodzenie do szczegółów
  • Narzędzia platformy Azure, takie jak interfejs wiersza polecenia platformy Azure, narzędzie AzCopy i Eksplorator usługi Storage
  • Zintegrowane środowiska programistyczne (IDE), takie jak Visual Studio Code i PyCharm
  • serwer Jupyter Notebook

Aby uzyskać bardziej kompleksową listę narzędzi, zobacz przewodnik Nauka o danych narzędzi maszyn wirtualnych.

Ważne

Jeśli planujesz używać maszyny wirtualnej Nauka o danych jako celu obliczeniowego dla zadań szkoleniowych lub wnioskowania, obsługiwana jest tylko wersja Ubuntu.

Aby użyć maszyny wirtualnej Nauka o danych jako środowiska programistycznego:

  1. Utwórz maszynę wirtualną Nauka o danych przy użyciu jednej z następujących metod:

    • Użyj Azure Portal, aby utworzyć maszynę DSVM z systemem Ubuntu lub Windows.

    • Tworzenie maszyny wirtualnej Nauka o danych przy użyciu szablonów usługi ARM.

    • Używanie interfejsu wiersza polecenia platformy Azure

      Aby utworzyć maszynę wirtualną z systemem Ubuntu Nauka o danych, użyj następującego polecenia:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      Aby utworzyć maszynę DSVM systemu Windows, użyj następującego polecenia:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Utwórz środowisko conda dla zestawu Azure Machine Learning SDK:

    conda create -n py310 python=310
    
  3. Po utworzeniu środowiska aktywuj go i zainstaluj zestaw SDK

    conda activate py310
    pip install azure-ai-ml azure-identity
    
  4. Aby skonfigurować maszynę wirtualną Nauka o danych do korzystania z obszaru roboczego usługi Azure Machine Learning, utwórz plik konfiguracji obszaru roboczego lub użyj istniejącego.

    Porada

    Podobnie jak w środowiskach lokalnych, można użyć Visual Studio Code i rozszerzenia usługi Azure Machine Learning Visual Studio Code do interakcji z usługą Azure Machine Learning.

    Aby uzyskać więcej informacji, zobacz Nauka o danych Virtual Machines.

Następne kroki