Nastavení vývojového prostředí Pythonu pro Azure Machine Learning

Zjistěte, jak nakonfigurovat vývojové prostředí Pythonu pro Azure Machine Learning.

Následující tabulka ukazuje každé vývojové prostředí popsané v tomto článku spolu s klady a zápory.

Prostředí Výhody Nevýhody
Místní prostředí Úplná kontrola nad vývojovými prostředími a závislostmi Spusťte s libovolným buildovacím nástrojem, prostředím nebo integrovaným vývojovém prostředím podle vašeho výběru. Začátek trvá déle. Musí být nainstalované nezbytné balíčky sady SDK a pokud ještě nemáte prostředí, musí být nainstalované také prostředí.
Data Science Virtual Machine (DSVM) Podobá se cloudové výpočetní instanci (Python je předinstalovaný), ale s předinstalovanými dalšími oblíbenými nástroji pro datové vědy a strojové učení. Snadné škálování a kombinování s dalšími vlastními nástroji a pracovními postupy Pomalejší úvodní prostředí ve srovnání s cloudovou výpočetní instancí.
Výpočetní instance Azure Machine Learningu Nejjednodušší způsob, jak začít. Sada SDK je už nainstalovaná na virtuálním počítači pracovního prostoru a kurzy poznámkových bloků jsou předem naklonované a připravené ke spuštění. Nedostatečná kontrola nad vývojovými prostředími a závislostmi. Další náklady na virtuální počítač s Linuxem (virtuální počítač je možné zastavit, pokud se nepoužívá, abyste se vyhnuli poplatkům). Podívejte se na podrobnosti o cenách.
Azure Databricks Ideální pro spouštění rozsáhlých náročných pracovních postupů strojového učení na škálovatelné platformě Apache Spark. Nadměrné dovednosti pro experimentální strojové učení nebo menší experimenty a pracovní postupy. Další náklady na Azure Databricks Podívejte se na podrobnosti o cenách.

Tento článek obsahuje také další tipy k použití pro následující nástroje:

  • Poznámkové bloky Jupyter: Pokud už používáte poznámkové bloky Jupyter, sada SDK obsahuje některé doplňky, které byste měli nainstalovat.

  • Visual Studio Code: Pokud používáte Visual Studio Code, zahrnuje rozšíření Azure Machine Learning podporu jazyka pro Python a funkce, díky kterým je práce se službou Azure Machine Learning mnohem pohodlnější a produktivnější.

Požadavky

Pouze místní a DSVM: Vytvoření konfiguračního souboru pracovního prostoru

Konfigurační soubor pracovního prostoru je soubor JSON, který sadě SDK říká, jak komunikovat s pracovním prostorem služby Azure Machine Learning. Soubor má název config.json a má následující formát:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Tento soubor JSON musí být v adresářové struktuře, která obsahuje vaše skripty Pythonu nebo poznámkové bloky Jupyter. Může být ve stejném adresáři, podadresáři s názvem.azureml* nebo v nadřazeném adresáři.

Pokud chcete použít tento soubor z kódu, použijte metodu MLClient.from_config . Tento kód načte informace ze souboru a připojí se k vašemu pracovnímu prostoru.

Vytvořte konfigurační soubor pracovního prostoru jednou z následujících metod:

  • portál Azure

    Stažení souboru: V Azure Portal vyberte Stáhnout soubor config.json v části Přehled vašeho pracovního prostoru.

    portál Azure

  • Azure Machine Learning Python SDK

    Vytvořte skript pro připojení k pracovnímu prostoru Služby Azure Machine Learning. Nezapomeňte nahradit subscription_idaresource_groupworkspace_name vlastními.

    PLATÍ PRO: Sada Python SDK azure-ai-ml v2 (aktuální)

        #import required libraries
        from azure.ai.ml import MLClient
        from azure.identity import DefaultAzureCredential
    
        #Enter details of your AzureML workspace
        subscription_id = '<SUBSCRIPTION_ID>'
        resource_group = '<RESOURCE_GROUP>'
        workspace = '<AZUREML_WORKSPACE_NAME>'
    
        #connect to the workspace
        ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
    

Prostředí místního počítače nebo vzdáleného virtuálního počítače

Prostředí můžete nastavit na místním počítači nebo vzdáleném virtuálním počítači, jako je výpočetní instance Služby Azure Machine Learning nebo virtuální počítač pro datové vědy.

Konfigurace místního vývojového prostředí nebo vzdáleného virtuálního počítače:

  1. Vytvořte virtuální prostředí Pythonu (virtualenv, conda).

    Poznámka

    I když to není povinné, doporučuje se použít Anaconda nebo Miniconda ke správě virtuálních prostředí Pythonu a instalaci balíčků.

    Důležité

    Pokud používáte Linux nebo macOS a používáte jiné prostředí než bash (například zsh), můžou se při spuštění některých příkazů zobrazit chyby. Pokud chcete tento problém vyřešit, spusťte bash pomocí příkazu nové prostředí Bash a spusťte příkazy tam.

  2. Aktivujte nově vytvořené virtuální prostředí Python.

  3. Nainstalujte sadu Azure Machine Learning Python SDK.

  4. Pokud chcete nakonfigurovat místní prostředí tak, aby používalo pracovní prostor Služby Azure Machine Learning, vytvořte konfigurační soubor pracovního prostoru nebo použijte existující soubor.

Teď, když máte nastavené místní prostředí, jste připraveni začít pracovat se službou Azure Machine Learning. Začněte kurzem Azure Machine Learning za den .

Poznámkové bloky Jupyter

Při spouštění místního serveru Jupyter Notebook doporučujeme vytvořit jádro IPythonu pro vaše virtuální prostředí Pythonu. To pomáhá zajistit očekávané chování při importu jádra a balíčku.

  1. Povolení jader IPythonu specifických pro prostředí

    conda install notebook ipykernel
    
  2. Vytvořte jádro pro virtuální prostředí Pythonu. Nezapomeňte nahradit <myenv> názvem vašeho virtuálního prostředí Pythonu.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. Spuštění Jupyter Notebook serveru

    Tip

    Například poznámkové bloky najdete v úložišti AzureML-Examples . Příklady sady SDK najdete v /sdk/python. Příklad poznámkového bloku Konfigurace .

Visual Studio Code

Použití editoru Visual Studio Code pro vývoj:

  1. Nainstalujte Visual Studio Code.
  2. Nainstalujte rozšíření Azure Machine Learning Visual Studio Code (Preview).

Jakmile máte nainstalované rozšíření Visual Studio Code, použijte ho k:

Výpočetní instance Azure Machine Learningu

Výpočetní instance Azure Machine Learning je zabezpečená cloudová pracovní stanice Azure, která datovým vědcům poskytuje Jupyter Notebook server, JupyterLab a plně spravované prostředí strojového učení.

Pro výpočetní instanci není nic k instalaci ani konfiguraci.

Vytvořte si ho kdykoliv v pracovním prostoru služby Azure Machine Learning. Zadejte jenom název a zadejte typ virtuálního počítače Azure. Vyzkoušejte si to teď v tomto kurzu: Nastavení prostředí a pracovního prostoru.

Další informace o výpočetních instancích, včetně postupu instalace balíčků, najdete v tématu Vytvoření a správa výpočetní instance služby Azure Machine Learning.

Tip

Pokud chcete zabránit účtování poplatků za nepoužívané výpočetní instance, zastavte výpočetní instanci.

Kromě Jupyter Notebook serveru a JupyterLabu můžete používat výpočetní instance v integrované funkci poznámkového bloku uvnitř studio Azure Machine Learning.

K připojení ke vzdálené výpočetní instanci pomocí VS Code můžete také použít rozšíření Azure Machine Learning Visual Studio Code.

Virtuální počítač pro datové vědy

Virtuální počítač pro datové vědy je přizpůsobená image virtuálního počítače, kterou můžete použít jako vývojové prostředí. Je navržený pro práci v datových vědách, které jsou předkonfigurované nástroje a software, jako jsou:

  • Balíčky, jako jsou TensorFlow, PyTorch, Scikit-learn, XGBoost a sada Azure Machine Learning SDK
  • Oblíbené nástroje pro datové vědy, jako je Spark Standalone a Drill
  • Nástroje Azure, jako jsou Azure CLI, AzCopy a Průzkumník služby Storage
  • Integrovaná vývojová prostředí (IDE), jako jsou Visual Studio Code a PyCharm
  • Jupyter Notebook Server

Podrobnější seznam nástrojů najdete v průvodci nástroji virtuálních počítačů pro datové vědy.

Důležité

Pokud chcete virtuální počítač pro datové vědy používat jako cílový výpočetní objekt pro trénování nebo odvozování úloh, podporuje se jenom Ubuntu.

Použití virtuálního počítače pro datové vědy jako vývojového prostředí:

  1. Vytvořte virtuální počítač pro datové vědy pomocí jedné z následujících metod:

    • Pomocí Azure Portal vytvořte DSVM s Ubuntu nebo Windows.

    • Vytvořte virtuální počítač pro datové vědy pomocí šablon ARM.

    • Použití Azure CLI

      K vytvoření virtuálního počítače pro datové vědy s Ubuntu použijte následující příkaz:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      K vytvoření virtuálního počítače DSVM s Windows použijte následující příkaz:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Vytvoření prostředí Conda pro sadu Azure Machine Learning SDK:

    conda create -n py310 python=310
    
  3. Po vytvoření prostředí ho aktivujte a nainstalujte sadu SDK.

    conda activate py310
    pip install azure-ai-ml
    
  4. Pokud chcete virtuální počítač pro datové vědy nakonfigurovat tak, aby používal pracovní prostor Azure Machine Learning, vytvořte konfigurační soubor pracovního prostoru nebo použijte existující soubor.

    Tip

    Podobně jako v místních prostředích můžete k interakci se službou Azure Machine Learning použít Visual Studio Code a rozšíření Azure Machine Learning Visual Studio Code .

    Další informace najdete v tématu Data Science Virtual Machines.

Další kroky