Nastavení vývojového prostředí Pythonu pro Azure Machine Learning (v1)

Zjistěte, jak nakonfigurovat vývojové prostředí Pythonu pro Azure Machine Learning.

Následující tabulka uvádí všechna vývojová prostředí probíraná v tomto článku spolu s klady a zápory.

Prostředí Výhody Nevýhody
Místní prostředí Úplná kontrola nad vývojovými prostředími a závislostmi Spouštějte s libovolným nástrojem sestavení, prostředím nebo integrovaným vývojovým prostředím podle vašeho výběru. Začátek trvá déle. Musí být nainstalované nezbytné balíčky sady SDK a také prostředí, pokud ho ještě nemáte.
Data Science Virtual Machine (DSVM) Podobá se cloudové výpočetní instanci (python a sada SDK jsou předinstalované), ale s předinstalovanými dalšími oblíbenými nástroji pro datové vědy a strojové učení. Snadné škálování a kombinování s dalšími vlastními nástroji a pracovními postupy. Pomalejší začátek v porovnání s cloudovou výpočetní instancí.
Výpočetní instance Azure Machine Learningu Nejjednodušší způsob, jak začít. Na virtuálním počítači pracovního prostoru je už nainstalovaná celá sada SDK a kurzy poznámkových bloků jsou předem naklonované a připravené ke spuštění. Nedostatečná kontrola nad vývojovými prostředími a závislostmi Další náklady na virtuální počítač s Linuxem (virtuální počítač je možné zastavit, když se nepoužívá, abyste se vyhnuli poplatkům). Projděte si podrobnosti o cenách.
Azure Databricks Ideální pro spouštění rozsáhlých náročných pracovních postupů strojového učení na škálovatelné platformě Apache Spark. Overkill pro experimentální strojové učení nebo menší experimenty a pracovní postupy. Další náklady na Azure Databricks Projděte si podrobnosti o cenách.

Tento článek obsahuje také další tipy k použití pro následující nástroje:

  • Poznámkové bloky Jupyter: Pokud už používáte poznámkové bloky Jupyter, sada SDK obsahuje některé doplňky, které byste měli nainstalovat.

  • Visual Studio Code: Pokud používáte Visual Studio Code, zahrnuje rozšíření Azure Machine Learning rozsáhlou podporu jazyků pro Python a také funkce, díky kterým je práce se službou Azure Machine Learning mnohem pohodlnější a produktivnější.

Požadavky

Pouze místní počítač a virtuální počítač pro datové vědy: Vytvoření konfiguračního souboru pracovního prostoru

Konfigurační soubor pracovního prostoru je soubor JSON, který sadě SDK říká, jak má komunikovat s pracovním prostorem Azure Machine Learning. Soubor má název config.json a má následující formát:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Tento soubor JSON musí být v adresářové struktuře, která obsahuje vaše skripty Pythonu nebo poznámkové bloky Jupyter Notebook. Může být ve stejném adresáři, podadresáři s názvem .azureml nebo v nadřazeném adresáři.

Pokud chcete použít tento soubor z kódu, použijte metodu Workspace.from_config . Tento kód načte informace ze souboru a připojí se k vašemu pracovnímu prostoru.

Vytvořte konfigurační soubor pracovního prostoru některou z následujících metod:

  • portál Azure

    Stažení souboru: V Azure Portal vyberte Stáhnout soubor config.json v části Přehled vašeho pracovního prostoru.

    Snímek obrazovky se stránkou přehledu pracovního prostoru s vybranou možností stáhnout soubor config.json

  • Azure Machine Learning Python SDK

    Vytvořte skript pro připojení k pracovnímu prostoru Azure Machine Learning a pomocí write_config metody vygenerujte soubor a uložte ho jako .azureml/config.json. Nezapomeňte nahradit subscription_id,resource_group a workspace_name vlastními.

    PLATÍ PRO:Sada Python SDK azureml v1

    from azureml.core import Workspace
    
    subscription_id = '<subscription-id>'
    resource_group  = '<resource-group>'
    workspace_name  = '<workspace-name>'
    
    try:
        ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name)
        ws.write_config()
        print('Library configuration succeeded')
    except:
        print('Workspace not found')
    

Místní počítač nebo prostředí vzdáleného virtuálního počítače

Prostředí můžete nastavit na místním počítači nebo vzdáleném virtuálním počítači, jako je výpočetní instance služby Azure Machine Learning nebo virtuální počítač pro datové vědy.

Konfigurace místního vývojového prostředí nebo vzdáleného virtuálního počítače:

  1. Vytvořte virtuální prostředí Pythonu (virtualenv, conda).

    Poznámka

    I když to není povinné, doporučuje se ke správě virtuálních prostředí Pythonu a instalaci balíčků používat Anaconda nebo Miniconda .

    Důležité

    Pokud používáte Linux nebo macOS a používáte jiné prostředí než Bash (například zsh), můžou se při spuštění některých příkazů zobrazit chyby. Chcete-li tento problém vyřešit, použijte bash příkaz ke spuštění nového prostředí Bash a spusťte příkazy tam.

  2. Aktivujte nově vytvořené virtuální prostředí Pythonu.

  3. Nainstalujte sadu Azure Machine Learning Python SDK.

  4. Pokud chcete nakonfigurovat místní prostředí tak, aby používalo váš pracovní prostor Azure Machine Learning, vytvořte konfigurační soubor pracovního prostoru nebo použijte existující.

Teď, když máte nastavené místní prostředí, můžete začít pracovat se službou Azure Machine Learning. Začněte tím, že si projděte příručku Začínáme s Pythonem pro Azure Machine Learning .

Poznámkové bloky Jupyter

Při spuštění místního Jupyter Notebook serveru se doporučuje vytvořit jádro IPython pro virtuální prostředí Pythonu. To pomáhá zajistit očekávané chování při importu jádra a balíčku.

  1. Povolení ipythonových jader specifických pro prostředí

    conda install notebook ipykernel
    
  2. Vytvořte jádro pro virtuální prostředí Pythonu. Nezapomeňte nahradit <myenv> názvem vašeho virtuálního prostředí Pythonu.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. Spuštění serveru Jupyter Notebook

Pokud chcete začít pracovat se službami Azure Machine Learning a Jupyter Notebooks, podívejte se na úložiště poznámkových bloků služby Azure Machine Learning . Projděte si také úložiště řízené komunitou – Příklady AzureML.

Visual Studio Code

Použití editoru Visual Studio Code pro vývoj:

  1. Nainstalujte Visual Studio Code.
  2. Nainstalujte rozšíření Azure Machine Learning Pro Visual Studio Code (Preview).

Jakmile budete mít nainstalované rozšíření Visual Studio Code, použijte ho k:

Výpočetní instance Azure Machine Learningu

Výpočetní instance Azure Machine Learning je zabezpečená cloudová pracovní stanice Azure, která datovým vědcům poskytuje Jupyter Notebook server, JupyterLab a plně spravované prostředí strojového učení.

Pro výpočetní instanci není potřeba nic instalovat ani konfigurovat.

V pracovním prostoru Azure Machine Learning si ho kdykoli vytvořte. Zadejte pouze název a typ virtuálního počítače Azure. Vyzkoušejte si to teď pomocí tohoto kurzu: Nastavení prostředí a pracovního prostoru.

Další informace o výpočetních instancích, včetně postupu instalace balíčků, najdete v tématu Vytvoření a správa výpočetní instance služby Azure Machine Learning.

Tip

Pokud chcete zabránit účtování poplatků za nepoužívané výpočetní instance, zastavte výpočetní instanci. Nebo povolte vypnutí nečinné výpočetní instance.

Kromě Jupyter Notebook serveru a JupyterLabu můžete v rámci studio Azure Machine Learning používat výpočetní instance v integrované funkci poznámkového bloku.

K připojení ke vzdálené výpočetní instanci pomocí VS Code můžete použít také rozšíření Azure Machine Learning Visual Studio Code.

Virtuální počítač pro datové vědy

Data Science VM je přizpůsobená image virtuálního počítače, kterou můžete použít jako vývojové prostředí. Je navržený pro práci v datových vědách, což jsou předem nakonfigurované nástroje a software, jako jsou:

  • Balíčky, jako jsou TensorFlow, PyTorch, Scikit-learn, XGBoost a sada Azure Machine Learning SDK
  • Oblíbené nástroje pro datové vědy, jako je Spark Standalone a Drill
  • Nástroje Azure, jako jsou Azure CLI, AzCopy a Průzkumník služby Storage
  • Integrovaná vývojová prostředí (IDE), jako jsou Visual Studio Code a PyCharm
  • Jupyter Notebook Server

Podrobnější seznam nástrojů najdete v příručce k nástrojům pro virtuální počítače pro datové vědy.

Důležité

Pokud plánujete použít data science VM jako výpočetní cíl pro trénování nebo odvozování úloh, podporuje se jenom Ubuntu.

Použití virtuálního počítače pro datové vědy jako vývojového prostředí:

  1. Vytvořte virtuální počítač pro datové vědy pomocí jedné z následujících metod:

    • K vytvoření virtuálního počítače pro datové vědy (DSVM) s Ubuntu nebo Windows použijte Azure Portal.

    • Vytvoření virtuálního počítače pro datové vědy pomocí šablon ARM

    • Použití Azure CLI

      K vytvoření virtuálního počítače pro datové vědy s Ubuntu použijte následující příkaz:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      K vytvoření virtuálního počítače pro datové vědy (DSVM) s Windows použijte následující příkaz:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Aktivujte prostředí Conda obsahující sadu Azure Machine Learning SDK.

    • Virtuální počítač pro datové vědy s Ubuntu:

      conda activate py36
      
    • Pro virtuální počítače pro datové vědy s Windows:

      conda activate AzureML
      
  3. Pokud chcete virtuální počítač pro datové vědy nakonfigurovat tak, aby používal váš pracovní prostor Azure Machine Learning, vytvořte konfigurační soubor pracovního prostoru nebo použijte existující.

Podobně jako v případě místních prostředí můžete k interakci se službou Azure Machine Learning použít Visual Studio Code a rozšíření Azure Machine Learning Visual Studio Code .

Další informace najdete v tématu Data Science Virtual Machines.

Další kroky