Nastavení vývojového prostředí Pythonu pro Azure Machine Learning

Zjistěte, jak nakonfigurovat vývojové prostředí Pythonu pro Azure Machine Learning.

Následující tabulka uvádí všechna vývojová prostředí probíraná v tomto článku spolu s klady a zápory.

Prostředí Výhody Nevýhody
Místní prostředí Úplná kontrola nad vývojovými prostředími a závislostmi Spouštějte s libovolným nástrojem sestavení, prostředím nebo integrovaným vývojovým prostředím podle vašeho výběru. Začátek trvá déle. Musí být nainstalované nezbytné balíčky sady SDK a také prostředí, pokud ho ještě nemáte.
Data Science Virtual Machine (DSVM) Podobá se cloudové výpočetní instanci (Python je předinstalovaný), ale s předinstalovanými dalšími oblíbenými nástroji pro datové vědy a strojové učení. Snadné škálování a kombinování s dalšími vlastními nástroji a pracovními postupy. Pomalejší začátek v porovnání s cloudovou výpočetní instancí.
Výpočetní instance Azure Machine Learningu Nejjednodušší způsob, jak začít. Sada SDK je už na virtuálním počítači pracovního prostoru nainstalovaná a kurzy poznámkových bloků jsou předem naklonované a připravené ke spuštění. Nedostatečná kontrola nad vývojovými prostředími a závislostmi Další náklady na virtuální počítač s Linuxem (virtuální počítač je možné zastavit, když se nepoužívá, abyste se vyhnuli poplatkům). Projděte si podrobnosti o cenách.

Tento článek obsahuje také další tipy k použití pro následující nástroje:

  • Poznámkové bloky Jupyter: Pokud už používáte poznámkové bloky Jupyter, sada SDK obsahuje některé doplňky, které byste měli nainstalovat.

  • Visual Studio Code: Pokud používáte Visual Studio Code, zahrnuje rozšíření Azure Machine Learning podporu jazyků pro Python a funkce, díky kterým je práce se službou Azure Machine Learning mnohem pohodlnější a produktivnější.

Požadavky

Pouze místní počítač a virtuální počítač pro datové vědy: Vytvoření konfiguračního souboru pracovního prostoru

Konfigurační soubor pracovního prostoru je soubor JSON, který sadě SDK říká, jak má komunikovat s pracovním prostorem Azure Machine Learning. Soubor má název config.json a má následující formát:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Tento soubor JSON musí být v adresářové struktuře, která obsahuje vaše skripty Pythonu nebo poznámkové bloky Jupyter Notebook. Může být ve stejném adresáři, v podadresáři s názvem.azureml* nebo v nadřazeném adresáři.

Pokud chcete použít tento soubor z kódu, použijte metodu MLClient.from_config . Tento kód načte informace ze souboru a připojí se k vašemu pracovnímu prostoru.

Vytvořte konfigurační soubor pracovního prostoru některou z následujících metod:

  • Azure Machine Learning Studio

    Stáhněte soubor:

    1. Přihlášení k studio Azure Machine Learning
    2. V pravém horním studio Azure Machine Learning panelu nástrojů vyberte název pracovního prostoru.
    3. Vyberte odkaz Stáhnout konfigurační soubor .

    Snímek obrazovky ukazuje, jak stáhnout konfigurační soubor.

  • Azure Machine Learning Python SDK

    Vytvořte skript pro připojení k pracovnímu prostoru Azure Machine Learning. Nezapomeňte nahradit subscription_id,resource_group a workspace_name vlastními.

    PLATÍ PRO: Sada Python SDK azure-ai-ml v2 (aktuální)

    #import required libraries
    from azure.ai.ml import MLClient
    from azure.identity import DefaultAzureCredential
    
    #Enter details of your Azure Machine Learning workspace
    subscription_id = '<SUBSCRIPTION_ID>'
    resource_group = '<RESOURCE_GROUP>'
    workspace = '<AZUREML_WORKSPACE_NAME>'
    
    #connect to the workspace
    ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
    

Místní počítač nebo prostředí vzdáleného virtuálního počítače

Prostředí můžete nastavit na místním počítači nebo vzdáleném virtuálním počítači, jako je výpočetní instance služby Azure Machine Learning nebo Datová Věda virtuální počítač.

Konfigurace místního vývojového prostředí nebo vzdáleného virtuálního počítače:

  1. Vytvořte virtuální prostředí Pythonu (virtualenv, conda).

    Poznámka

    I když to není povinné, doporučuje se ke správě virtuálních prostředí Pythonu a instalaci balíčků používat Anaconda nebo Miniconda .

    Důležité

    Pokud používáte Linux nebo macOS a používáte jiné prostředí než Bash (například zsh), můžou se při spuštění některých příkazů zobrazit chyby. Chcete-li tento problém vyřešit, použijte bash příkaz ke spuštění nového prostředí Bash a spusťte příkazy tam.

  2. Aktivujte nově vytvořené virtuální prostředí Pythonu.

  3. Nainstalujte sadu Azure Machine Learning Python SDK.

  4. Pokud chcete nakonfigurovat místní prostředí tak, aby používalo váš pracovní prostor Azure Machine Learning, vytvořte konfigurační soubor pracovního prostoru nebo použijte existující.

Teď, když máte nastavené místní prostředí, můžete začít pracovat se službou Azure Machine Learning. Začněte kurzem Azure Machine Learning za den .

Poznámkové bloky Jupyter

Při spuštění místního Jupyter Notebook serveru se doporučuje vytvořit jádro IPython pro virtuální prostředí Pythonu. To pomáhá zajistit očekávané chování při importu jádra a balíčku.

  1. Povolení ipythonových jader specifických pro prostředí

    conda install notebook ipykernel
    
  2. Vytvořte jádro pro virtuální prostředí Pythonu. Nezapomeňte nahradit <myenv> názvem vašeho virtuálního prostředí Pythonu.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. Spuštění serveru Jupyter Notebook

Tip

Například poznámkové bloky najdete v úložišti AzureML-Examples . Příklady sady SDK se nacházejí ve složce /sdk/python. Příklad poznámkového bloku Konfigurace .

Visual Studio Code

Použití editoru Visual Studio Code pro vývoj:

  1. Nainstalujte Visual Studio Code.
  2. Nainstalujte rozšíření Azure Machine Learning Pro Visual Studio Code (Preview).

Jakmile budete mít nainstalované rozšíření Visual Studio Code, použijte ho k:

Výpočetní instance Azure Machine Learningu

Výpočetní instance Azure Machine Learning je zabezpečená cloudová pracovní stanice Azure, která datovým vědcům poskytuje Jupyter Notebook server, JupyterLab a plně spravované prostředí strojového učení.

Pro výpočetní instanci není potřeba nic instalovat ani konfigurovat.

V pracovním prostoru Azure Machine Learning si ho kdykoli vytvořte. Zadejte pouze název a typ virtuálního počítače Azure. Začněte tím, že si to teď vyzkoušíte pomocí možnosti Vytvořit prostředky.

Další informace o výpočetních instancích, včetně postupu instalace balíčků, najdete v tématu Vytvoření výpočetní instance služby Azure Machine Learning.

Tip

Pokud chcete zabránit účtování poplatků za nepoužívané výpočetní instance, povolte nečinné vypnutí.

Kromě Jupyter Notebook serveru a JupyterLabu můžete použít výpočetní instance v integrované funkci poznámkového bloku uvnitř studio Azure Machine Learning.

K připojení ke vzdálené výpočetní instanci pomocí VS Code můžete použít také rozšíření Azure Machine Learning Visual Studio Code.

Virtuální počítač pro datové vědy

Virtuální počítač Datová Věda je přizpůsobená image virtuálního počítače, kterou můžete použít jako vývojové prostředí. Je navržený pro práci v datových vědách, což jsou předem nakonfigurované nástroje a software, jako jsou:

  • Balíčky, jako jsou TensorFlow, PyTorch, Scikit-learn, XGBoost a sada Azure Machine Learning SDK
  • Oblíbené nástroje pro datové vědy, jako je Spark Standalone a Drill
  • Nástroje Azure, jako jsou Azure CLI, AzCopy a Průzkumník služby Storage
  • Integrovaná vývojová prostředí (IDE), jako jsou Visual Studio Code a PyCharm
  • Jupyter Notebook Server

Podrobnější seznam nástrojů najdete v průvodci nástroji Datová Věda virtuálních počítačů.

Důležité

Pokud chcete virtuální počítač Datová Věda používat jako cílový výpočetní objekt pro úlohy trénování nebo odvozování, podporuje se jenom Ubuntu.

Použití Datová Věda virtuálního počítače jako vývojového prostředí:

  1. Vytvořte Datová Věda virtuální počítač pomocí jedné z následujících metod:

    • Pomocí Azure Portal vytvořte DSVM s Ubuntu nebo Windows.

    • Vytvořte Datová Věda virtuální počítač pomocí šablon ARM.

    • Použití Azure CLI

      K vytvoření virtuálního počítače s Ubuntu Datová Věda použijte následující příkaz:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      K vytvoření virtuálního počítače DSVM s Windows použijte následující příkaz:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Vytvoření prostředí Conda pro sadu Azure Machine Learning SDK:

    conda create -n py310 python=310
    
  3. Po vytvoření prostředí ho aktivujte a nainstalujte sadu SDK.

    conda activate py310
    pip install azure-ai-ml azure-identity
    
  4. Pokud chcete Datová Věda virtuální počítač nakonfigurovat tak, aby používal pracovní prostor Azure Machine Learning, vytvořte konfigurační soubor pracovního prostoru nebo použijte existující.

    Tip

    Podobně jako v místních prostředích můžete k interakci se službou Azure Machine Learning použít Visual Studio Code a rozšíření Azure Machine Learning Visual Studio Code .

    Další informace najdete v tématu Datová Věda Virtual Machines.

Další kroky