Sdílet prostřednictvím


Nastavení vývojového prostředí Pythonu pro Azure Machine Learning

Zjistěte, jak nakonfigurovat vývojové prostředí Pythonu pro Azure Machine Learning.

Následující tabulka uvádí každé vývojové prostředí popsané v tomto článku spolu s klady a nevýhodymi.

Prostředí Výhody Nevýhody
Místní prostředí Plnou kontrolu nad vývojovými prostředími a závislostmi. Můžete spouštět s libovolným nástrojem pro sestavení, prostředím nebo integrovaným vývojovém prostředím podle vašeho výběru. Začínáme trvá déle. Potřebné balíčky SDK musí být nainstalované a pokud ho ještě nemáte, musí být nainstalované prostředí.
Virtuální počítač Datová Věda (DSVM) Podobá se cloudové výpočetní instanci (Python je předinstalovaný), ale s předinstalovanými dalšími oblíbenými nástroji pro datové vědy a strojové učení. Snadné škálování a kombinování s dalšími vlastními nástroji a pracovními postupy Pomalejší prostředí začínáme v porovnání s cloudovou výpočetní instancí.
Výpočetní instance služby Azure Machine Learning Nejjednodušší způsob, jak začít. Sada SDK je už ve virtuálním počítači pracovního prostoru nainstalovaná a kurzy poznámkových bloků jsou předem naklonované a připravené ke spuštění. Nedostatek kontroly nad vývojovými prostředími a závislostmi Další náklady vzniklé za virtuální počítač s Linuxem (virtuální počítač se dá zastavit, pokud se nepoužívá, aby se zabránilo poplatkům). Podrobné informace o cenách

Tento článek obsahuje také další tipy pro použití pro následující nástroje:

  • Poznámkové bloky Jupyter: Pokud už používáte poznámkové bloky Jupyter, sada SDK obsahuje některé doplňky, které byste měli nainstalovat.

  • Visual Studio Code: Pokud používáte Visual Studio Code, zahrnuje rozšíření Azure Machine Learning podporu jazyků pro Python a funkce, které usnadňují práci se službou Azure Machine Learning mnohem pohodlnější a produktivnější.

Požadavky

  • Pracovní prostor Služby Azure Machine Learning Pokud ho nemáte, můžete vytvořit pracovní prostor Azure Machine Learning prostřednictvím webu Azure Portal, Azure CLI a šablon Azure Resource Manageru.

Pouze místní a DSVM: Vytvoření konfiguračního souboru pracovního prostoru

Konfigurační soubor pracovního prostoru je soubor JSON, který sadě SDK říká, jak komunikovat s pracovním prostorem Azure Machine Learning. Soubor má název config.json a má následující formát:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Tento soubor JSON musí být v adresářové struktuře, která obsahuje skripty Pythonu nebo poznámkové bloky Jupyter. Může být ve stejném adresáři, podadresáři s názvem.azureml* nebo v nadřazeném adresáři.

Pokud chcete tento soubor použít z kódu, použijte metodu MLClient.from_config . Tento kód načte informace ze souboru a připojí se k vašemu pracovnímu prostoru.

Vytvořte konfigurační soubor pracovního prostoru v jedné z následujících metod:

  • Studio Azure Machine Learning

    Stáhněte si soubor:

    1. Přihlášení k studio Azure Machine Learning
    2. V pravém horním studio Azure Machine Learning panelu nástrojů vyberte název pracovního prostoru.
    3. Vyberte odkaz Ke stažení konfiguračního souboru .

    Snímek obrazovky ukazuje, jak stáhnout konfigurační soubor.

  • Sada Azure Machine Learning Python SDK

    Vytvořte skript pro připojení k pracovnímu prostoru Azure Machine Learning. Nezapomeňte nahradit subscription_idaresource_groupworkspace_name použít vlastní.

    PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

    #import required libraries
    from azure.ai.ml import MLClient
    from azure.identity import DefaultAzureCredential
    
    #Enter details of your Azure Machine Learning workspace
    subscription_id = '<SUBSCRIPTION_ID>'
    resource_group = '<RESOURCE_GROUP>'
    workspace = '<AZUREML_WORKSPACE_NAME>'
    
    #connect to the workspace
    ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
    

Místní počítač nebo vzdálené prostředí virtuálního počítače

Prostředí můžete nastavit na místním počítači nebo na vzdáleném virtuálním počítači, jako je výpočetní instance služby Azure Machine Learning nebo Datová Věda virtuální počítač.

Konfigurace místního vývojového prostředí nebo vzdáleného virtuálního počítače:

  1. Vytvořte virtuální prostředí Pythonu (virtualenv, conda).

    Poznámka:

    I když to není povinné, doporučujeme ke správě virtuálních prostředí Pythonu a instalaci balíčků použít Anaconda nebo Miniconda .

    Důležité

    Pokud používáte Linux nebo macOS a používáte jiné prostředí než Bash (například zsh), může se při spuštění některých příkazů zobrazit chyby. Chcete-li tento problém vyřešit, pomocí bash příkazu spusťte nové prostředí Bash a spusťte příkazy tam.

  2. Aktivujte nově vytvořené virtuální prostředí Pythonu.

  3. Nainstalujte sadu Azure Machine Learning Python SDK.

  4. Pokud chcete nakonfigurovat místní prostředí tak, aby používalo pracovní prostor Služby Azure Machine Learning, vytvořte konfigurační soubor pracovního prostoru nebo použijte existující.

Teď, když máte nastavené místní prostředí, jste připraveni začít pracovat se službou Azure Machine Learning. Projděte si kurz: Azure Machine Learning za den , abyste mohli začít.

Poznámkové bloky Jupyter

Při spuštění místního serveru Jupyter Notebook se doporučuje vytvořit jádro IPython pro vaše virtuální prostředí Pythonu. To pomáhá zajistit očekávané chování při importu jádra a balíčku.

  1. Povolení jader IPythonu specifických pro prostředí

    conda install notebook ipykernel
    
  2. Vytvořte jádro pro virtuální prostředí Pythonu. Nezapomeňte nahradit <myenv> názvem vašeho virtuálního prostředí Pythonu.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. Spuštění serveru Jupyter Notebook

Tip

Například poznámkové bloky najdete v úložišti AzureML-Examples . Příklady sady SDK jsou umístěné ve složce /sdk/python. Příklad konfiguračního poznámkového bloku .

Visual Studio Code

Použití editoru Visual Studio Code pro vývoj:

  1. Nainstalujte Visual Studio Code.
  2. Nainstalujte rozšíření Azure Machine Learning Visual Studio Code (Preview).

Jakmile máte nainstalované rozšíření Visual Studio Code, použijte ho k:

Výpočetní instance Azure Machine Learningu

Výpočetní instance Azure Machine Learning je zabezpečená cloudová pracovní stanice Azure, která poskytuje datovým vědcům server Jupyter Notebook, JupyterLab a plně spravované prostředí strojového učení.

Pro výpočetní instanci není potřeba nic instalovat ani konfigurovat.

Vytvořte si ho kdykoli z pracovního prostoru Azure Machine Learning. Zadejte jenom název a zadejte typ virtuálního počítače Azure. Vyzkoušejte si to teď pomocí příkazu Vytvořit prostředky, abyste mohli začít.

Další informace o výpočetních instancích, včetně postupu instalace balíčků, najdete v tématu Vytvoření výpočetní instance služby Azure Machine Learning.

Tip

Pokud chcete zabránit účtování poplatků za nevyužitou výpočetní instanci, povolte vypnutí nečinnosti.

Kromě serveru Jupyter Notebook a JupyterLabu můžete použít výpočetní instance v integrované funkci poznámkového bloku uvnitř studio Azure Machine Learning.

Rozšíření Azure Machine Learning Visual Studio Code můžete použít také k připojení ke vzdálené výpočetní instanci pomocí nástroje VS Code.

Data Science Virtual Machine

Virtuální počítač Datová Věda je přizpůsobená image virtuálního počítače, kterou můžete použít jako vývojové prostředí. Je navržená pro práci s datovými vědami, která je předem nakonfigurované nástroje a software, jako jsou:

  • Balíčky, jako jsou TensorFlow, PyTorch, Scikit-learn, XGBoost a sada Azure Machine Learning SDK
  • Oblíbené nástroje pro datové vědy, jako jsou Spark Standalone a Drill
  • Nástroje Azure, jako jsou Azure CLI, AzCopy a Průzkumník služby Storage
  • Integrovaná vývojová prostředí (IDE), jako je Visual Studio Code a PyCharm
  • Jupyter Notebook Server

Podrobnější seznam nástrojů najdete v průvodci nástroji pro Datová Věda virtuálních počítačů.

Důležité

Pokud plánujete použít virtuální počítač Datová Věda jako cílový výpočetní objekt pro trénovací úlohy nebo úlohy odvozování, podporuje se jenom Ubuntu.

Použití virtuálního počítače Datová Věda jako vývojového prostředí:

  1. Pomocí jedné z následujících metod vytvořte virtuální počítač Datová Věda:

    • Pomocí webu Azure Portal vytvořte dsVM s Ubuntu nebo Windows .

    • Vytvořte Datová Věda virtuální počítač pomocí šablon ARM.

    • Použití Azure CLI

      K vytvoření virtuálního počítače s Ubuntu Datová Věda použijte následující příkaz:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      Pokud chcete vytvořit dsVM s Windows, použijte následující příkaz:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Vytvořte prostředí Conda pro sadu Azure Machine Learning SDK:

    conda create -n py310 python=310
    
  3. Po vytvoření prostředí ho aktivujte a nainstalujte sadu SDK.

    conda activate py310
    pip install azure-ai-ml azure-identity
    
  4. Pokud chcete nakonfigurovat Datová Věda virtuální počítač tak, aby používal váš pracovní prostor Azure Machine Learning, vytvořte konfigurační soubor pracovního prostoru nebo použijte existující.

    Tip

    Podobně jako v místních prostředích můžete použít Visual Studio Code a rozšíření Azure Machine Learning Visual Studio Code k interakci se službou Azure Machine Learning.

    Další informace najdete v tématu Datová Věda Virtual Machines.

Další kroky