Dela via


Konfigurera en Python-utvecklingsmiljö för Azure Mašinsko učenje (v1)

GÄLLER FÖR: Python SDK azureml v1

Lär dig hur du konfigurerar en Python-utvecklingsmiljö för Azure Mašinsko učenje.

I följande tabell visas varje utvecklingsmiljö som beskrivs i den här artikeln, tillsammans med för- och nackdelar.

Environment Fördelar Nackdelar
Lokal miljö Fullständig kontroll över din utvecklingsmiljö och dina beroenden. Kör med valfritt byggverktyg, miljö eller valfri IDE. Det tar längre tid att komma igång. Nödvändiga SDK-paket måste installeras och en miljö måste också installeras om du inte redan har ett.
Data Science Virtual Machine (DSVM) Liknar den molnbaserade beräkningsinstansen (Python och SDK är förinstallerade), men med andra populära datavetenskaps- och maskininlärningsverktyg förinstallerade. Lätt att skala och kombinera med andra anpassade verktyg och arbetsflöden. En långsammare kom igång-upplevelse jämfört med den molnbaserade beräkningsinstansen.
Azure Mašinsko učenje beräkningsinstans Det enklaste sättet att komma igång. Hela SDK:n är redan installerad på den virtuella arbetsytan och självstudierna för notebook-filer är förklonkade och redo att köras. Brist på kontroll över utvecklingsmiljön och beroenden. Extra kostnad som uppstår för virtuella Linux-datorer (den virtuella datorn kan stoppas när den inte används för att undvika avgifter). Se prisuppgifter.
Azure Databricks Perfekt för att köra storskaliga intensiva maskininlärningsarbetsflöden på den skalbara Apache Spark-plattformen. Överkvalificera för experimentell maskininlärning eller experiment och arbetsflöden i mindre skala. Extra kostnad för Azure Databricks. Se prisuppgifter.

Den här artikeln innehåller även användningstips för följande verktyg:

  • Jupyter Notebooks: Om du redan använder Jupyter Notebooks har SDK några extrafunktioner som du bör installera.

  • Visual Studio Code: Om du använder Visual Studio Code innehåller Azure Mašinsko učenje-tillägget omfattande språkstöd för Python och funktioner för att göra det mycket enklare och mer produktivt att arbeta med Azure Mašinsko učenje.

Förutsättningar

Endast lokal och DSVM: Skapa en konfigurationsfil för arbetsytan

Konfigurationsfilen för arbetsytan är en JSON-fil som talar om för SDK:t hur du kommunicerar med din Azure-Mašinsko učenje arbetsyta. Filen heter config.json och har följande format:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Den här JSON-filen måste finnas i katalogstrukturen som innehåller dina Python-skript eller Jupyter Notebooks. Den kan finnas i samma katalog, en underkatalog med namnet , eller i en överordnad .azuremlkatalog.

Använd metoden om Workspace.from_config du vill använda den här filen från koden. Den här koden läser in informationen från filen och ansluter till din arbetsyta.

Skapa en konfigurationsfil för arbetsytan i någon av följande metoder:

  • Azure Portal

    Ladda ned filen: I Azure-portalen väljer du Ladda ned config.json i avsnittet Översikt på din arbetsyta.

    Skärmbild av arbetsytans översiktssida med nedladdning config.json valt.

  • Python-SDK för Azure Machine Learning

    Skapa ett skript för att ansluta till din Azure Mašinsko učenje-arbetsyta och använd write_config metoden för att generera filen och spara den som .azureml/config.json. Se till att ersätta subscription_id,resource_group och workspace_name med din egen.

    GÄLLER FÖR: Python SDK azureml v1

    from azureml.core import Workspace
    
    subscription_id = '<subscription-id>'
    resource_group  = '<resource-group>'
    workspace_name  = '<workspace-name>'
    
    try:
        ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name)
        ws.write_config()
        print('Library configuration succeeded')
    except:
        print('Workspace not found')
    

Lokal dator eller fjärrmiljö för virtuell dator

Du kan konfigurera en miljö på en lokal dator eller en virtuell fjärrdator, till exempel en Azure-Mašinsko učenje beräkningsinstans eller en virtuell datavetenskapsdator.

Så här konfigurerar du en lokal utvecklingsmiljö eller en fjärransluten virtuell dator:

  1. Skapa en virtuell Python-miljö (virtualenv, conda).

    Kommentar

    Även om det inte krävs rekommenderar vi att du använder Anaconda eller Miniconda för att hantera virtuella Python-miljöer och installera paket.

    Viktigt!

    Om du använder Linux eller macOS och använder ett annat gränssnitt än bash (till exempel zsh) kan du få fel när du kör vissa kommandon. Du kan undvika det här problemet genom att använda bash kommandot för att starta ett nytt bash-gränssnitt och köra kommandona där.

  2. Aktivera den nya virtuella Python-miljön.

  3. Installera Azure Mašinsko učenje Python SDK.

  4. Om du vill konfigurera din lokala miljö att använda din Azure Mašinsko učenje-arbetsyta skapar du en konfigurationsfil för arbetsytan eller använder en befintlig.

Nu när du har konfigurerat din lokala miljö är du redo att börja arbeta med Azure Mašinsko učenje. Se komma igång med komma igång med Azure Mašinsko učenje Python.

Jupyter Notebook

När du kör en lokal Jupyter Notebook-server rekommenderar vi att du skapar en IPython-kernel för din virtuella Python-miljö. Detta säkerställer det förväntade beteendet för kernel- och paketimport.

  1. Aktivera miljöspecifika IPython-kernels

    conda install notebook ipykernel
    
  2. Skapa en kernel för din virtuella Python-miljö. Ersätt <myenv> med namnet på din virtuella Python-miljö.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. Starta Jupyter Notebook-servern

Se lagringsplatsen för Azure Mašinsko učenje Notebooks för att komma igång med Azure Mašinsko učenje och Jupyter Notebooks. Se även den communitydrivna lagringsplatsen AzureML-Examples.

Visual Studio-koden

Så här använder du Visual Studio Code för utveckling:

  1. Installera Visual Studio Code.

  2. Installera Tillägget Azure Mašinsko učenje Visual Studio Code (förhandsversion).

    Viktigt!

    Den här funktionen är för närvarande i allmänt tillgänglig förhandsversion. Den här förhandsversionen tillhandahålls utan ett serviceavtal och vi rekommenderar det inte för produktionsarbetsbelastningar. Vissa funktioner kanske inte stöds eller kan vara begränsade.

    Mer information finns i Kompletterande villkor för användning av Microsoft Azure-förhandsversioner.

När du har installerat Visual Studio Code-tillägget använder du det för att:

Azure Machine Learning-beräkningsinstans

Azure Mašinsko učenje-beräkningsinstansen är en säker, molnbaserad Azure-arbetsstation som ger dataforskare en Jupyter Notebook-server, JupyterLab och en fullständigt hanterad maskininlärningsmiljö.

Det finns inget att installera eller konfigurera för en beräkningsinstans.

Skapa en när som helst inifrån din Azure Mašinsko učenje-arbetsyta. Ange bara ett namn och ange en typ av virtuell Azure-dator. Prova nu med Skapa resurser för att komma igång.

Mer information om beräkningsinstanser, inklusive hur du installerar paket, finns i Skapa och hantera en Azure-Mašinsko učenje beräkningsinstans.

Dricks

Stoppa beräkningsinstansen för att förhindra kostnader för en oanvänd beräkningsinstans. Eller aktivera inaktiv avstängning för beräkningsinstansen.

Förutom en Jupyter Notebook-server och JupyterLab kan du använda beräkningsinstanser i den integrerade notebook-funktionen i Azure Mašinsko učenje Studio.

Du kan också använda Tillägget Azure Mašinsko učenje Visual Studio Code för att ansluta till en fjärrberäkningsinstans med VS Code.

Data Science Virtual Machine

Den virtuella datavetenskapsdatorn är en anpassad virtuell datoravbildning som du kan använda som utvecklingsmiljö. Den är utformad för data science-arbete som är förkonfigurerade verktyg och programvara som:

  • Paket som TensorFlow, PyTorch, Scikit-learn, XGBoost och Azure Mašinsko učenje SDK
  • Populära datavetenskapsverktyg som Spark Standalone och Drill
  • Azure-verktyg som Azure CLI, AzCopy och Storage Explorer
  • Integrerade utvecklingsmiljöer (IDE:er) som Visual Studio Code och PyCharm
  • Jupyter Notebook Server

En mer omfattande lista över verktygen finns i verktygsguiden för datavetenskapliga virtuella datorer.

Viktigt!

Om du planerar att använda den virtuella datavetenskapsdatorn som beräkningsmål för dina tränings- eller slutsatsdragningsjobb stöds endast Ubuntu.

Så här använder du den virtuella datavetenskapsdatorn som utvecklingsmiljö:

  1. Skapa en datavetenskaplig virtuell dator med någon av följande metoder:

    • Använd Azure-portalen för att skapa en Ubuntu eller Windows DSVM.

    • Skapa en datavetenskaplig virtuell dator med hjälp av ARM-mallar.

    • Använda Azure CLI

      Om du vill skapa en virtuell Ubuntu Data Science-dator använder du följande kommando:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      Om du vill skapa en Windows DSVM använder du följande kommando:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Aktivera conda-miljön som innehåller Azure Mašinsko učenje SDK.

    • För Ubuntu Data Science VM:

      conda activate py36
      
    • För virtuella Windows Data Science-datorer:

      conda activate AzureML
      
  3. Om du vill konfigurera den virtuella datavetenskapsdatorn så att den använder din Azure Mašinsko učenje-arbetsyta skapar du en konfigurationsfil för arbetsytan eller använder en befintlig.

Precis som i lokala miljöer kan du använda Visual Studio Code och Tillägget Azure Mašinsko učenje Visual Studio Code för att interagera med Azure Mašinsko učenje.

Mer information finns i Data Science Virtual Machines.

Nästa steg