Python-fejlesztési környezet beállítása az Azure Machine Learninghez

Megtudhatja, hogyan konfigurálhat Python-fejlesztési környezetet az Azure Machine Learninghez.

Az alábbi táblázat az ebben a cikkben tárgyalt fejlesztési környezeteket, valamint az előnyöket és hátrányokat mutatja be.

Környezet Előnyök Hátrányok
Helyi környezet A fejlesztési környezet és a függőségek teljes körű felügyelete. Futtassa a parancsot bármilyen tetszőleges buildelési eszközzel, környezettel vagy IDE-vel. Az első lépések hosszabb időt vesznek igénybe. A szükséges SDK-csomagokat telepíteni kell, és egy környezetet is telepíteni kell, ha még nem rendelkezik ilyen csomaggal.
A Data Science Virtual Machine (DSVM) A felhőalapú számítási példányhoz hasonlóan (a Python előre telepítve van), de további népszerű adatelemzési és gépi tanulási eszközök is előre telepítve vannak. Egyszerűen méretezhető és kombinálható más egyéni eszközökkel és munkafolyamatokkal. A felhőalapú számítási példányhoz képest lassabb használatbavételi élmény.
Azure Machine Learning számítási példány Az első lépések legegyszerűbb módja. Az SDK már telepítve van a munkaterület virtuális gépén, és a jegyzetfüzet-oktatóanyagok előre klónozva vannak, és készen állnak a futtatásra. Nincs szabályozva a fejlesztési környezet és a függőségek felett. További költségek a Linux rendszerű virtuális gépek esetében (a virtuális gép leállítható, ha nincs használatban a díjak elkerülése érdekében). Lásd a díjszabás részleteit.

Ez a cikk további használati tippeket is tartalmaz az alábbi eszközökhöz:

  • Jupyter-notebookok: Ha már jupyter notebookokat használ, az SDK-nak van néhány olyan extrát tartalmazó része, amelyet telepítenie kell.

  • Visual Studio Code: Ha a Visual Studio Code-ot használja, az Azure Machine Learning-bővítmény nyelvi támogatást nyújt a Pythonhoz, valamint olyan funkciókat, amelyekkel az Azure Machine Learning használata sokkal kényelmesebb és hatékonyabb lesz.

Előfeltételek

Csak helyi és DSVM: Munkaterület konfigurációs fájljának létrehozása

A munkaterület konfigurációs fájlja egy JSON-fájl, amely közli az SDK-val, hogyan kommunikálhat az Azure Machine Learning-munkaterülettel. A fájl neve config.json, formátuma a következő:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Ennek a JSON-fájlnak a Python-szkripteket vagy Jupyter-jegyzetfüzeteket tartalmazó könyvtárstruktúrában kell lennie. Lehet ugyanabban a könyvtárban, egy.azureml* nevű alkönyvtárban vagy egy szülőkönyvtárban.

A fájl kódból való használatához használja a metódust MLClient.from_config . Ez a kód betölti az adatokat a fájlból, és csatlakozik a munkaterülethez.

Hozzon létre egy munkaterület-konfigurációs fájlt az alábbi módszerek egyikében:

  • Azure Machine Learning Studio

    Töltse le a fájlt:

    1. Bejelentkezés a Azure Machine Learning stúdió
    2. A jobb felső Azure Machine Learning stúdió eszköztáron válassza ki a munkaterület nevét.
    3. Válassza a Konfigurációs fájl letöltése hivatkozást.

    Képernyőkép a konfigurációs fájl letöltéséről.

  • Azure Machine Learning Python SDK

    Hozzon létre egy szkriptet az Azure Machine Learning-munkaterülethez való csatlakozáshoz. Mindenképpen cserélje le subscription_ida ,resource_group, és workspace_name a sajátját.

    A KÖVETKEZŐKRE VONATKOZIK: Python SDK azure-ai-ml v2 (aktuális)

    #import required libraries
    from azure.ai.ml import MLClient
    from azure.identity import DefaultAzureCredential
    
    #Enter details of your Azure Machine Learning workspace
    subscription_id = '<SUBSCRIPTION_ID>'
    resource_group = '<RESOURCE_GROUP>'
    workspace = '<AZUREML_WORKSPACE_NAME>'
    
    #connect to the workspace
    ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
    

Helyi számítógép vagy távoli virtuálisgép-környezet

Beállíthat egy környezetet egy helyi számítógépen vagy távoli virtuális gépen, például egy Azure Machine Learning számítási példányon vagy Adattudomány virtuális gépen.

Helyi fejlesztési környezet vagy távoli virtuális gép konfigurálása:

  1. Hozzon létre egy Python virtuális környezetet (virtualenv, conda).

    Megjegyzés

    Bár nem szükséges, javasoljuk, hogy az Anaconda vagy a Miniconda használatával kezelje a Python virtuális környezeteket, és telepítse a csomagokat.

    Fontos

    Ha Linuxon vagy macOS-en dolgozik, és a bashtől (például zsh) eltérő rendszerhéjat használ, egyes parancsok futtatásakor hibaüzenetek jelenhetnek meg. A probléma megkerüléséhez a bash paranccsal indítsa el az új Bash-rendszerhéjat, és futtassa ott a parancsokat.

  2. Aktiválja az újonnan létrehozott Python virtuális környezetet.

  3. Telepítse az Azure Machine Learning Python SDK-t.

  4. Ha a helyi környezetet az Azure Machine Learning-munkaterület használatára szeretné konfigurálni, hozzon létre egy munkaterület konfigurációs fájlját , vagy használjon egy meglévőt.

Most, hogy beállította a helyi környezetet, készen áll az Azure Machine Learning használatának megkezdésére. Az első lépésekhez tekintse meg az Azure Machine Learning egy nap alatt című oktatóanyagot .

Jupyter-notebookok

Helyi Jupyter Notebook-kiszolgáló futtatásakor javasoljuk, hogy hozzon létre egy IPython-kernelt a Python virtuális környezetéhez. Ez segít biztosítani a kernel- és csomagimportálás várt viselkedését.

  1. Környezetspecifikus IPython-kernelek engedélyezése

    conda install notebook ipykernel
    
  2. Hozzon létre egy kernelt a Python virtuális környezetéhez. Ügyeljen arra, hogy a helyére <myenv> írja be a Python virtuális környezet nevét.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. Indítsa el a Jupyter Notebook kiszolgálót

Tipp

Például a jegyzetfüzeteket lásd az AzureML-Examples adattárban. Az SDK-példák az /sdk/python területen találhatók. Példa a Konfigurációs jegyzetfüzetre .

Visual Studio Code

A Visual Studio Code használata fejlesztéshez:

  1. Telepítse a Visual Studio Code-ot.
  2. Telepítse az Azure Machine Learning Visual Studio Code bővítményt (előzetes verzió).

Miután telepítette a Visual Studio Code bővítményt, használja a következőre:

Azure Machine Learning számítási példány

Az Azure Machine Learning számítási példánya egy biztonságos, felhőalapú Azure-munkaállomás, amely adatelemzők számára biztosít egy Jupyter Notebook kiszolgálót, a JupyterLabot és egy teljes mértékben felügyelt gépi tanulási környezetet.

Nincs mit telepíteni vagy konfigurálni egy számítási példányhoz.

Bármikor létrehozhat egyet az Azure Machine Learning-munkaterületen belül. Adjon meg csak egy nevet, és adjon meg egy Azure-beli virtuálisgép-típust. Próbálja ki most az Erőforrások létrehozása paranccsal az első lépésekhez.

Ha többet szeretne megtudni a számítási példányokról, beleértve a csomagok telepítését is, olvassa el az Azure Machine Learning számítási példányának létrehozása című témakört.

Tipp

A nem használt számítási példányok díjainak elkerülése érdekében engedélyezze a tétlen leállítást.

A Jupyter Notebook-kiszolgáló és a JupyterLab mellett számítási példányokat is használhat a Azure Machine Learning stúdió beépített jegyzetfüzet-funkciójában.

Az Azure Machine Learning Visual Studio Code bővítményével is csatlakozhat egy távoli számítási példányhoz a VS Code használatával.

Adatelemzési virtuális gép

A Adattudomány virtuális gép egy testre szabott virtuálisgép-rendszerkép, amelyet fejlesztési környezetként használhat. Olyan adatelemzési munkákhoz készült, amelyek előre konfigurált eszközök és szoftverek, például:

  • Olyan csomagok, mint a TensorFlow, a PyTorch, a Scikit-learn, az XGBoost és az Azure Machine Learning SDK
  • Népszerű adatelemzési eszközök, például a Spark Önálló és a Részletezés
  • Olyan Azure-eszközök, mint az Azure CLI, az AzCopy és a Storage Explorer
  • Integrált fejlesztési környezetek (IDE-k), például Visual Studio Code és PyCharm
  • Jupyter Notebook-kiszolgáló

Az eszközök átfogóbb listáját a Adattudomány virtuálisgép-eszközök útmutatójában találja.

Fontos

Ha a Adattudomány virtuális gépet tervezi számítási célként használni a betanítási vagy következtetési feladatokhoz, csak az Ubuntu támogatott.

A Adattudomány virtuális gép használata fejlesztési környezetként:

  1. Hozzon létre egy Adattudomány virtuális gépet az alábbi módszerek egyikével:

    • Az Azure Portal használatával hozzon létre egy Ubuntu- vagy Windows DSVM-et.

    • Hozzon létre egy Adattudomány virtuális gépet ARM-sablonokkal.

    • Az Azure parancssori felületének használata

      Ubuntu Adattudomány virtuális gép létrehozásához használja a következő parancsot:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      Windows DSVM létrehozásához használja a következő parancsot:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Conda-környezet létrehozása az Azure Machine Learning SDK-hoz:

    conda create -n py310 python=310
    
  3. A környezet létrehozása után aktiválja és telepítse az SDK-t

    conda activate py310
    pip install azure-ai-ml azure-identity
    
  4. A Adattudomány virtuális gép Azure Machine Learning-munkaterület használatára való konfigurálásához hozzon létre egy munkaterület-konfigurációs fájlt, vagy használjon egy meglévőt.

    Tipp

    A helyi környezetekhez hasonlóan a Visual Studio Code-ot és az Azure Machine Learning Visual Studio Code-bővítményt is használhatja az Azure Machine Learning használatához.

    További információ: Adattudomány Virtual Machines.

Következő lépések