Megosztás a következőn keresztül:


Python-fejlesztési környezet beállítása az Azure Machine Learninghez (v1)

A KÖVETKEZŐKRE VONATKOZIK: Python SDK azureml v1

Megtudhatja, hogyan konfigurálhat Python-fejlesztési környezetet az Azure Machine Learninghez.

Az alábbi táblázat az ebben a cikkben tárgyalt fejlesztési környezeteket, valamint az előnyöket és hátrányokat mutatja be.

Környezet Előnyök Hátrányok
Helyi környezet A fejlesztési környezet és a függőségek teljes körű felügyelete. Futtassa bármelyik tetszőleges buildelési eszközzel, környezettel vagy IDE-vel. Az első lépések hosszabb időt vesznek igénybe. A szükséges SDK-csomagokat telepíteni kell, és egy környezetet is telepíteni kell, ha még nem rendelkezik ilyen csomaggal.
A Adattudomány virtuális gép (DSVM) A felhőalapú számítási példányhoz hasonlóan (a Python és az SDK előre telepítve van), de más népszerű adatelemzési és gépi tanulási eszközök is előre telepítve vannak. Egyszerűen méretezhető és kombinálható más egyéni eszközökkel és munkafolyamatokkal. A felhőalapú számítási példányhoz képest lassabb első lépések.
Azure Machine Learning számítási példány Az első lépések legegyszerűbb módja. A teljes SDK már telepítve van a munkaterület virtuális gépén, és a jegyzetfüzet-oktatóanyagok előre klónozva vannak, és készen állnak a futtatásra. A fejlesztési környezet és a függőségek szabályozásának hiánya. A Linux rendszerű virtuális gépek többletköltsége (a virtuális gép leállítható, ha nincs használatban a díjak elkerülése érdekében). Tekintse meg a díjszabást.
Azure Databricks Ideális nagy léptékű, intenzív gépi tanulási munkafolyamatok futtatásához a méretezhető Apache Spark platformon. Túlméretezés kísérleti gépi tanuláshoz vagy kisebb méretű kísérletekhez és munkafolyamatokhoz. Az Azure Databricks esetében többletköltség merült fel. Tekintse meg a díjszabást.

Ez a cikk használati tippeket is tartalmaz az alábbi eszközökhöz:

  • Jupyter-jegyzetfüzetek: Ha már jupyter notebookokat használ, az SDK-nak van néhány olyan extrája, amelyet telepítenie kell.

  • Visual Studio Code: Ha a Visual Studio Code-ot használja, az Azure Machine Learning bővítmény a Python széles körű nyelvi támogatását és funkcióit tartalmazza, hogy az Azure Machine Learning használata sokkal kényelmesebb és hatékonyabb legyen.

Előfeltételek

Csak helyi és DSVM: Munkaterület konfigurációs fájljának létrehozása

A munkaterület konfigurációs fájlja egy JSON-fájl, amely közli az SDK-val, hogyan kommunikálhat az Azure Machine Learning-munkaterülettel. A fájl neve config.json, formátuma a következő:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Ennek a JSON-fájlnak a Python-szkripteket vagy Jupyter-jegyzetfüzeteket tartalmazó könyvtárstruktúrában kell lennie. Lehet ugyanabban a könyvtárban, egy alkönyvtárban vagy .azuremlegy szülőkönyvtárban.

A fájl kódból való használatához használja a metódust Workspace.from_config . Ez a kód betölti a fájl adatait, és csatlakozik a munkaterülethez.

Hozzon létre egy munkaterület-konfigurációs fájlt az alábbi módszerek egyikében:

  • Azure Portal

    Töltse le a fájlt: Az Azure Portalon válassza a Config.json letöltése lehetőséget a munkaterület Áttekintés szakaszából.

    Képernyőkép a munkaterület áttekintési oldaláról, amelyen a letöltési config.json van kiválasztva.

  • Azure Machine Learning Python SDK

    Hozzon létre egy szkriptet az Azure Machine Learning-munkaterülethez való csatlakozáshoz, és a write_config metódus használatával hozza létre a fájlt, és mentse .azureml/config.json néven. Győződjön meg arról, hogy cserélje le subscription_ida ,resource_group, és workspace_name a saját.

    A KÖVETKEZŐKRE VONATKOZIK: Python SDK azureml v1

    from azureml.core import Workspace
    
    subscription_id = '<subscription-id>'
    resource_group  = '<resource-group>'
    workspace_name  = '<workspace-name>'
    
    try:
        ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name)
        ws.write_config()
        print('Library configuration succeeded')
    except:
        print('Workspace not found')
    

Helyi számítógép vagy távoli virtuálisgép-környezet

Beállíthat egy környezetet egy helyi számítógépen vagy távoli virtuális gépen, például egy Azure Machine Learning számítási példányon vagy Adattudomány virtuális gépen.

Helyi fejlesztési környezet vagy távoli virtuális gép konfigurálása:

  1. Hozzon létre egy Python virtuális környezetet (virtualenv, conda).

    Feljegyzés

    Bár nem kötelező, javasoljuk, hogy az Anaconda vagy a Miniconda használatával kezelje a Python virtuális környezeteket, és telepítse a csomagokat.

    Fontos

    Ha Linuxon vagy macOS rendszeren dolgozik, és a bashtől (például zsh) eltérő rendszerhéjat használ, bizonyos parancsok futtatásakor hibaüzenetek jelenhetnek meg. A probléma megoldásához a bash paranccsal indítsa el az új bash-rendszerhéjat, és futtassa ott a parancsokat.

  2. Aktiválja az újonnan létrehozott Python virtuális környezetet.

  3. Telepítse az Azure Machine Learning Python SDK-t.

  4. Ha a helyi környezetet az Azure Machine Learning-munkaterület használatára szeretné konfigurálni, hozzon létre egy munkaterület-konfigurációs fájlt, vagy használjon egy meglévőt.

Most, hogy beállította a helyi környezetet, készen áll az Azure Machine Learning használatának megkezdésére. Az első lépésekhez tekintse meg az Azure Machine Learning Python első lépéseket ismertető útmutatóját .

Jupyter-notebookok

Helyi Jupyter Notebook-kiszolgáló futtatásakor javasoljuk, hogy hozzon létre egy IPython-kernelt a Python virtuális környezethez. Ez segít biztosítani a kernel- és csomagimportálás várt viselkedését.

  1. Környezetspecifikus IPython-kernelek engedélyezése

    conda install notebook ipykernel
    
  2. Hozzon létre egy kernelt a Python virtuális környezethez. Ügyeljen arra, hogy a Python virtuális környezet nevére cserélje le a helyére <myenv> .

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. A Jupyter Notebook-kiszolgáló elindítása

Az Azure Machine Learning- és Jupyter-jegyzetfüzetek használatának megkezdéséhez tekintse meg az Azure Machine Learning-jegyzetfüzetek adattárát . Lásd még a közösségvezérelt adattárat, az AzureML-Példákat.

Visual Studio Code

A Visual Studio Code használata fejlesztéshez:

  1. A Visual Studio Code telepítése.

  2. Telepítse az Azure Machine Learning Visual Studio Code bővítményt (előzetes verzió).

    Fontos

    Ez a funkció jelenleg nyilvános előzetes verzióban érhető el. Ez az előzetes verzió szolgáltatásszintű szerződés nélkül érhető el, és éles számítási feladatokhoz nem javasoljuk. Előfordulhat, hogy néhány funkció nem támogatott, vagy korlátozott képességekkel rendelkezik.

    További információ: Kiegészítő használati feltételek a Microsoft Azure előzetes verziójú termékeihez.

Miután telepítette a Visual Studio Code bővítményt, használja a következőre:

Azure Machine Learning számítási példány

Az Azure Machine Learning számítási példány egy biztonságos, felhőalapú Azure-munkaállomás, amely jupyter notebook-kiszolgálót, JupyterLab-kiszolgálót és teljes körűen felügyelt gépi tanulási környezetet biztosít az adattudósok számára.

Nincs mit telepíteni vagy konfigurálni egy számítási példányhoz.

Bármikor létrehozhat egyet az Azure Machine Learning-munkaterületen belül. Adjon meg egy nevet, és adjon meg egy Azure-beli virtuálisgép-típust. Próbálja ki most az Erőforrások létrehozása szolgáltatással az első lépésekhez.

Ha többet szeretne megtudni a számítási példányokról, például a csomagok telepítéséről, olvassa el az Azure Machine Learning számítási példányainak létrehozását és kezelését ismertető témakört.

A Jupyter Notebook-kiszolgáló és a JupyterLab mellett számítási példányokat is használhat az Azure Machine Learning Studióban található integrált notebookfunkcióban.

Az Azure Machine Learning Visual Studio Code bővítményt is használhatja egy távoli számítási példányhoz való csatlakozáshoz a VS Code használatával.

Adatelemzési virtuális gép

A Adattudomány virtuális gép egy testreszabott virtuálisgép-rendszerkép, amelyet fejlesztési környezetként használhat. Olyan adatelemzési munkákhoz készült, amelyek előre konfigurált eszközök és szoftverek, például:

  • Olyan csomagok, mint a TensorFlow, a PyTorch, a Scikit-learn, az XGBoost és az Azure Machine Learning SDK
  • Népszerű adatelemzési eszközök, például a Spark Önálló és a Drill
  • Azure-eszközök, például az Azure CLI, az AzCopy és a Storage Explorer
  • Integrált fejlesztési környezetek (IDE-k), például a Visual Studio Code és a PyCharm
  • Jupyter Notebook Server

Az eszközök átfogóbb listáját a Adattudomány virtuálisgép-eszközök útmutatójában találja.

Fontos

Ha a Adattudomány virtuális gépet tervezi számítási célként használni a betanítási vagy következtetési feladatokhoz, csak az Ubuntu támogatott.

A Adattudomány virtuális gép használata fejlesztési környezetként:

  1. Hozzon létre egy Adattudomány virtuális gépet az alábbi módszerek egyikével:

    • Az Azure Portal használatával hozzon létre egy Ubuntu vagy Windows DSVM-et.

    • Hozzon létre egy Adattudomány virtuális gépet ARM-sablonokkal.

    • Az Azure parancssori felületének használata

      Ubuntu Adattudomány virtuális gép létrehozásához használja a következő parancsot:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      Windows DSVM létrehozásához használja a következő parancsot:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Aktiválja az Azure Machine Learning SDK-t tartalmazó Conda-környezetet.

    • Ubuntu Adattudomány virtuális gép esetén:

      conda activate py36
      
    • Windows Adattudomány virtuális gép esetén:

      conda activate AzureML
      
  3. Ha a Adattudomány virtuális gépet az Azure Machine Learning-munkaterület használatára szeretné konfigurálni, hozzon létre egy munkaterület-konfigurációs fájlt, vagy használjon egy meglévőt.

A helyi környezetekhez hasonlóan használhatja a Visual Studio Code-ot és az Azure Machine Learning Visual Studio Code-bővítményt az Azure Machine Learning használatához.

További információ: Adattudomány virtuális gépek.

Következő lépések