Python-fejlesztési környezet beállítása az Azure Machine Learninghez (v1)
A KÖVETKEZŐKRE VONATKOZIK: Python SDK azureml v1
Megtudhatja, hogyan konfigurálhat Python-fejlesztési környezetet az Azure Machine Learninghez.
Az alábbi táblázat az ebben a cikkben tárgyalt fejlesztési környezeteket, valamint az előnyöket és hátrányokat mutatja be.
Környezet | Előnyök | Hátrányok |
---|---|---|
Helyi környezet | A fejlesztési környezet és a függőségek teljes körű felügyelete. Futtassa bármelyik tetszőleges buildelési eszközzel, környezettel vagy IDE-vel. | Az első lépések hosszabb időt vesznek igénybe. A szükséges SDK-csomagokat telepíteni kell, és egy környezetet is telepíteni kell, ha még nem rendelkezik ilyen csomaggal. |
A Adattudomány virtuális gép (DSVM) | A felhőalapú számítási példányhoz hasonlóan (a Python és az SDK előre telepítve van), de más népszerű adatelemzési és gépi tanulási eszközök is előre telepítve vannak. Egyszerűen méretezhető és kombinálható más egyéni eszközökkel és munkafolyamatokkal. | A felhőalapú számítási példányhoz képest lassabb első lépések. |
Azure Machine Learning számítási példány | Az első lépések legegyszerűbb módja. A teljes SDK már telepítve van a munkaterület virtuális gépén, és a jegyzetfüzet-oktatóanyagok előre klónozva vannak, és készen állnak a futtatásra. | A fejlesztési környezet és a függőségek szabályozásának hiánya. A Linux rendszerű virtuális gépek többletköltsége (a virtuális gép leállítható, ha nincs használatban a díjak elkerülése érdekében). Tekintse meg a díjszabást. |
Azure Databricks | Ideális nagy léptékű, intenzív gépi tanulási munkafolyamatok futtatásához a méretezhető Apache Spark platformon. | Túlméretezés kísérleti gépi tanuláshoz vagy kisebb méretű kísérletekhez és munkafolyamatokhoz. Az Azure Databricks esetében többletköltség merült fel. Tekintse meg a díjszabást. |
Ez a cikk használati tippeket is tartalmaz az alábbi eszközökhöz:
Jupyter-jegyzetfüzetek: Ha már jupyter notebookokat használ, az SDK-nak van néhány olyan extrája, amelyet telepítenie kell.
Visual Studio Code: Ha a Visual Studio Code-ot használja, az Azure Machine Learning bővítmény a Python széles körű nyelvi támogatását és funkcióit tartalmazza, hogy az Azure Machine Learning használata sokkal kényelmesebb és hatékonyabb legyen.
Előfeltételek
- Azure Machine Learning-munkaterület. Ha nem rendelkezik ilyenrel, azure Machine Learning-munkaterületet hozhat létre az Azure Portalon, az Azure CLI-vel és az Azure Resource Manager-sablonokkal.
Csak helyi és DSVM: Munkaterület konfigurációs fájljának létrehozása
A munkaterület konfigurációs fájlja egy JSON-fájl, amely közli az SDK-val, hogyan kommunikálhat az Azure Machine Learning-munkaterülettel. A fájl neve config.json, formátuma a következő:
{
"subscription_id": "<subscription-id>",
"resource_group": "<resource-group>",
"workspace_name": "<workspace-name>"
}
Ennek a JSON-fájlnak a Python-szkripteket vagy Jupyter-jegyzetfüzeteket tartalmazó könyvtárstruktúrában kell lennie. Lehet ugyanabban a könyvtárban, egy alkönyvtárban vagy .azureml
egy szülőkönyvtárban.
A fájl kódból való használatához használja a metódust Workspace.from_config
. Ez a kód betölti a fájl adatait, és csatlakozik a munkaterülethez.
Hozzon létre egy munkaterület-konfigurációs fájlt az alábbi módszerek egyikében:
Azure Portal
Töltse le a fájlt: Az Azure Portalon válassza a Config.json letöltése lehetőséget a munkaterület Áttekintés szakaszából.
Azure Machine Learning Python SDK
Hozzon létre egy szkriptet az Azure Machine Learning-munkaterülethez való csatlakozáshoz, és a
write_config
metódus használatával hozza létre a fájlt, és mentse .azureml/config.json néven. Győződjön meg arról, hogy cserélje lesubscription_id
a ,resource_group
, ésworkspace_name
a saját.A KÖVETKEZŐKRE VONATKOZIK: Python SDK azureml v1
from azureml.core import Workspace subscription_id = '<subscription-id>' resource_group = '<resource-group>' workspace_name = '<workspace-name>' try: ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name) ws.write_config() print('Library configuration succeeded') except: print('Workspace not found')
Helyi számítógép vagy távoli virtuálisgép-környezet
Beállíthat egy környezetet egy helyi számítógépen vagy távoli virtuális gépen, például egy Azure Machine Learning számítási példányon vagy Adattudomány virtuális gépen.
Helyi fejlesztési környezet vagy távoli virtuális gép konfigurálása:
Hozzon létre egy Python virtuális környezetet (virtualenv, conda).
Feljegyzés
Bár nem kötelező, javasoljuk, hogy az Anaconda vagy a Miniconda használatával kezelje a Python virtuális környezeteket, és telepítse a csomagokat.
Fontos
Ha Linuxon vagy macOS rendszeren dolgozik, és a bashtől (például zsh) eltérő rendszerhéjat használ, bizonyos parancsok futtatásakor hibaüzenetek jelenhetnek meg. A probléma megoldásához a
bash
paranccsal indítsa el az új bash-rendszerhéjat, és futtassa ott a parancsokat.Aktiválja az újonnan létrehozott Python virtuális környezetet.
Telepítse az Azure Machine Learning Python SDK-t.
Ha a helyi környezetet az Azure Machine Learning-munkaterület használatára szeretné konfigurálni, hozzon létre egy munkaterület-konfigurációs fájlt, vagy használjon egy meglévőt.
Most, hogy beállította a helyi környezetet, készen áll az Azure Machine Learning használatának megkezdésére. Az első lépésekhez tekintse meg az Azure Machine Learning Python első lépéseket ismertető útmutatóját .
Jupyter-notebookok
Helyi Jupyter Notebook-kiszolgáló futtatásakor javasoljuk, hogy hozzon létre egy IPython-kernelt a Python virtuális környezethez. Ez segít biztosítani a kernel- és csomagimportálás várt viselkedését.
Környezetspecifikus IPython-kernelek engedélyezése
conda install notebook ipykernel
Hozzon létre egy kernelt a Python virtuális környezethez. Ügyeljen arra, hogy a Python virtuális környezet nevére cserélje le a helyére
<myenv>
.ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
A Jupyter Notebook-kiszolgáló elindítása
Az Azure Machine Learning- és Jupyter-jegyzetfüzetek használatának megkezdéséhez tekintse meg az Azure Machine Learning-jegyzetfüzetek adattárát . Lásd még a közösségvezérelt adattárat, az AzureML-Példákat.
Visual Studio Code
A Visual Studio Code használata fejlesztéshez:
A Visual Studio Code telepítése.
Telepítse az Azure Machine Learning Visual Studio Code bővítményt (előzetes verzió).
Fontos
Ez a funkció jelenleg nyilvános előzetes verzióban érhető el. Ez az előzetes verzió szolgáltatásszintű szerződés nélkül érhető el, és éles számítási feladatokhoz nem javasoljuk. Előfordulhat, hogy néhány funkció nem támogatott, vagy korlátozott képességekkel rendelkezik.
További információ: Kiegészítő használati feltételek a Microsoft Azure előzetes verziójú termékeihez.
Miután telepítette a Visual Studio Code bővítményt, használja a következőre:
- Az Azure Machine Learning-erőforrások kezelése
- A Visual Studio Code távoli indítása számítási példányhoz csatlakoztatva (előzetes verzió)
- Kísérletek futtatása és hibakeresése
- Betanított modellek üzembe helyezése (CLI v2).
Azure Machine Learning számítási példány
Az Azure Machine Learning számítási példány egy biztonságos, felhőalapú Azure-munkaállomás, amely jupyter notebook-kiszolgálót, JupyterLab-kiszolgálót és teljes körűen felügyelt gépi tanulási környezetet biztosít az adattudósok számára.
Nincs mit telepíteni vagy konfigurálni egy számítási példányhoz.
Bármikor létrehozhat egyet az Azure Machine Learning-munkaterületen belül. Adjon meg egy nevet, és adjon meg egy Azure-beli virtuálisgép-típust. Próbálja ki most az Erőforrások létrehozása szolgáltatással az első lépésekhez.
Ha többet szeretne megtudni a számítási példányokról, például a csomagok telepítéséről, olvassa el az Azure Machine Learning számítási példányainak létrehozását és kezelését ismertető témakört.
Tipp.
A nem használt számítási példányok költségeinek elkerülése érdekében állítsa le a számítási példányt. Vagy engedélyezze a számítási példány tétlen leállítását .
A Jupyter Notebook-kiszolgáló és a JupyterLab mellett számítási példányokat is használhat az Azure Machine Learning Studióban található integrált notebookfunkcióban.
Az Azure Machine Learning Visual Studio Code bővítményt is használhatja egy távoli számítási példányhoz való csatlakozáshoz a VS Code használatával.
Adatelemzési virtuális gép
A Adattudomány virtuális gép egy testreszabott virtuálisgép-rendszerkép, amelyet fejlesztési környezetként használhat. Olyan adatelemzési munkákhoz készült, amelyek előre konfigurált eszközök és szoftverek, például:
- Olyan csomagok, mint a TensorFlow, a PyTorch, a Scikit-learn, az XGBoost és az Azure Machine Learning SDK
- Népszerű adatelemzési eszközök, például a Spark Önálló és a Drill
- Azure-eszközök, például az Azure CLI, az AzCopy és a Storage Explorer
- Integrált fejlesztési környezetek (IDE-k), például a Visual Studio Code és a PyCharm
- Jupyter Notebook Server
Az eszközök átfogóbb listáját a Adattudomány virtuálisgép-eszközök útmutatójában találja.
Fontos
Ha a Adattudomány virtuális gépet tervezi számítási célként használni a betanítási vagy következtetési feladatokhoz, csak az Ubuntu támogatott.
A Adattudomány virtuális gép használata fejlesztési környezetként:
Hozzon létre egy Adattudomány virtuális gépet az alábbi módszerek egyikével:
Az Azure Portal használatával hozzon létre egy Ubuntu vagy Windows DSVM-et.
Hozzon létre egy Adattudomány virtuális gépet ARM-sablonokkal.
Az Azure parancssori felületének használata
Ubuntu Adattudomány virtuális gép létrehozásához használja a következő parancsot:
# create a Ubuntu Data Science VM in your resource group # note you need to be at least a contributor to the resource group in order to execute this command successfully # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)" az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
Windows DSVM létrehozásához használja a következő parancsot:
# create a Windows Server 2016 DSVM in your resource group # note you need to be at least a contributor to the resource group in order to execute this command successfully az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
Aktiválja az Azure Machine Learning SDK-t tartalmazó Conda-környezetet.
Ubuntu Adattudomány virtuális gép esetén:
conda activate py36
Windows Adattudomány virtuális gép esetén:
conda activate AzureML
Ha a Adattudomány virtuális gépet az Azure Machine Learning-munkaterület használatára szeretné konfigurálni, hozzon létre egy munkaterület-konfigurációs fájlt, vagy használjon egy meglévőt.
A helyi környezetekhez hasonlóan használhatja a Visual Studio Code-ot és az Azure Machine Learning Visual Studio Code-bővítményt az Azure Machine Learning használatához.
További információ: Adattudomány virtuális gépek.
Következő lépések
- Modell betanítása és üzembe helyezése az Azure Machine Learningben az MNIST-adatkészlettel.
- Tekintse meg a Pythonhoz készült Azure Machine Learning SDK-t.