Azure Machine-Tanulás-feladatok létrehozása
A gépi tanulási modellek üzembe helyezése első lépéseként azure-beli gépi Tanulás feladatként kell futtatni. Az egyes szkripteket parancsfeladatként vagy parancsfájlcsoportokként futtathatja folyamatfeladatként.
Az adatelemzési csapat egy Jupyter-jegyzetfüzetben végzi munkáját, amelyben az adatok betöltése, átalakítása és betanítása történik. A kód és a modell éles környezethez való előkészítéséhez a következőkre lesz szükség:
- A jegyzetfüzet újrabontása szkriptekké.
- Tekintse meg a feladatdefinícióban található szkript(ek)et.
- Indítsa el a feladatot a modell betanítása érdekében.
Kód újrabontása szkriptek számára
Ahhoz, hogy egy gépi tanulási modell éles használatra kész legyen, először éles környezetben kell előkészíteni a kódot. Ha olyan Jupyter-jegyzetfüzete van, amelyet éles kóddá kell konvertálnia, a következőkre lesz szüksége:
- Törölje a nem lényeges kódot.
- Exportálja a kódot Python-szkriptekbe.
- Függvények használata a szkriptekben.
Ha függvényeket használ a szkriptekben, könnyebben tesztelheti a kód minőségét. Ha van egy szkriptje, amelyet végre szeretne hajtani, egy Azure Machine-Tanulás feladat használatával futtathatja a kódot.
Azure Machine-Tanulás-feladat definiálása
A feladat Azure Machine-Tanulás való definiálásához létrehozhat egy YAML-fájlt. Akár parancsfeladatként szeretne futtatni egy szkriptet, akár több szkriptet egymás után, folyamatként. A parancs- és folyamatfeladatokhoz is létre kell hoznia egy YAML-fájlt, amely a következő részleteket tartalmazza:
- Mely szkripteket kell futtatni.
- Az egyes szkriptekhez tartozó bemenetek és kimenetek.
- A szkriptek futtatásához használt számítás.
- Az a környezet, amelyet telepíteni kell a számításra a szkriptek futtatásához.
Egy példa egy parancsfeladatra, amely egy regisztrált adategységet használ bemenetként a szkript futtatásakor, main.py
az alábbi YAML-ben látható:
$schema: https://azuremlschemas.azureedge.net/latest/commandJob.schema.json
code: src
command: >-
python main.py
--diabetes-csv ${{inputs.diabetes}}
inputs:
diabetes:
path: azureml:diabetes-data:1
mode: ro_mount
environment: azureml:basic-env-scikit@latest
compute: azureml:aml-instance
experiment_name: diabetes-data-example
description: Train a classification model on diabetes data using a registered dataset as input.
A YAML-fájlban megtalálja a szükséges adatokat, amelyekre szüksége van:
- Ez
code
a helyi mappára hivatkozik, amely tárolja a futtatni kívánt szkripteket. Acommand
kulcs azt határozza meg, hogy amain.py
src
mappában lévő szkriptet végre kell hajtani a paraméter értékénekinputs.diabetes
diabetes-csv
használatával. - Az Azure Machine Tanulás-munkaterület regisztrált adategységének
diabetes-data
1. verziója a szkript bemeneteként használandó számításhoz van csatlakoztatva. - A számítási példány
aml-instance
a szkriptek futtatására lesz használva. - A szkript futtatása előtt a regisztrált egyéni
basic-env-scikit
környezet legújabb verziója lesz telepítve a számítási példányra.
A feladat YAML-definíciójának teszteléséhez a cli v2 használatával aktiválhatja azt.
Azure Machine Tanulás feladat aktiválása
Amikor Azure Machine Tanulás feladatot szeretne futtatni, használhatja a CLI v2-t. A CLI v2 telepíthető a helyi eszközre, vagy használhatja az Azure Cloud Shellt.
Akár a helyi eszközről, akár az Azure Cloud Shell használatával szeretné aktiválni a futtatásokat, először telepítenie kell az Azure Machine Tanulás bővítményt.
Windows rendszeren való telepítéshez használja a következő parancsot:
az extension add -n ml -y
Miután telepítette az Azure Machine Tanulás bővítményt a parancssori felülethez, és hozzáfér a használni kívánt Azure-előfizetéshez, az alábbi paranccsal küldhet be egy Azure Machine Tanulás feladatot:
az ml job create --file job.yml
Megjegyzés:
Az Azure Machine Tanulás feladatok parancssori felülettel (v2) való kezelésével kapcsolatos további információkért tekintse meg az ml-feladatok referenciadokumentációját.