Azure Machine-Tanulás-feladatok létrehozása

Befejeződött

A gépi tanulási modellek üzembe helyezése első lépéseként azure-beli gépi Tanulás feladatként kell futtatni. Az egyes szkripteket parancsfeladatként vagy parancsfájlcsoportokként futtathatja folyamatfeladatként.

Az adatelemzési csapat egy Jupyter-jegyzetfüzetben végzi munkáját, amelyben az adatok betöltése, átalakítása és betanítása történik. A kód és a modell éles környezethez való előkészítéséhez a következőkre lesz szükség:

  • A jegyzetfüzet újrabontása szkriptekké.
  • Tekintse meg a feladatdefinícióban található szkript(ek)et.
  • Indítsa el a feladatot a modell betanítása érdekében.

Kód újrabontása szkriptek számára

Ahhoz, hogy egy gépi tanulási modell éles használatra kész legyen, először éles környezetben kell előkészíteni a kódot. Ha olyan Jupyter-jegyzetfüzete van, amelyet éles kóddá kell konvertálnia, a következőkre lesz szüksége:

  • Törölje a nem lényeges kódot.
  • Exportálja a kódot Python-szkriptekbe.
  • Függvények használata a szkriptekben.

Ha függvényeket használ a szkriptekben, könnyebben tesztelheti a kód minőségét. Ha van egy szkriptje, amelyet végre szeretne hajtani, egy Azure Machine-Tanulás feladat használatával futtathatja a kódot.

Azure Machine-Tanulás-feladat definiálása

A feladat Azure Machine-Tanulás való definiálásához létrehozhat egy YAML-fájlt. Akár parancsfeladatként szeretne futtatni egy szkriptet, akár több szkriptet egymás után, folyamatként. A parancs- és folyamatfeladatokhoz is létre kell hoznia egy YAML-fájlt, amely a következő részleteket tartalmazza:

  • Mely szkripteket kell futtatni.
  • Az egyes szkriptekhez tartozó bemenetek és kimenetek.
  • A szkriptek futtatásához használt számítás.
  • Az a környezet, amelyet telepíteni kell a számításra a szkriptek futtatásához.

Egy példa egy parancsfeladatra, amely egy regisztrált adategységet használ bemenetként a szkript futtatásakor, main.py az alábbi YAML-ben látható:

$schema: https://azuremlschemas.azureedge.net/latest/commandJob.schema.json
code: src
command: >-
  python main.py 
  --diabetes-csv ${{inputs.diabetes}}
inputs:
  diabetes:
    path: azureml:diabetes-data:1
    mode: ro_mount
environment: azureml:basic-env-scikit@latest
compute: azureml:aml-instance
experiment_name: diabetes-data-example
description: Train a classification model on diabetes data using a registered dataset as input.

A YAML-fájlban megtalálja a szükséges adatokat, amelyekre szüksége van:

  • Ez code a helyi mappára hivatkozik, amely tárolja a futtatni kívánt szkripteket. A command kulcs azt határozza meg, hogy a main.py src mappában lévő szkriptet végre kell hajtani a paraméter értékének inputs.diabetes diabetes-csv használatával.
  • Az Azure Machine Tanulás-munkaterület regisztrált adategységének diabetes-data 1. verziója a szkript bemeneteként használandó számításhoz van csatlakoztatva.
  • A számítási példány aml-instance a szkriptek futtatására lesz használva.
  • A szkript futtatása előtt a regisztrált egyéni basic-env-scikit környezet legújabb verziója lesz telepítve a számítási példányra.

A feladat YAML-definíciójának teszteléséhez a cli v2 használatával aktiválhatja azt.

Azure Machine Tanulás feladat aktiválása

Amikor Azure Machine Tanulás feladatot szeretne futtatni, használhatja a CLI v2-t. A CLI v2 telepíthető a helyi eszközre, vagy használhatja az Azure Cloud Shellt.

Akár a helyi eszközről, akár az Azure Cloud Shell használatával szeretné aktiválni a futtatásokat, először telepítenie kell az Azure Machine Tanulás bővítményt.

Windows rendszeren való telepítéshez használja a következő parancsot:

az extension add -n ml -y

Miután telepítette az Azure Machine Tanulás bővítményt a parancssori felülethez, és hozzáfér a használni kívánt Azure-előfizetéshez, az alábbi paranccsal küldhet be egy Azure Machine Tanulás feladatot:

az ml job create --file job.yml

Megjegyzés:

Az Azure Machine Tanulás feladatok parancssori felülettel (v2) való kezelésével kapcsolatos további információkért tekintse meg az ml-feladatok referenciadokumentációját.