Skapa Azure Machine Learning-jobb

Slutförd

Det första steget för att operationalisera en maskininlärningsmodell är att köra den som ett Azure Machine Learning-jobb. Du kan köra enskilda skript som kommandojobb eller grupper av skript som ett pipelinejobb .

Data science-teamet ger dig sitt arbete i en Jupyter-anteckningsbok där data läses in, transformeras och tränas. För att förbereda koden och modellen för produktion måste du:

  • Omstrukturera anteckningsboken till skript.
  • Se skripten i jobbdefinitionen.
  • Utlös jobbet för att träna modellen.

Omstrukturera kod till skript

Om du vill göra en maskininlärningsmodell redo för produktion bör du först förbereda koden för produktion. När du har en Jupyter-notebook-fil som måste konverteras till produktionskod måste du:

  • Rensa nonessential-kod.
  • Exportera koden till Python-skript.
  • Använd funktioner i skripten.

Genom att använda funktioner i skripten blir det enklare att testa kodkvaliteten. När du har ett skript som du vill köra kan du använda ett Azure Machine Learning-jobb för att köra koden.

Definiera Azure Machine Learning-jobb

Om du vill definiera ett jobb i Azure Machine Learning kan du skapa en YAML-fil. Oavsett om du vill köra ett skript som ett kommandojobb eller flera skript sekventiellt som en pipeline. För både kommando- och pipelinejobb måste du skapa en YAML-fil med information:

  • Vilka skript som ska köras.
  • Vad indata och utdata är för varje skript.
  • Den beräkning som ska användas för att köra skripten.
  • Den miljö som måste installeras på beräkningen för att köra skripten.

Ett exempel på ett kommandojobb som använder en registrerad datatillgång som indata när skriptet main.py körs visas i följande YAML:

$schema: https://azuremlschemas.azureedge.net/latest/commandJob.schema.json
code: src
command: >-
  python main.py 
  --diabetes-csv ${{inputs.diabetes}}
inputs:
  diabetes:
    path: azureml:diabetes-data:1
    mode: ro_mount
environment: azureml:basic-env-scikit@latest
compute: azureml:aml-instance
experiment_name: diabetes-data-example
description: Train a classification model on diabetes data using a registered dataset as input.

I YAML-filen hittar du nödvändig information som du behöver inkludera:

  • code Refererar till den lokala mappen, som lagrar de skript som du vill köra. Nyckeln command anger att skriptet main.py src i mappen ska köras med hjälp av inputs.diabetes värdet för för parametern diabetes-csv .
  • Version 1 av den registrerade datatillgången diabetes-data på Azure Machine Learning-arbetsytan monteras på den beräkning som ska användas som indata för skriptet.
  • Beräkningsinstansen aml-instance används för att köra skripten.
  • Den senaste versionen av den registrerade anpassade basic-env-scikit miljön installeras på beräkningsinstansen innan skriptet körs.

Om du vill testa YAML-definitionen för jobbet kan du utlösa det med hjälp av CLI v2.

Utlösa Azure Machine Learning-jobb

När du vill köra ett Azure Machine Learning-jobb kan du använda CLI v2. CLI v2 kan installeras på din lokala enhet, eller så kan du använda Azure Cloud Shell.

Oavsett om du vill utlösa körningar från din lokala enhet eller använda Azure Cloud Shell måste du först installera Azure Machine Learning-tillägget.

Om du vill installera i Windows använder du följande kommando:

az extension add -n ml -y

När du har installerat Azure Machine Learning-tillägget för CLI och har åtkomst till den Azure-prenumeration som du vill arbeta med kan du skicka ett Azure Machine Learning-jobb med hjälp av följande kommando:

az ml job create --file job.yml

Kommentar

Mer information om hur du hanterar Azure Machine Learning-jobb med CLI (v2) finns i referensdokumentationen för az ml-jobb.