Modellen trainen met de Azure Machine Learning Python SDK (v1)

Artikel
09/01/2024

VAN TOEPASSING OP: Python SDK azureml v1

Meer informatie over het koppelen van Azure-rekenresources aan uw Azure Machine Learning-werkruimte met SDK v1. Vervolgens kunt u deze resources gebruiken als trainings- en deductie-rekendoelen in uw machine learning-taken.

In dit artikel leert u hoe u uw werkruimte instelt voor het gebruik van deze rekenresources:

Uw lokale computer
Externe virtuele machines
Apache Spark-pools (mogelijk gemaakt door Azure Synapse Analytics)
Azure HDInsight
Azure Batch
Azure Databricks- wordt alleen gebruikt als trainingsrekendoel in machine learning-pijplijnen
Azure Data Lake Analytics
Azure Container Instance
Azure Machine Learning Kubernetes

Als u rekendoelen wilt gebruiken die worden beheerd door Azure Machine Learning, raadpleegt u:

Belangrijk

Items in dit artikel die zijn gemarkeerd als 'preview', zijn momenteel beschikbaar als openbare preview. De preview-versie wordt aangeboden zonder Service Level Agreement en wordt niet aanbevolen voor productieworkloads. Misschien worden bepaalde functies niet ondersteund of zijn de mogelijkheden ervan beperkt. Zie Aanvullende gebruiksvoorwaarden voor Microsoft Azure-previews voor meer informatie.

Vereisten

Een Azure Machine Learning-werkruimte. Zie Werkruimteresources maken voor meer informatie.
De Azure CLI-extensie voor Machine Learning Service, Azure Machine Learning Python SDK of de Azure Machine Learning Visual Studio Code-extensie.

Beperkingen

Maak niet meerdere, gelijktijdige bijlagen naar dezelfde rekenkracht vanuit uw werkruimte. Als u bijvoorbeeld één Azure Kubernetes Service-cluster koppelt aan een werkruimte met twee verschillende namen. Elke nieuwe bijlage breekt de vorige bestaande bijlagen op.

Als u een rekendoel opnieuw wilt koppelen, bijvoorbeeld om tls of een andere clusterconfiguratie-instelling te wijzigen, moet u eerst de bestaande bijlage verwijderen.

Wat is een rekendoel?

Met Azure Machine Learning kunt u uw model trainen op verschillende resources of omgevingen, gezamenlijk rekendoelen genoemd. Een rekendoel kan een lokale machine of een cloudresource zijn, zoals een Azure Machine Learning Compute, Azure HDInsight of een externe virtuele machine. U gebruikt ook rekendoelen voor modelimplementatie, zoals beschreven in 'Waar en hoe u uw modellen implementeert'.

Lokale computer

Wanneer u uw lokale computer gebruikt voor training, hoeft u geen rekendoel te maken. Verzend de trainingsuitvoering gewoon vanaf uw lokale computer.

Wanneer u uw lokale computer gebruikt voor deductie, moet Docker zijn geïnstalleerd. Als u de implementatie wilt uitvoeren, gebruikt u LocalWebservice.deploy_configuration() om de poort te definiëren die door de webservice wordt gebruikt. Gebruik vervolgens het normale implementatieproces zoals beschreven in Modellen implementeren met Azure Machine Learning.

Externe virtuele machines

Azure Machine Learning biedt ook ondersteuning voor het koppelen van een virtuele Azure-machine. De VM moet een Azure Data Science Virtual Machine (DSVM) zijn. De VM biedt een samengestelde keuze aan hulpprogramma's en frameworks voor machine learning-ontwikkeling in de volledige levenscyclus. Zie Een ontwikkelomgeving configureren voor meer informatie over het gebruik van de DSVM met Azure Machine Learning.

Tip

In plaats van een externe VM raden we u aan het Azure Machine Learning-rekenproces te gebruiken. Het is een volledig beheerde, cloudgebaseerde rekenoplossing die specifiek is voor Azure Machine Learning. Zie Azure Machine Learning-rekenproces maken en beheren voor meer informatie.

Maken: Azure Machine Learning kan geen externe VM voor u maken. In plaats daarvan moet u de virtuele machine maken en deze vervolgens koppelen aan uw Azure Machine Learning-werkruimte. Zie De Datawetenschap virtuele machine inrichten voor Linux (Ubuntu) voor meer informatie over het maken van een DSVM.

Waarschuwing

Azure Machine Learning ondersteunt alleen virtuele machines waarop Ubuntu wordt uitgevoerd. Wanneer u een virtuele machine maakt of een bestaande VM kiest, moet u een VM selecteren die gebruikmaakt van Ubuntu.

Azure Machine Learning vereist ook dat de virtuele machine een openbaar IP-adres heeft.
Koppelen: Koppel de DSVM aan uw werkruimte met behulp van Azure Machine Learning-studio.

Waarschuwing

Maak niet meerdere, gelijktijdige bijlagen met dezelfde DSVM vanuit uw werkruimte. Elke nieuwe bijlage breekt de vorige bestaande bijlagen op.

Configureren: Maak een uitvoeringsconfiguratie voor het DSVM-rekendoel. Docker en conda worden gebruikt voor het maken en configureren van de trainingsomgeving op de DSVM.

from azureml.core import ScriptRunConfig
from azureml.core.environment import Environment
from azureml.core.conda_dependencies import CondaDependencies

# Create environment
myenv = Environment(name="myenv")

# Specify the conda dependencies
myenv.python.conda_dependencies = CondaDependencies.create(conda_packages=['scikit-learn'])

# If no base image is explicitly specified the default CPU image "azureml.core.runconfig.DEFAULT_CPU_IMAGE" will be used
# To use GPU in DSVM, you should specify the default GPU base Docker image or another GPU-enabled image:
# myenv.docker.enabled = True
# myenv.docker.base_image = azureml.core.runconfig.DEFAULT_GPU_IMAGE

# Configure the run configuration with the Linux DSVM as the compute target and the environment defined above
src = ScriptRunConfig(source_directory=".", script="train.py", compute_target=compute, environment=myenv)

Tip

Als u een VIRTUELE machine uit uw werkruimte wilt verwijderen (loskoppelen), gebruikt u de methode RemoteCompute.detach().

Azure Machine Learning verwijdert de VM niet voor u. U moet de VM handmatig verwijderen met behulp van de Azure Portal, CLI of de SDK voor Azure VM.

Apache Spark-pools

Met de integratie van Azure Synapse Analytics met Azure Machine Learning (preview) kunt u een Apache Spark-pool koppelen die wordt ondersteund door Azure Synapse voor interactieve gegevensverkenning en -voorbereiding. Met deze integratie kunt u een toegewezen rekenproces voor gegevens op schaal hebben. Zie Apache Spark-pools koppelen die worden mogelijk gemaakt door Azure Synapse Analytics voor meer informatie.

Azure HDInsight

Azure HDInsight is een populair platform voor big data-analyses. Het platform biedt Apache Spark, dat kan worden gebruikt om uw model te trainen.

Maken: Azure Machine Learning kan geen HDInsight-cluster voor u maken. In plaats daarvan moet u het cluster maken en vervolgens koppelen aan uw Azure Machine Learning-werkruimte. Zie Een Spark-cluster maken in HDInsight voor meer informatie.

Waarschuwing

Voor Azure Machine Learning moet het HDInsight-cluster een openbaar IP-adres hebben.

Wanneer u het cluster maakt, moet u een SSH-gebruikersnaam en -wachtwoord opgeven. Noteer deze waarden, omdat u ze nodig hebt om HDInsight te gebruiken als rekendoel.

Nadat het cluster is gemaakt, maakt u er verbinding mee met de hostnaamclusternaam-ssh.azurehdinsight.net<, waarbij <clusternaam>> de naam is die u hebt opgegeven voor het cluster.
Koppelen: koppel het HDInsight-cluster aan uw werkruimte met behulp van Azure Machine Learning-studio.

Waarschuwing

Maak niet meerdere, gelijktijdige bijlagen naar hetzelfde HDInsight vanuit uw werkruimte. Elke nieuwe bijlage breekt de vorige bestaande bijlagen op.

Configureren: Maak een uitvoeringsconfiguratie voor het HDI-rekendoel.

from azureml.core.runconfig import RunConfiguration
from azureml.core.conda_dependencies import CondaDependencies


# use pyspark framework
run_hdi = RunConfiguration(framework="pyspark")

# Set compute target to the HDI cluster
run_hdi.target = hdi_compute.name

# specify CondaDependencies object to ask system installing numpy
cd = CondaDependencies()
cd.add_conda_package('numpy')
run_hdi.environment.python.conda_dependencies = cd

Tip

Als u een HDInsight-cluster uit de werkruimte wilt verwijderen (loskoppelen), gebruikt u de methode HDInsightCompute.detach().

Azure Machine Learning verwijdert het HDInsight-cluster niet voor u. U moet het handmatig verwijderen met behulp van de Azure Portal, CLI of de SDK voor Azure HDInsight.

Azure Batch

Azure Batch wordt gebruikt om grootschalige parallelle en HPC-toepassingen (High Performance Computing) efficiënt in de cloud uit te voeren. AzureBatchStep kan worden gebruikt in een Azure Machine Learning-pijplijn om taken te verzenden naar een Azure Batch-pool met machines.

Als u Azure Batch als rekendoel wilt koppelen, moet u de Azure Machine Learning SDK gebruiken en de volgende informatie opgeven:

Azure Batch-rekennaam: een beschrijvende naam die moet worden gebruikt voor de berekening in de werkruimte
Azure Batch-accountnaam: de naam van het Azure Batch-account
Resourcegroep: de resourcegroep die het Azure Batch-account bevat.

De volgende code laat zien hoe u Azure Batch als rekendoel koppelt:

from azureml.core.compute import ComputeTarget, BatchCompute
from azureml.exceptions import ComputeTargetException

# Name to associate with new compute in workspace
batch_compute_name = 'mybatchcompute'

# Batch account details needed to attach as compute to workspace
batch_account_name = "<batch_account_name>"  # Name of the Batch account
# Name of the resource group which contains this account
batch_resource_group = "<batch_resource_group>"

try:
    # check if the compute is already attached
    batch_compute = BatchCompute(ws, batch_compute_name)
except ComputeTargetException:
    print('Attaching Batch compute...')
    provisioning_config = BatchCompute.attach_configuration(
        resource_group=batch_resource_group, account_name=batch_account_name)
    batch_compute = ComputeTarget.attach(
        ws, batch_compute_name, provisioning_config)
    batch_compute.wait_for_completion()
    print("Provisioning state:{}".format(batch_compute.provisioning_state))
    print("Provisioning errors:{}".format(batch_compute.provisioning_errors))

print("Using Batch compute:{}".format(batch_compute.cluster_resource_id))

Waarschuwing

Maak niet meerdere, gelijktijdige bijlagen aan dezelfde Azure Batch vanuit uw werkruimte. Elke nieuwe bijlage breekt de vorige bestaande bijlagen op.

Azure Databricks

Azure Databricks is een op Apache Spark gebaseerde omgeving in de Azure-cloud. Het kan worden gebruikt als een rekendoel met een Azure Machine Learning-pijplijn.

Belangrijk

Azure Machine Learning kan geen Azure Databricks-rekendoel maken. In plaats daarvan moet u een Azure Databricks-werkruimte maken en deze vervolgens koppelen aan uw Azure Machine Learning-werkruimte. Zie het document Een Spark-taak uitvoeren in Azure Databricks om een werkruimteresource te maken.

Als u een Azure Databricks-werkruimte wilt koppelen vanuit een ander Azure-abonnement, moet u (uw Microsoft Entra-account) de rol Inzender krijgen in de Azure Databricks-werkruimte. Controleer uw toegang in de Azure-portal.

Als u Azure Databricks als rekendoel wilt koppelen, geeft u de volgende informatie op:

Databricks-berekeningsnaam: de naam die u wilt toewijzen aan deze rekenresource.
Naam databricks-werkruimte: de naam van de Azure Databricks-werkruimte.
Databricks-toegangstoken: het toegangstoken dat wordt gebruikt om te verifiëren bij Azure Databricks. Zie het verificatiedocument om een toegangstoken te genereren.

De volgende code laat zien hoe u Azure Databricks koppelt als rekendoel met de Azure Machine Learning SDK:

import os
from azureml.core.compute import ComputeTarget, DatabricksCompute
from azureml.exceptions import ComputeTargetException

databricks_compute_name = os.environ.get(
    "AML_DATABRICKS_COMPUTE_NAME", "<databricks_compute_name>")
databricks_workspace_name = os.environ.get(
    "AML_DATABRICKS_WORKSPACE", "<databricks_workspace_name>")
databricks_resource_group = os.environ.get(
    "AML_DATABRICKS_RESOURCE_GROUP", "<databricks_resource_group>")
databricks_access_token = os.environ.get(
    "AML_DATABRICKS_ACCESS_TOKEN", "<databricks_access_token>")

try:
    databricks_compute = ComputeTarget(
        workspace=ws, name=databricks_compute_name)
    print('Compute target already exists')
except ComputeTargetException:
    print('compute not found')
    print('databricks_compute_name {}'.format(databricks_compute_name))
    print('databricks_workspace_name {}'.format(databricks_workspace_name))
    print('databricks_access_token {}'.format(databricks_access_token))

    # Create attach config
    attach_config = DatabricksCompute.attach_configuration(resource_group=databricks_resource_group,
                                                           workspace_name=databricks_workspace_name,
                                                           access_token=databricks_access_token)
    databricks_compute = ComputeTarget.attach(
        ws,
        databricks_compute_name,
        attach_config
    )

    databricks_compute.wait_for_completion(True)

Zie een voorbeeldnotitieblok op GitHub voor een gedetailleerder voorbeeld.

Waarschuwing

Maak niet meerdere, gelijktijdige bijlagen met dezelfde Azure Databricks vanuit uw werkruimte. Elke nieuwe bijlage breekt de vorige bestaande bijlagen op.

Azure Data Lake Analytics

Azure Data Lake Analytics is een platform voor big data-analyse in de Azure-cloud. Het kan worden gebruikt als een rekendoel met een Azure Machine Learning-pijplijn.

Een Azure Data Lake Analytics-account maken voordat u deze gebruikt. Zie het document Aan de slag met Azure Data Lake Analytics om deze resource te maken.

Als u Data Lake Analytics als rekendoel wilt koppelen, moet u de Azure Machine Learning SDK gebruiken en de volgende informatie opgeven:

Compute-naam: de naam die u wilt toewijzen aan deze rekenresource.
Resourcegroep: de resourcegroep die het Data Lake Analytics-account bevat.
Accountnaam: de naam van het Data Lake Analytics-account.

De volgende code laat zien hoe u Data Lake Analytics als rekendoel koppelt:

import os
from azureml.core.compute import ComputeTarget, AdlaCompute
from azureml.exceptions import ComputeTargetException


adla_compute_name = os.environ.get(
    "AML_ADLA_COMPUTE_NAME", "<adla_compute_name>")
adla_resource_group = os.environ.get(
    "AML_ADLA_RESOURCE_GROUP", "<adla_resource_group>")
adla_account_name = os.environ.get(
    "AML_ADLA_ACCOUNT_NAME", "<adla_account_name>")

try:
    adla_compute = ComputeTarget(workspace=ws, name=adla_compute_name)
    print('Compute target already exists')
except ComputeTargetException:
    print('compute not found')
    print('adla_compute_name {}'.format(adla_compute_name))
    print('adla_resource_id {}'.format(adla_resource_group))
    print('adla_account_name {}'.format(adla_account_name))
    # create attach config
    attach_config = AdlaCompute.attach_configuration(resource_group=adla_resource_group,
                                                     account_name=adla_account_name)
    # Attach ADLA
    adla_compute = ComputeTarget.attach(
        ws,
        adla_compute_name,
        attach_config
    )

    adla_compute.wait_for_completion(True)

Zie een voorbeeldnotitieblok op GitHub voor een gedetailleerder voorbeeld.

Waarschuwing

Maak niet meerdere, gelijktijdige bijlagen naar dezelfde ADLA vanuit uw werkruimte. Elke nieuwe bijlage breekt de vorige bestaande bijlagen op.

Tip

Azure Machine Learning-pijplijnen kunnen alleen werken met gegevens die zijn opgeslagen in het standaardgegevensarchief van het Data Lake Analytics-account. Als de gegevens waarmee u moet werken zich in een niet-standaardarchief bevinden, kunt u een DataTransferStep gegevens kopiëren voordat u gaat trainen.

Azure Container Instance

Azure Container Instances (ACI) worden dynamisch gemaakt wanneer u een model implementeert. U kunt ACI niet op een andere manier maken of koppelen aan uw werkruimte. Zie Een model implementeren in Azure Container Instances voor meer informatie.

Kubernetes

Azure Machine Learning biedt u de mogelijkheid om uw eigen Kubernetes-clusters te koppelen voor training en deductie. Zie Kubernetes-cluster configureren voor Azure Machine Learning.

Gebruik de volgende methode om een Kubernetes-cluster los te koppelen vanuit uw werkruimte:

compute_target.detach()

Waarschuwing

Als u een cluster loskoppelt, wordt het cluster niet verwijderd. Als u een Azure Kubernetes Service-cluster wilt verwijderen, raadpleegt u De Azure CLI gebruiken met AKS. Als u een Kubernetes-cluster met Azure Arc wilt verwijderen, raadpleegt u de quickstart van Azure Arc.

Notebook-voorbeelden

Bekijk deze notebooks voor voorbeelden van training met verschillende rekendoelen:

Informatie over het uitvoeren van notebooks vindt u in het artikel Use Jupyter notebooks to explore this service (Jupyter Notebooks gebruiken om deze service te verkennen).

Volgende stappen

Gebruik de rekenresource om een trainingsuitvoering te configureren en te verzenden.
Zelfstudie: Een model trainen en implementeren maakt gebruik van een beheerd rekendoel om een model te trainen.
Leer hoe u hyperparameters efficiënt kunt afstemmen om betere modellen te bouwen.
Zodra u een getraind model hebt, leert u hoe en waar u modellen kunt implementeren.
Azure Machine Learning gebruiken met Azure Virtual Networks

Delen via

Modellen trainen met de Azure Machine Learning Python SDK (v1)

Vereisten

Beperkingen

Wat is een rekendoel?

Lokale computer

Externe virtuele machines

Apache Spark-pools

Azure HDInsight

Azure Batch

Azure Databricks

Azure Data Lake Analytics

Azure Container Instance

Kubernetes

Notebook-voorbeelden

Volgende stappen

Feedback

Aanvullende resources