Delen via


Een Azure Machine Learning-rekenproces beheren

VAN TOEPASSING OP:Azure CLI ml extension v2 (current)Python SDK azure-ai-ml v2 (current)

Meer informatie over het beheren van een rekenproces in uw Azure Machine Learning-werkruimte.

Gebruik een rekenproces als uw volledig geconfigureerde en beheerde ontwikkelomgeving in de cloud. Voor ontwikkeling en testen kunt u het exemplaar ook gebruiken als trainingsrekendoel. Een rekenproces kan meerdere taken parallel uitvoeren en heeft een taakwachtrij. Als ontwikkelomgeving kan een rekenproces niet worden gedeeld met andere gebruikers in uw werkruimte.

In dit artikel leert u hoe u een rekenproces kunt starten, stoppen, opnieuw opstarten en verwijderen. Zie Een Azure Machine Learning-rekenproces maken voor meer informatie over het maken van een rekenproces.

Notitie

In dit artikel ziet u CLI v2 in de onderstaande secties. Als u nog steeds CLI v1 gebruikt, raadpleegt u Een Azure Machine Learning-rekencluster CLI v1 maken.

Vereisten

Selecteer het juiste tabblad voor de rest van de vereisten op basis van de gewenste methode voor het beheren van uw rekenproces.

  • Als u uw code niet uitvoert op een rekenproces, installeert u de Azure Machine Learning Python SDK. Deze SDK is al voor u geïnstalleerd op een rekenproces.

  • Koppelen aan de werkruimte in uw Python-script:

    Voer deze code uit om verbinding te maken met uw Azure Machine Learning-werkruimte.

    Vervang uw abonnements-id, resourcegroepnaam en werkruimtenaam in de volgende code. Deze waarden zoeken:

    1. Meld u aan bij Azure Machine Learning Studio.
    2. Open de werkruimte die u wilt gebruiken.
    3. Selecteer de naam van uw werkruimte in de rechterbovenhoek Azure Machine Learning-studio werkbalk.
    4. Kopieer de waarde voor werkruimte, resourcegroep en abonnements-id naar de code.
    5. Kopieer een waarde, sluit het gebied en plak deze en kom vervolgens terug voor de volgende waarde wanneer u in studio naar een notitieblok plakt.

    VAN TOEPASSING OP: Python SDK azure-ai-ml v2 (actueel)

    # Enter details of your AML workspace
    subscription_id = "<SUBSCRIPTION_ID>"
    resource_group = "<RESOURCE_GROUP>"
    workspace = "<AML_WORKSPACE_NAME>"
    # get a handle to the workspace
    from azure.ai.ml import MLClient
    from azure.identity import DefaultAzureCredential
    
    ml_client = MLClient(
        DefaultAzureCredential(), subscription_id, resource_group, workspace
    )

    ml_client is een handler voor de werkruimte die u gebruikt om andere resources en taken te beheren.

Beheren

Een rekenproces starten, stoppen, opnieuw opstarten en verwijderen. Een rekenproces wordt niet altijd automatisch omlaag geschaald, dus zorg ervoor dat u de resource stopt om lopende kosten te voorkomen. Als u een rekenproces stopt, wordt de toewijzing ervan ongedaan gemaakt. Start het opnieuw wanneer u het nodig hebt. Terwijl het stoppen van het rekenproces de facturering voor rekenuren stopt, wordt u nog steeds gefactureerd voor schijf, openbaar IP-adres en standaard load balancer.

U kunt automatisch afsluiten inschakelen om het rekenproces na een opgegeven tijd automatisch te stoppen.

U kunt ook een planning maken voor het rekenproces dat automatisch wordt gestart en gestopt op basis van een tijdstip en dag van de week.

Tip

Het reken-exemplaar heeft een besturingssysteemschijf van 120 GB. Als u onvoldoende schijfruimte hebt, gebruikt u de terminal om ten minste 1-2 GB te wissen voordat u het rekenproces stopt of opnieuw start. Stop het rekenproces niet door sudo-afsluiting uit te geven vanuit de terminal. De tijdelijke schijfgrootte voor het rekenproces is afhankelijk van de gekozen VM-grootte en is gekoppeld aan /mnt.

VAN TOEPASSING OP: Python SDK azure-ai-ml v2 (actueel)

In deze voorbeelden wordt de naam van het rekenproces opgeslagen in de variabele ci_basic_name.

  • Status ophalen

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Get compute
    ci_basic_state = ml_client.compute.get(ci_basic_name)
  • Stoppen

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Stop compute
    ml_client.compute.begin_stop(ci_basic_name).wait()
  • Starten

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Start compute
    ml_client.compute.begin_start(ci_basic_name).wait()
  • Opnieuw starten

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Restart compute
    ml_client.compute.begin_restart(ci_basic_name).wait()
  • Delete

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    ml_client.compute.begin_delete(ci_basic_name).wait()

Met Azure RBAC kunt u bepalen welke gebruikers in de werkruimte een rekenproces kunnen maken, verwijderen, starten, stoppen en opnieuw starten. Alle gebruikers in de rol inzender en eigenaar van de werkruimte kunnen rekeninstanties in de werkruimte maken, verwijderen, starten, stoppen en opnieuw starten. Alleen de maker van een specifiek rekenproces, of de gebruiker die namens hen is gemaakt, heeft echter alleen toegang tot Jupyter, JupyterLab en RStudio op dat rekenproces. Een rekenproces is toegewezen aan één gebruiker die hoofdtoegang heeft. Deze gebruiker heeft toegang tot Jupyter/JupyterLab/RStudio die wordt uitgevoerd op het exemplaar. Het rekenproces heeft aanmelding van één gebruiker en alle acties maken gebruik van de identiteit van die gebruiker voor Azure RBAC en het toewijzen van experimenttaken. SSH-toegang wordt beheerd via een mechanisme voor openbare/persoonlijke sleutels.

Deze acties kunnen worden beheerd door Azure RBAC:

  • Microsoft.MachineLearningServices/workspaces/computes/read
  • Microsoft.MachineLearningServices/workspaces/computes/write
  • Microsoft.MachineLearningServices/workspaces/computes/delete
  • Microsoft.MachineLearningServices/workspaces/computes/start/action
  • Microsoft.MachineLearningServices/workspaces/computes/stop/action
  • Microsoft.MachineLearningServices/workspaces/computes/restart/action
  • Microsoft.MachineLearningServices/workspaces/computes/updateSchedules/action

Om u een rekenproces te maken, hebt u machtigingen nodig voor de volgende acties:

  • Microsoft.MachineLearningServices/workspaces/computes/write
  • Microsoft.MachineLearningServices/workspaces/checkComputeNameAvailability/action

Versie van rekenproces controleren en observeren

Zodra een rekenproces is geïmplementeerd, wordt het niet automatisch bijgewerkt. Microsoft brengt maandelijks nieuwe VM-installatiekopieën uit. Zie beveiligingsmanagement voor meer informatie over opties voor het bijhouden van recente versies.

Als u wilt bijhouden of de versie van het besturingssysteem van een exemplaar actueel is, kunt u een query uitvoeren op de versie ervan met behulp van de CLI, SDK of Studio-gebruikersinterface.

VAN TOEPASSING OP: Python SDK azure-ai-ml v2 (actueel)

from azure.ai.ml.entities import ComputeInstance, AmlCompute

# Display operating system version
instance = ml_client.compute.get("myci")
print instance.os_image_metadata

Zie de volgende referentiedocumenten voor meer informatie over de klassen, methoden en parameters die in dit voorbeeld worden gebruikt:

IT-beheerders kunnen Azure Policy gebruiken om de inventaris van exemplaren in werkruimten in de Azure Policy-nalevingsportal te bewaken. Wijs het ingebouwde beleid Azure Machine Learning Compute-exemplaren controleren toe met een verouderd besturingssysteem in een Azure-abonnement of Azure-beheergroepbereik.

Volgende stappen