Wat is een Azure Machine Learning-werkruimte?

Werkruimten zijn plaatsen om samen te werken met collega's om machine learning-artefacten en groepsgerelateerd werk te maken. Bijvoorbeeld experimenten, taken, gegevenssets, modellen, onderdelen en deductie-eindpunten. In dit artikel worden werkruimten beschreven, hoe u de toegang tot deze werkruimten beheert en hoe u ze kunt gebruiken om uw werk te organiseren.

Klaar om aan de slag te gaan? Een werkruimte maken.

Taken die worden uitgevoerd in een werkruimte

Voor machine learning-teams is de werkruimte een plek om hun werk te organiseren. Hier volgen enkele taken die u vanuit een werkruimte kunt starten:

  • Taken maken- Taken zijn trainingsuitvoeringen die u gebruikt om uw modellen te bouwen. U kunt taken groeperen in experimenten om metrische gegevens te vergelijken.
  • Pijplijnen ontwerpen: pijplijnen zijn herbruikbare werkstromen voor het trainen en opnieuw trainen van uw model.
  • Gegevensassets registreren - Hulp bij gegevensassets bij het beheer van de gegevens die u gebruikt voor het maken van modellen en pijplijnen.
  • Modellen registreren: zodra u een model hebt dat u wilt implementeren, maakt u een geregistreerd model.
  • Online-eindpunten maken: gebruik een geregistreerd model en een scorescript om een online-eindpunt te maken.
  • Een model implementeren: gebruik het geregistreerde model en een scorescript om een model te implementeren.

Naast het groeperen van uw machine learning-resultaten, hosten werkruimten ook resourceconfiguraties:

Werkruimten organiseren

Voor leads en beheerders van machine learning-teams fungeren werkruimten als containers voor toegangsbeheer, kostenbeheer en gegevensisolatie. Hier volgen enkele tips voor het organiseren van werkruimten:

  • Gebruikersrollen gebruiken voor machtigingsbeheer in de werkruimte tussen gebruikers. Bijvoorbeeld een data scientist, een machine learning-engineer of beheerder.
  • Toegang toewijzen aan gebruikersgroepen: Als u Microsoft Entra-gebruikersgroepen gebruikt, hoeft u geen afzonderlijke gebruikers toe te voegen aan elke werkruimte en aan andere resources waarvoor dezelfde groep gebruikers toegang nodig heeft.
  • Een werkruimte per project maken: hoewel een werkruimte voor meerdere projecten kan worden gebruikt, kunt u deze beperken tot één project per werkruimte, zodat kostenrapportage tot projectniveau kan worden opgebouwd. Hiermee kunt u ook configuraties zoals gegevensarchieven beheren binnen het bereik van elk project.
  • Azure-resources delen: voor werkruimten moet u verschillende gekoppelde resources maken. Deel deze resources tussen werkruimten om terugkerende installatiestappen op te slaan.
  • Selfservice inschakelen: Maak gekoppelde resources vooraf en beveilig deze als IT-beheerder en gebruik gebruikersrollen om gegevenswetenschappers zelf werkruimten te laten maken.
  • Assets delen: U kunt assets delen tussen werkruimten met behulp van Azure Machine Learning-registers.

Hoe wordt mijn inhoud opgeslagen in een werkruimte?

Uw werkruimte houdt een geschiedenis bij van alle trainingsuitvoeringen, met logboeken, metrische gegevens, uitvoer, metagegevens van herkomst en een momentopname van uw scripts. Wanneer u taken uitvoert in Azure Machine Learning, worden artefacten gegenereerd. Hun metagegevens en gegevens worden opgeslagen in de werkruimte en op de bijbehorende resources.

Gekoppelde resources

Wanneer u een nieuwe werkruimte maakt, moet u andere Azure-resources gebruiken om uw gegevens op te slaan. Als deze resources niet door u worden verstrekt, worden deze resources automatisch gemaakt door Azure Machine Learning.

  • Azure Storage-account. Slaat machine learning-artefacten op, zoals taaklogboeken. Dit opslagaccount wordt standaard gebruikt wanneer u gegevens uploadt naar de werkruimte. Jupyter-notebooks die worden gebruikt met uw Azure Machine Learning-rekeninstanties worden hier ook opgeslagen.

    Belangrijk

    U kunt een bestaand Azure Storage-account niet gebruiken als dit het volgende is:

    • Een account van het type BlobStorage
    • Een Premium-account (Premium_LRS en Premium_GRS)
    • Een account met hiërarchische naamruimte (gebruikt met Azure Data Lake Storage Gen2).

    U kunt Premium Storage of hiërarchische naamruimte als extra opslag gebruiken door een gegevensarchief te maken.

    Schakel hiërarchische naamruimte niet in voor het opslagaccount na een upgrade naar algemeen gebruik v2.

    Als u een bestaand v1-opslagaccount voor algemeen gebruik gebruikt, kunt u dit upgraden naar algemeen gebruik v2 nadat de werkruimte is gemaakt.

  • Azure Container Registry (ACR). Slaat gemaakte Docker-containers op wanneer u aangepaste omgevingen bouwt via Azure Machine Learning. Als u AutoML-modellen en -gegevensprofiel implementeert, wordt ook het maken van aangepaste omgevingen geactiveerd.

    Werkruimten kunnen zonder ACR worden gemaakt als een afhankelijkheid als u geen aangepaste Docker-containers hoeft te bouwen. Azure Machine Learning kan lezen uit externe containerregisters.

    ACR wordt automatisch ingericht wanneer u aangepaste Docker-installatiekopieën bouwt. Gebruik op rollen gebaseerd toegangsbeheer van Azure (Azure RBAC) om te voorkomen dat dockercontainers van klanten worden gebouwd.

    Belangrijk

    Als voor uw abonnementsinstelling tags moeten worden toegevoegd aan resources, mislukt ACR die door Azure Machine Learning is gemaakt, omdat we geen tags kunnen instellen op ACR.

  • Azure-toepassing Inzichten. Helpt u bij het bewaken en verzamelen van diagnostische gegevens van uw deductie-eindpunten.

    Zie Online-eindpunten bewaken voor meer informatie.

  • Azure Key Vault. Slaat geheimen op die worden gebruikt door rekendoelen en andere gevoelige informatie die de werkruimte nodig heeft.

Een werkruimte maken

Er zijn meerdere manieren om een werkruimte te maken. Gebruik een van de volgende opties om aan de slag te gaan:

Voor het automatiseren van het maken van werkruimten met behulp van uw favoriete beveiligingsinstellingen:

  • Gebruik REST API's rechtstreeks in de scriptomgeving, voor platformintegratie of in MLOps-werkstromen.

Hulpprogramma's voor interactie en beheer van werkruimten

Zodra uw werkruimte is ingesteld, kunt u er op de volgende manieren mee werken:

De volgende werkruimtebeheertaken zijn beschikbaar in elke interface.

Werkruimtebeheertaak Portal Studio Python-SDK Azure CLI VS Code
Een werkruimte maken
Toegang tot werkruimten beheren
Compute-resources maken en beheren
Een rekenproces maken

Waarschuwing

Het verplaatsen van uw Azure Machine Learning-werkruimte naar een ander abonnement of het verplaatsen van het eigen abonnement naar een nieuwe tenant wordt niet ondersteund. Als u dit doet, kan dit fouten veroorzaken.

Subbronnen

Wanneer u rekenclusters en rekeninstanties in Azure Machine Learning maakt, worden subresources gemaakt.

  • VM's: rekenkracht bieden voor rekeninstanties en rekenclusters, die u gebruikt om taken uit te voeren.
  • Load Balancer: er wordt een netwerktaakverdeling gemaakt voor elk rekenproces en rekencluster om verkeer te beheren, zelfs wanneer het rekenproces/cluster wordt gestopt.
  • Virtueel netwerk: deze helpen Azure-resources met elkaar, internet en andere on-premises netwerken te communiceren.
  • Bandbreedte: omvat alle uitgaande gegevensoverdrachten tussen regio's.

Volgende stappen

Zie Azure Machine Learning organiseren en instellen voor meer informatie over het plannen van een werkruimte voor de vereisten van uw organisatie.

Als u aan de slag wilt met Azure Machine Learning, raadpleegt u: