Wat is een Azure Machine Learning-werkruimte?
Werkruimten zijn plaatsen om samen te werken met collega's om machine learning-artefacten en groepsgerelateerd werk te maken. Bijvoorbeeld experimenten, taken, gegevenssets, modellen, onderdelen en deductie-eindpunten. In dit artikel worden werkruimten beschreven, hoe u de toegang tot deze werkruimten beheert en hoe u ze kunt gebruiken om uw werk te organiseren.
Klaar om aan de slag te gaan? Een werkruimte maken.
Taken die worden uitgevoerd in een werkruimte
Voor machine learning-teams is de werkruimte een plek om hun werk te organiseren. Hier volgen enkele taken die u vanuit een werkruimte kunt starten:
- Taken maken- Taken zijn trainingsuitvoeringen die u gebruikt om uw modellen te bouwen. U kunt taken groeperen in experimenten om metrische gegevens te vergelijken.
- Pijplijnen ontwerpen: pijplijnen zijn herbruikbare werkstromen voor het trainen en opnieuw trainen van uw model.
- Gegevensassets registreren - Hulp bij gegevensassets bij het beheer van de gegevens die u gebruikt voor het maken van modellen en pijplijnen.
- Modellen registreren: zodra u een model hebt dat u wilt implementeren, maakt u een geregistreerd model.
- Online-eindpunten maken: gebruik een geregistreerd model en een scorescript om een online-eindpunt te maken.
- Een model implementeren: gebruik het geregistreerde model en een scorescript om een model te implementeren.
Naast het groeperen van uw machine learning-resultaten, hosten werkruimten ook resourceconfiguraties:
- Rekendoelen worden gebruikt om uw experimenten uit te voeren.
- Gegevensarchieven definiëren hoe u en anderen verbinding kunnen maken met gegevensbronnen wanneer u gegevensassets gebruikt.
- Beveiligingsinstellingen : netwerk-, identiteits- en toegangsbeheer en versleutelingsinstellingen.
Werkruimten organiseren
Voor leads en beheerders van machine learning-teams fungeren werkruimten als containers voor toegangsbeheer, kostenbeheer en gegevensisolatie. Hier volgen enkele tips voor het organiseren van werkruimten:
- Gebruikersrollen gebruiken voor machtigingsbeheer in de werkruimte tussen gebruikers. Bijvoorbeeld een data scientist, een machine learning-engineer of beheerder.
- Toegang toewijzen aan gebruikersgroepen: Als u Microsoft Entra-gebruikersgroepen gebruikt, hoeft u geen afzonderlijke gebruikers toe te voegen aan elke werkruimte en aan andere resources waarvoor dezelfde groep gebruikers toegang nodig heeft.
- Een werkruimte per project maken: hoewel een werkruimte voor meerdere projecten kan worden gebruikt, kunt u deze beperken tot één project per werkruimte, zodat kostenrapportage tot projectniveau kan worden opgebouwd. Hiermee kunt u ook configuraties zoals gegevensarchieven beheren binnen het bereik van elk project.
- Azure-resources delen: voor werkruimten moet u verschillende gekoppelde resources maken. Deel deze resources tussen werkruimten om terugkerende installatiestappen op te slaan.
- Selfservice inschakelen: Maak gekoppelde resources vooraf en beveilig deze als IT-beheerder en gebruik gebruikersrollen om gegevenswetenschappers zelf werkruimten te laten maken.
- Assets delen: U kunt assets delen tussen werkruimten met behulp van Azure Machine Learning-registers.
Hoe wordt mijn inhoud opgeslagen in een werkruimte?
Uw werkruimte houdt een geschiedenis bij van alle trainingsuitvoeringen, met logboeken, metrische gegevens, uitvoer, metagegevens van herkomst en een momentopname van uw scripts. Wanneer u taken uitvoert in Azure Machine Learning, worden artefacten gegenereerd. Hun metagegevens en gegevens worden opgeslagen in de werkruimte en op de bijbehorende resources.
Gekoppelde resources
Wanneer u een nieuwe werkruimte maakt, moet u andere Azure-resources gebruiken om uw gegevens op te slaan. Als deze resources niet door u worden verstrekt, worden deze resources automatisch gemaakt door Azure Machine Learning.
Azure Storage-account. Slaat machine learning-artefacten op, zoals taaklogboeken. Dit opslagaccount wordt standaard gebruikt wanneer u gegevens uploadt naar de werkruimte. Jupyter-notebooks die worden gebruikt met uw Azure Machine Learning-rekeninstanties worden hier ook opgeslagen.
Belangrijk
U kunt een bestaand Azure Storage-account niet gebruiken als dit het volgende is:
- Een account van het type BlobStorage
- Een Premium-account (Premium_LRS en Premium_GRS)
- Een account met hiërarchische naamruimte (gebruikt met Azure Data Lake Storage Gen2).
U kunt Premium Storage of hiërarchische naamruimte als extra opslag gebruiken door een gegevensarchief te maken.
Schakel hiërarchische naamruimte niet in voor het opslagaccount na een upgrade naar algemeen gebruik v2.
Als u een bestaand v1-opslagaccount voor algemeen gebruik gebruikt, kunt u dit upgraden naar algemeen gebruik v2 nadat de werkruimte is gemaakt.
Azure Container Registry (ACR). Slaat gemaakte Docker-containers op wanneer u aangepaste omgevingen bouwt via Azure Machine Learning. Als u AutoML-modellen en -gegevensprofiel implementeert, wordt ook het maken van aangepaste omgevingen geactiveerd.
Werkruimten kunnen zonder ACR worden gemaakt als een afhankelijkheid als u geen aangepaste Docker-containers hoeft te bouwen. Azure Machine Learning kan lezen uit externe containerregisters.
ACR wordt automatisch ingericht wanneer u aangepaste Docker-installatiekopieën bouwt. Gebruik op rollen gebaseerd toegangsbeheer van Azure (Azure RBAC) om te voorkomen dat dockercontainers van klanten worden gebouwd.
Belangrijk
Als voor uw abonnementsinstelling tags moeten worden toegevoegd aan resources, mislukt ACR die door Azure Machine Learning is gemaakt, omdat we geen tags kunnen instellen op ACR.
Azure-toepassing Inzichten. Helpt u bij het bewaken en verzamelen van diagnostische gegevens van uw deductie-eindpunten.
Zie Online-eindpunten bewaken voor meer informatie.
Azure Key Vault. Slaat geheimen op die worden gebruikt door rekendoelen en andere gevoelige informatie die de werkruimte nodig heeft.
Een werkruimte maken
Er zijn meerdere manieren om een werkruimte te maken. Gebruik een van de volgende opties om aan de slag te gaan:
- Met de Azure Machine Learning-studio kunt u snel een werkruimte maken met standaardinstellingen.
- Gebruik Azure Portal voor een point-and-click-interface met meer beveiligingsopties.
- Gebruik de VS Code-extensie als u in Visual Studio Code werkt.
Voor het automatiseren van het maken van werkruimten met behulp van uw favoriete beveiligingsinstellingen:
- Azure Resource Manager-/Bicep-sjablonen bieden een declaratieve syntaxis voor het implementeren van Azure-resources. Een alternatieve optie is het gebruik van Terraform. Zie ook de Bicep-sjabloon of Terraform-sjabloon.
- Gebruik de Azure Machine Learning CLI of Azure Machine Learning SDK voor Python voor prototypen en als onderdeel van uw MLOps-werkstromen.
- Gebruik de Azure Machine Learning CLI of Azure Machine Learning SDK voor Python voor prototypen en als onderdeel van uw MLOps-werkstromen.
- Gebruik REST API's rechtstreeks in de scriptomgeving, voor platformintegratie of in MLOps-werkstromen.
Hulpprogramma's voor interactie en beheer van werkruimten
Zodra uw werkruimte is ingesteld, kunt u er op de volgende manieren mee werken:
- In elke Python-omgeving met de Azure Machine Learning SDK.
- Gebruik op de opdrachtregel de Azure Machine Learning CLI-extensie v2
- In elke Python-omgeving met de Azure Machine Learning SDK
- Gebruik op de opdrachtregel de Azure Machine Learning CLI-extensie v1
De volgende werkruimtebeheertaken zijn beschikbaar in elke interface.
Werkruimtebeheertaak | Portal | Studio | Python-SDK | Azure CLI | VS Code |
---|---|---|---|---|---|
Een werkruimte maken | ✓ | ✓ | ✓ | ✓ | ✓ |
Toegang tot werkruimten beheren | ✓ | ✓ | |||
Compute-resources maken en beheren | ✓ | ✓ | ✓ | ✓ | ✓ |
Een rekenproces maken | ✓ | ✓ | ✓ | ✓ |
Waarschuwing
Het verplaatsen van uw Azure Machine Learning-werkruimte naar een ander abonnement of het verplaatsen van het eigen abonnement naar een nieuwe tenant wordt niet ondersteund. Als u dit doet, kan dit fouten veroorzaken.
Subbronnen
Wanneer u rekenclusters en rekeninstanties in Azure Machine Learning maakt, worden subresources gemaakt.
- VM's: rekenkracht bieden voor rekeninstanties en rekenclusters, die u gebruikt om taken uit te voeren.
- Load Balancer: er wordt een netwerktaakverdeling gemaakt voor elk rekenproces en rekencluster om verkeer te beheren, zelfs wanneer het rekenproces/cluster wordt gestopt.
- Virtueel netwerk: deze helpen Azure-resources met elkaar, internet en andere on-premises netwerken te communiceren.
- Bandbreedte: omvat alle uitgaande gegevensoverdrachten tussen regio's.
Volgende stappen
Zie Azure Machine Learning organiseren en instellen voor meer informatie over het plannen van een werkruimte voor de vereisten van uw organisatie.
Als u aan de slag wilt met Azure Machine Learning, raadpleegt u: