Vad är en Azure Machine Learning-arbetsyta?

Arbetsytor är platser där du kan samarbeta med kollegor för att skapa maskininlärningsartefakter och grupprelaterat arbete. Till exempel experiment, jobb, datauppsättningar, modeller, komponenter och slutpunkter för slutsatsdragning. Den här artikeln beskriver arbetsytor, hur du hanterar åtkomst till dem och hur du använder dem för att organisera ditt arbete.

Är du redo att börja? Skapa en arbetsyta.

Uppgifter som utförs på en arbetsyta

För maskininlärningsteam är arbetsytan en plats där de kan organisera sitt arbete. Här är några av de uppgifter som du kan starta från en arbetsyta:

  • Skapa jobb – Jobb är träningskörningar som du använder för att skapa dina modeller. Du kan gruppera jobb i experiment för att jämföra mått.
  • Skapa pipelines – Pipelines är återanvändbara arbetsflöden för träning och omträning av din modell.
  • Registrera datatillgångar – Stöd för datatillgångar vid hantering av de data som du använder för modellträning och pipelineskapande.
  • Registrera modeller – När du har en modell som du vill distribuera skapar du en registrerad modell.
  • Skapa onlineslutpunkter – Använd en registrerad modell och ett bedömningsskript för att skapa en onlineslutpunkt.
  • Distribuera en modell – Använd den registrerade modellen och ett bedömningsskript för att distribuera en modell.

Förutom att gruppera dina maskininlärningsresultat är arbetsytor även värdar för resurskonfigurationer:

  • Beräkningsmål används för att köra experimenten.
  • Datalager definierar hur du och andra kan ansluta till datakällor när du använder datatillgångar.
  • Säkerhetsinställningar – Nätverks-, identitets- och åtkomstkontroll samt krypteringsinställningar.

Organisera arbetsytor

För maskininlärningsteamets leads och administratörer fungerar arbetsytor som containrar för åtkomsthantering, kostnadshantering och dataisolering. Här följer några tips för att organisera arbetsytor:

  • Använd användarroller för behörighetshantering på arbetsytan mellan användare. Till exempel en dataexpert, en maskininlärningstekniker eller en administratör.
  • Tilldela åtkomst till användargrupper: Genom att använda Microsoft Entra-användargrupper behöver du inte lägga till enskilda användare på varje arbetsyta, och till andra resurser behöver samma grupp med användare åtkomst till.
  • Skapa en arbetsyta per projekt: Även om en arbetsyta kan användas för flera projekt kan kostnadsrapportering till en projektnivå begränsas till ett projekt per arbetsyta. Du kan också hantera konfigurationer som datalager i omfånget för varje projekt.
  • Dela Azure-resurser: Arbetsytor kräver att du skapar flera associerade resurser. Dela dessa resurser mellan arbetsytor för att spara repetitiva installationssteg.
  • Aktivera självbetjäning: Skapa och skydda associerade resurser som IT-administratör och använd användarroller för att låta dataexperter skapa arbetsytor på egen hand.
  • Dela tillgångar: Du kan dela tillgångar mellan arbetsytor med hjälp av Azure Machine Learning-register.

Hur lagras mitt innehåll på en arbetsyta?

Din arbetsyta har en historik över alla träningskörningar med loggar, mått, utdata, ursprungsmetadata och en ögonblicksbild av skripten. När du utför uppgifter i Azure Machine Learning genereras artefakter. Deras metadata och data lagras på arbetsytan och på dess associerade resurser.

Associerade resurser

När du skapar en ny arbetsyta måste du ta med andra Azure-resurser för att lagra dina data. Om de inte tillhandahålls av dig skapas dessa resurser automatiskt av Azure Machine Learning.

  • Azure Storage-konto. Lagrar maskininlärningsartefakter som jobbloggar. Som standard används det här lagringskontot när du laddar upp data till arbetsytan. Jupyter-notebook-filer som används med dina Azure Machine Learning-beräkningsinstanser lagras även här.

    Viktigt!

    Du kan inte använda ett befintligt Azure Storage-konto om det är:

    • Ett konto av typen BlobStorage
    • Ett Premium-konto (Premium_LRS och Premium_GRS)
    • Ett konto med hierarkiskt namnområde (används med Azure Data Lake Storage Gen2).

    Du kan använda premiumlagring eller hierarkiskt namnområde som ytterligare lagring genom att skapa ett datalager.

    Aktivera inte hierarkiskt namnområde på lagringskontot när du har uppgraderat till generell användning v2.

    Om du tar med ett befintligt v1-lagringskonto för generell användning kan du uppgradera det till generell användning v2 när arbetsytan har skapats.

  • Azure Container Registry (ACR). Lagrar docker-containrar som skapats när du skapar anpassade miljöer via Azure Machine Learning. Distribution av AutoML-modeller och dataprofil utlöser också skapandet av anpassade miljöer.

    Arbetsytor kan skapas utan ACR som ett beroende om du inte behöver skapa anpassade docker-containrar. Azure Machine Learning kan läsa från externa containerregister.

    ACR etableras automatiskt när du skapar anpassade docker-avbildningar. Använd rollbaserad åtkomstkontroll i Azure (Azure RBAC) för att förhindra att kundens Docker-containrar skapas.

    Viktigt!

    Om din prenumerationsinställning kräver att taggar läggs till i resurser under den misslyckas ACR som skapats av Azure Machine Learning, eftersom vi inte kan ange taggar till ACR.

  • Azure Application Insights. Hjälper dig att övervaka och samla in diagnostikinformation från dina slutpunkter för slutsatsdragning.

    Mer information finns i Övervaka onlineslutpunkter.

  • Azure Key Vault. Lagrar hemligheter som används av beräkningsmål och annan känslig information som arbetsytan behöver.

Skapa en arbetsyta

Det finns flera sätt att skapa en arbetsyta. Kom igång med något av följande alternativ:

Så här automatiserar du skapande av arbetsytor med hjälp av önskade säkerhetsinställningar:

  • Använd REST API:er direkt i skriptmiljön, för plattformsintegrering eller i MLOps-arbetsflöden.

Verktyg för interaktion och hantering av arbetsytor

När arbetsytan har konfigurerats kan du interagera med den på följande sätt:

Följande arbetsytehanteringsuppgifter är tillgängliga i varje gränssnitt.

Hanteringsuppgift för arbetsytor Portalen Studio Python SDK Azure CLI VS Code
Skapa en arbetsyta
Hantera arbetsyteåtkomst
Skapa och hantera beräkningsresurser
Skapa en beräkningsinstans

Varning

Det går inte att flytta din Azure Machine Learning-arbetsyta till en annan prenumeration eller flytta den ägande prenumerationen till en ny klientorganisation. Detta kan orsaka fel.

Underresurser

När du skapar beräkningskluster och beräkningsinstanser i Azure Machine Learning skapas underresurser.

  • Virtuella datorer: tillhandahålla beräkningskraft för beräkningsinstanser och beräkningskluster som du använder för att köra jobb.
  • Load Balancer: en nätverkslastbalanserare skapas för varje beräkningsinstans och beräkningskluster för att hantera trafik även när beräkningsinstansen/klustret stoppas.
  • Virtuellt nätverk: dessa hjälper Azure-resurser att kommunicera med varandra, Internet och andra lokala nätverk.
  • Bandbredd: kapslar in alla utgående dataöverföringar mellan regioner.

Nästa steg

Mer information om hur du planerar en arbetsyta för organisationens krav finns i Ordna och konfigurera Azure Machine Learning.

Information om hur du kommer igång med Azure Machine Learning finns i: