Identifiera Azure Machine Learning-resurser

Slutförd

Resurser i Azure Machine Learning refererar till den infrastruktur du behöver för att köra ett arbetsflöde för maskininlärning. Helst vill du att någon som en administratör ska skapa och hantera resurserna.

Resurserna i Azure Machine Learning är:

  • Arbetsytan
  • Beräkningsresurser
  • Datalager

Skapa och hantera arbetsytan

Arbetsytan är resursen på den översta nivån för Azure Machine Learning. Dataforskare behöver åtkomst till arbetsytan för att träna och spåra modeller och distribuera modellerna till slutpunkter.

Du vill dock vara försiktig med vem som har fullständig åtkomst till arbetsytan. Bredvid referenser till beräkningsresurser och datalager hittar du alla loggar, mått, utdata, modeller och ögonblicksbilder av koden på arbetsytan.

Skapa och hantera beräkningsresurser

En av de viktigaste resurserna du behöver när du tränar eller distribuerar en modell är beräkning. Det finns fem typer av beräkning på Azure Machine Learning-arbetsytan:

  • Beräkningsinstanser: Liknar en virtuell dator i molnet som hanteras av arbetsytan. Perfekt att använda som utvecklingsmiljö för att köra (Jupyter) notebook-filer.
  • Beräkningskluster: Kluster på begäran av CPU- eller GPU-beräkningsnoder i molnet som hanteras av arbetsytan. Perfekt att använda för produktionsarbetsbelastningar när de automatiskt skalas efter dina behov.
  • Kubernetes-kluster: Gör att du kan skapa eller koppla ett AKS-kluster (Azure Kubernetes Service). Perfekt för att distribuera tränade maskininlärningsmodeller i produktionsscenarier.
  • Anslutna beräkningar: Gör att du kan koppla andra Azure-beräkningsresurser till arbetsytan, till exempel Azure Databricks- eller Synapse Spark-pooler.
  • Serverlös beräkning: En fullständigt hanterad beräkning på begäran som du kan använda för träningsjobb.

Kommentar

När Azure Machine Learning skapar och hanterar serverlös beräkning åt dig visas den inte på beräkningssidan i studion. Läs mer om hur du använder serverlös beräkning för modellträning

Även om beräkning är den viktigaste resursen när du arbetar med maskininlärningsarbetsbelastningar kan den också vara den mest kostnadsintensiva. Därför är bästa praxis att endast tillåta administratörer att skapa och hantera beräkningsresurser. Dataforskare bör inte tillåtas att redigera beräkning, utan endast använda den tillgängliga beräkningen för att köra sina arbetsbelastningar.

Skapa och hantera datalager

Arbetsytan lagrar inga data i sig. I stället lagras alla data i datalager, som är referenser till Azure-datatjänster. Anslutningsinformationen till en datatjänst som ett datalager representerar lagras i Azure Key Vault.

När en arbetsyta skapas skapas ett Azure Storage-konto och ansluts automatiskt till arbetsytan. Därför har du fyra datalager som redan har lagts till på din arbetsyta:

  • workspaceartifactstore: Anslut till containern för azureml Azure Storage-kontot som skapats med arbetsytan. Används för att lagra beräknings- och experimentloggar när jobb körs.
  • workspaceworkingdirectory: Anslut till filresursen för Azure Storage-kontot som skapats med arbetsytan som används av avsnittet Notebooks i studion. När du laddar upp filer eller mappar för åtkomst från en beräkningsinstans laddas den upp till den här filresursen.
  • workspaceblobstore: Anslut till Blob Storage för Azure Storage-kontot som skapats med arbetsytan. Specifikt containern azureml-blobstore-... . Ange som standarddatalager, vilket innebär att när du skapar en datatillgång och laddar upp data lagras den i den här containern.
  • workspacefilestore: Anslut till filresursen för Azure Storage-kontot som skapats med arbetsytan. Specifikt filresursen azureml-filestore-... .

Dessutom kan du skapa datalager för att ansluta till andra Azure-datatjänster. Oftast ansluter dina datalager till ett Azure Storage-konto eller Azure Data Lake Storage (Gen2) eftersom dessa datatjänster oftast används i datavetenskapsprojekt.