Hantera Azure Machine Learning-arbetsytor med Python SDK (v1)

GÄLLER FÖR:Python SDK azureml v1

I den här artikeln skapar, visar och tar du bort Azure Machine Learning-arbetsytor för Azure Machine Learning med hjälp av SDK för Python.

När dina behov ändras eller kraven för automatisering ökar kan du också hantera arbetsytor med hjälp av CLI eller via VS Code-tillägget.

Förutsättningar

Begränsningar

  • När du skapar en ny arbetsyta kan du antingen automatiskt skapa tjänster som krävs av arbetsytan eller använda befintliga tjänster. Om du vill använda befintliga tjänster från en annan Azure-prenumeration än arbetsytan måste du registrera Azure Machine Learning-namnområdet i prenumerationen som innehåller dessa tjänster. Om du till exempel skapar en arbetsyta i prenumeration A som använder ett lagringskonto från prenumeration B måste Azure Machine Learning-namnområdet registreras i prenumeration B innan du kan använda lagringskontot med arbetsytan.

    Resursprovidern för Azure Machine Learning är Microsoft.MachineLearningServices. Information om hur du ser om den är registrerad och hur du registrerar den finns i artikeln Azure-resursproviders och -typer .

    Viktigt

    Detta gäller endast för resurser som tillhandahålls när arbetsytan skapas. Azure Storage-konton, Azure Container Register, Azure Key Vault och Application Insights.

  • När du skapar en arbetsyta skapas som standard även en Azure Container Registry (ACR). Eftersom ACR för närvarande inte stöder unicode-tecken i resursgruppsnamn använder du en resursgrupp som inte innehåller dessa tecken.

  • Azure Machine Learning stöder inte hierarkisk namnrymd (Azure Data Lake Storage Gen2 funktion) för arbetsytans standardlagringskonto.

Tips

En Azure Application Insights-instans skapas när du skapar arbetsytan. Du kan ta bort Application Insights-instansen när klustret har skapats om du vill. Om du tar bort den begränsas den information som samlas in från arbetsytan, vilket kan göra det svårare att felsöka problem. Om du tar bort Application Insights-instansen som skapats av arbetsytan kan du inte återskapa den utan att ta bort och återskapa arbetsytan.

Mer information om hur du använder den här Application Insights-instansen finns i Övervaka och samla in data från Machine Learning-webbtjänstslutpunkter.

Skapa en arbetsyta

Du kan skapa en arbetsyta direkt i Azure Machine Learning-studio med begränsade tillgängliga alternativ. Du kan också använda någon av metoderna nedan för att få mer kontroll över alternativen.

  • Standardspecifikation. Som standard skapas beroende resurser och resursgruppen automatiskt. Den här koden skapar en arbetsyta med namnet myworkspace och en resursgrupp med namnet myresourcegroup i eastus2.

    GÄLLER FÖR:Python SDK azureml v1

    from azureml.core import Workspace
    
    ws = Workspace.create(name='myworkspace',
                   subscription_id='<azure-subscription-id>',
                   resource_group='myresourcegroup',
                   create_resource_group=True,
                   location='eastus2'
                   )
    

    Ställ in create_resource_group på Falskt om du har en befintlig Azure-resursgrupp som du vill använda för arbetsytan.

  • Flera klienter. Om du har flera konton lägger du till klient-ID:t för den Azure Active Directory som du vill använda. Hitta ditt klientorganisations-ID från Azure Portal under Externa identiteter i Azure Active Directory.

    GÄLLER FÖR:Python SDK azureml v1

    from azureml.core.authentication import InteractiveLoginAuthentication
    from azureml.core import Workspace
    
    interactive_auth = InteractiveLoginAuthentication(tenant_id="my-tenant-id")
    ws = Workspace.create(name='myworkspace',
                subscription_id='<azure-subscription-id>',
                resource_group='myresourcegroup',
                create_resource_group=True,
                location='eastus2',
                auth=interactive_auth
                )
    
  • Nationellt moln. Du behöver extra kod för att autentisera till Azure om du arbetar i ett nationellt moln.

    GÄLLER FÖR:Python SDK azureml v1

    from azureml.core.authentication import InteractiveLoginAuthentication
    from azureml.core import Workspace
    
    interactive_auth = InteractiveLoginAuthentication(cloud="<cloud name>") # for example, cloud="AzureUSGovernment"
    ws = Workspace.create(name='myworkspace',
                subscription_id='<azure-subscription-id>',
                resource_group='myresourcegroup',
                create_resource_group=True,
                location='eastus2',
                auth=interactive_auth
                )
    
  • Använd befintliga Azure-resurser. Du kan också skapa en arbetsyta som använder befintliga Azure-resurser med azure-resurs-ID-format. Hitta de specifika Azure-resurs-ID:na i Azure Portal eller med SDK:t. Det här exemplet förutsätter att resursgruppen, lagringskontot, nyckelvalvet, App Insights och containerregistret redan finns.

    GÄLLER FÖR:Python SDK azureml v1

    import os
    from azureml.core import Workspace
    from azureml.core.authentication import ServicePrincipalAuthentication
    
    service_principal_password = os.environ.get("AZUREML_PASSWORD")
    
    service_principal_auth = ServicePrincipalAuthentication(
        tenant_id="<tenant-id>",
        username="<application-id>",
        password=service_principal_password)
    
                          auth=service_principal_auth,
                               subscription_id='<azure-subscription-id>',
                               resource_group='myresourcegroup',
                               create_resource_group=False,
                               location='eastus2',
                               friendly_name='My workspace',
                               storage_account='subscriptions/<azure-subscription-id>/resourcegroups/myresourcegroup/providers/microsoft.storage/storageaccounts/mystorageaccount',
                               key_vault='subscriptions/<azure-subscription-id>/resourcegroups/myresourcegroup/providers/microsoft.keyvault/vaults/mykeyvault',
                               app_insights='subscriptions/<azure-subscription-id>/resourcegroups/myresourcegroup/providers/microsoft.insights/components/myappinsights',
                               container_registry='subscriptions/<azure-subscription-id>/resourcegroups/myresourcegroup/providers/microsoft.containerregistry/registries/mycontainerregistry',
                               exist_ok=False)
    

Mer information finns i Referens för arbetsyte-SDK.

Om du har problem med att komma åt din prenumeration kan du läsa Konfigurera autentisering för Azure Machine Learning-resurser och arbetsflöden, samt autentisering i Azure Machine Learning Notebook.

Nätverk

Viktigt

Mer information om hur du använder en privat slutpunkt och ett virtuellt nätverk med din arbetsyta finns i Nätverksisolering och sekretess.

Azure Machine Learning Python SDK tillhandahåller klassen PrivateEndpointConfig , som kan användas med Workspace.create() för att skapa en arbetsyta med en privat slutpunkt. Den här klassen kräver ett befintligt virtuellt nätverk.

Avancerat

Som standard lagras metadata för arbetsytan i en Azure Cosmos DB-instans som Microsoft underhåller. Dessa data krypteras med Microsoft-hanterade nycklar.

Om du vill begränsa de data som Microsoft samlar in på din arbetsyta väljer du Arbetsyta med hög affärspåverkan i portalen eller i hbi_workspace=true Python. Mer information om den här inställningen finns i Kryptering i vila.

Viktigt

Du kan bara välja hög affärspåverkan när du skapar en arbetsyta. Du kan inte ändra den här inställningen när arbetsytan har skapats.

Använda din egen datakrypteringsnyckel

Du kan ange en egen nyckel för datakryptering. När du gör det skapas Den Azure Cosmos DB-instans som lagrar metadata i din Azure-prenumeration. Mer information finns i Kundhanterade nycklar för Azure Machine Learning.

Använd följande steg för att ange din egen nyckel:

Viktigt

Innan du följer de här stegen måste du först utföra följande åtgärder:

Följ stegen i Konfigurera kundhanterade nycklar för att:

  • Registrera Azure Cosmos DB-providern
  • Skapa och konfigurera en Azure-Key Vault
  • Generera en nyckel

Använd cmk_keyvault och resource_cmk_uri för att ange den kundhanterade nyckeln.

from azureml.core import Workspace
   ws = Workspace.create(name='myworkspace',
               subscription_id='<azure-subscription-id>',
               resource_group='myresourcegroup',
               create_resource_group=True,
               location='eastus2'
               cmk_keyvault='subscriptions/<azure-subscription-id>/resourcegroups/myresourcegroup/providers/microsoft.keyvault/vaults/<keyvault-name>', 
               resource_cmk_uri='<key-identifier>'
               )

Ladda ned en konfigurationsfil

Om du ska använda en beräkningsinstans på arbetsytan för att köra koden hoppar du över det här steget. Beräkningsinstansen skapar och lagrar en kopia av den här filen åt dig.

Om du planerar att använda kod i din lokala miljö som refererar till den här arbetsytan (ws) skriver du konfigurationsfilen:

GÄLLER FÖR:Python SDK azureml v1

ws.write_config()

Placera filen i katalogstrukturen med dina Python-skript eller Jupyter Notebooks. Den kan finnas i samma katalog, en underkatalog med namnet .azureml eller i en överordnad katalog. När du skapar en beräkningsinstans läggs den här filen till i rätt katalog på den virtuella datorn åt dig.

Anslut till en arbetsyta

I Python-koden skapar du ett arbetsyteobjekt för att ansluta till din arbetsyta. Den här koden läser innehållet i konfigurationsfilen för att hitta din arbetsyta. Du uppmanas att logga in om du inte redan har autentiserats.

GÄLLER FÖR:Python SDK azureml v1

from azureml.core import Workspace

ws = Workspace.from_config()
  • Flera klienter. Om du har flera konton lägger du till klient-ID:t för den Azure Active Directory som du vill använda. Hitta ditt klientorganisations-ID från Azure Portal under Externa identiteter i Azure Active Directory.

    GÄLLER FÖR:Python SDK azureml v1

    from azureml.core.authentication import InteractiveLoginAuthentication
    from azureml.core import Workspace
    
    interactive_auth = InteractiveLoginAuthentication(tenant_id="my-tenant-id")
    ws = Workspace.from_config(auth=interactive_auth)
    
  • Nationellt moln. Du behöver extra kod för att autentisera till Azure om du arbetar i ett nationellt moln.

    GÄLLER FÖR:Python SDK azureml v1

    from azureml.core.authentication import InteractiveLoginAuthentication
    from azureml.core import Workspace
    
    interactive_auth = InteractiveLoginAuthentication(cloud="<cloud name>") # for example, cloud="AzureUSGovernment"
    ws = Workspace.from_config(auth=interactive_auth)
    

Om du har problem med att komma åt din prenumeration kan du läsa Konfigurera autentisering för Azure Machine Learning-resurser och arbetsflöden, samt autentisering i Azure Machine Learning Notebook.

Hitta en arbetsyta

Visa en lista över alla arbetsytor som du kan använda.

Hitta dina prenumerationer på sidan Prenumerationer i Azure Portal. Kopiera ID:t och använd det i koden nedan för att se alla arbetsytor som är tillgängliga för prenumerationen.

GÄLLER FÖR:Python SDK azureml v1

from azureml.core import Workspace

Workspace.list('<subscription-id>')

Metoden Workspace.list(..) returnerar inte det fullständiga arbetsyteobjektet. Den innehåller endast grundläggande information om befintliga arbetsytor i prenumerationen. Om du vill hämta ett fullständigt objekt för en viss arbetsyta använder du Workspace.get(..).

Ta bort en arbetsyta

Ta bort den när du inte längre behöver en arbetsyta.

Varning

Om mjuk borttagning är aktiverat för arbetsytan kan det återställas efter borttagningen. Om mjuk borttagning inte är aktiverat eller om du väljer alternativet att ta bort arbetsytan permanent kan den inte återställas. Mer information finns i Återställa en borttagen arbetsyta.

Om du har tagit bort arbetsytan av misstag kanske du fortfarande kan hämta dina anteckningsböcker. Mer information finns i Redundans för affärskontinuitet och haveriberedskap.

Ta bort arbetsytan ws:

GÄLLER FÖR:Python SDK azureml v1

ws.delete(delete_dependent_resources=False, no_wait=False)

Standardåtgärden är inte att ta bort resurser som är associerade med arbetsytan, d.v.s. containerregistret, lagringskontot, nyckelvalvet och application insights. Ställ även in delete_dependent_resources på True för att ta bort dessa resurser.

Rensa resurser

Viktigt

De resurser som du har skapat kan användas som förutsättningar för andra Azure Machine Learning-självstudier och instruktionsartiklar.

Om du inte planerar att använda någon av de resurser som du skapade tar du bort dem så att du inte debiteras några avgifter:

  1. I Azure-portalen väljer du Resursgrupper längst till vänster.

  2. Välj resursgruppen som du skapade från listan.

  3. Välj Ta bort resursgrupp.

    Skärmbild av valen för att ta bort en resursgrupp i Azure Portal.

  4. Ange resursgruppsnamnet. Välj sedan Ta bort.

Felsökning

  • Webbläsare som stöds i Azure Machine Learning-studio: Vi rekommenderar att du använder den senaste webbläsaren som är kompatibel med ditt operativsystem. Följande webbläsare stöds:

    • Microsoft Edge (Den nya Microsoft Edge, senaste versionen. Inte Microsoft Edge äldre)
    • Safari (senaste versionen, endast Mac)
    • Chrome (senaste versionen)
    • Firefox (senaste versionen)
  • Azure Portal:

    • Om du går direkt till din arbetsyta från en resurslänk från SDK:t eller Azure Portal kan du inte visa standardsidan Översikt som innehåller prenumerationsinformation i tillägget. I det här scenariot kan du inte heller växla till en annan arbetsyta. Om du vill visa en annan arbetsyta går du direkt till Azure Machine Learning-studio och söker efter arbetsytans namn.
    • Alla tillgångar (data, experiment, beräkningar och så vidare) är endast tillgängliga i Azure Machine Learning-studio. De är inte tillgängliga från Azure Portal.
    • Om du försöker exportera en mall för en arbetsyta från Azure Portal kan det returnera ett fel som liknar följande text: Could not get resource of the type <type>. Resources of this type will not be exported. Som en tillfällig lösning kan du använda en av mallarna som tillhandahålls på https://github.com/Azure/azure-quickstart-templates/tree/master/quickstarts/microsoft.machinelearningservices som grund för mallen.

Diagnostik för arbetsyta

Du kan köra diagnostik på din arbetsyta från Azure Machine Learning-studio eller Python SDK. När diagnostiken har körts returneras en lista över eventuella identifierade problem. Den här listan innehåller länkar till möjliga lösningar. Mer information finns i Så här använder du arbetsytediagnostik.

Resursproviderfel

När du skapar en Azure Machine Learning-arbetsyta eller en resurs som används av arbetsytan kan du få ett felmeddelande som liknar följande meddelanden:

  • No registered resource provider found for location {location}
  • The subscription is not registered to use namespace {resource-provider-namespace}

De flesta resursprovidrar registreras automatiskt, men inte alla. Om du får det här meddelandet måste du registrera den angivna providern.

Följande tabell innehåller en lista över de resursprovidrar som krävs av Azure Machine Learning:

Resursprovider Varför det behövs
Microsoft.MachineLearningServices Skapa Azure Machine Learning-arbetsytan.
Microsoft.Storage Azure Storage-kontot används som standardlagring för arbetsytan.
Microsoft.ContainerRegistry Azure Container Registry används av arbetsytan för att skapa Docker-avbildningar.
Microsoft.KeyVault Azure Key Vault används av arbetsytan för att lagra hemligheter.
Microsoft.Notebooks/NotebookProxies Integrerade notebook-filer på Azure Machine Learning-beräkningsinstansen.
Microsoft.ContainerService Om du planerar att distribuera tränade modeller till Azure Kubernetes Services.

Om du planerar att använda en kundhanterad nyckel med Azure Machine Learning måste följande tjänstleverantörer registreras:

Resursprovider Varför det behövs
Microsoft.DocumentDB/databaseAccounts Azure CosmosDB-instans som loggar metadata för arbetsytan.
Microsoft.Search/searchServices Azure Search tillhandahåller indexeringsfunktioner för arbetsytan.

Information om hur du registrerar resursprovidrar finns i Lösa fel vid registrering av resursprovider.

Ta bort Azure Container Registry

Azure Machine Learning-arbetsytan använder Azure Container Registry (ACR) för vissa åtgärder. Den skapar automatiskt en ACR-instans när den först behöver en.

Varning

När en Azure Container Registry har skapats för en arbetsyta ska du inte ta bort den. Om du gör det bryts din Azure Machine Learning-arbetsyta.

Nästa steg

När du har en arbetsyta kan du lära dig hur du tränar och distribuerar en modell.

Mer information om hur du planerar en arbetsyta för organisationens krav finns i Organisera och konfigurera Azure Machine Learning.

Information om hur du håller Azure Machine Learning uppdaterat med de senaste säkerhetsuppdateringarna finns i Sårbarhetshantering.