Snabbstart: Konfigurera den Datavetenskap virtuella datorn för Linux (Ubuntu)

Kom igång med Ubuntu 20.04 Datavetenskap Virtual Machine (DSVM) och Azure DSVM för PyTorch.

Förutsättningar

Du behöver en Azure-prenumeration för att skapa antingen en Ubuntu 20.04-Datavetenskap virtuell dator eller en Azure DSVM för PyTorch. Prova Azure kostnadsfritt.

Kommentar

Kostnadsfria Azure-konton stöder inte GPU-aktiverade SKU:er för virtuella datorer.

Skapa en Datavetenskap virtuell dator för Linux

De här stegen beskriver hur du skapar en instans av antingen Ubuntu 20.04 Datavetenskap Virtual Machine (DSVM) eller Azure DSVM for PyTorch:

  1. Gå till Azure-portalen. Du kan få en uppmaning om att logga in på ditt Azure-konto om du inte har loggat in ännu

  2. Hitta listan över virtuella datorer. Skriv först "data science virtual machine" och välj sedan "Datavetenskap Virtual Machine- Ubuntu 20.04" eller "Azure DSVM for PyTorch"

  3. I nästa fönster väljer du Skapa

  4. Du bör omdirigeras till bladet "Skapa en virtuell dator"

  5. Ange följande information för att konfigurera varje steg i guiden:

    1. Grunderna:

      • Prenumeration: Om du har fler än en prenumeration väljer du den som datorn ska skapas och faktureras på. Du måste ha behörighet att skapa resurser för prenumerationen.

      • Resursgrupp: Skapa en ny grupp eller använd en befintlig.

      • Namn på virtuell dator: Ange namnet på den virtuella datorn. Det här namnet används i Azure-portalen.

      • Region: Välj det datacenter som är lämpligast. För snabbast nätverksåtkomst är detta det datacenter som har de flesta av dina data, eller som ligger närmast din fysiska plats. Mer information finns i Azure-regioner.

      • Bild: Ändra inte standardvärdet.

      • Storlek: Det här alternativet bör fyllas i automatiskt med en storlek som är lämplig för allmänna arbetsbelastningar. Mer information finns i Storlekar på virtuella Linux-datorer i Azure.

      • Autentiseringstyp: För snabbare installation väljer du "Lösenord".

        Kommentar

        Om du planerar att använda JupyterHub måste du välja "Lösenord", eftersom JupyterHub inte har konfigurerats för att använda offentliga SSH-nycklar.

      • Användarnamn: Ange administratörens användarnamn. Du använder det här användarnamnet för att logga in på den virtuella datorn. Det här användarnamnet behöver inte matcha ditt Azure-användarnamn. Använd inte versaler.

        Viktigt!

        Om du använder versaler i ditt användarnamn fungerar inte JupyterHub och det uppstår ett 500 internt serverfel.

      • Lösenord: Ange det lösenord som du ska använda för att logga in på den virtuella datorn.

    2. Välj Granska + skapa.

    3. Granska+skapa

      • Kontrollera att all information som du har angett är korrekt.
      • Välj Skapa.

    Etableringsprocessen bör ta cirka 5 minuter. Azure-portalen visar statusen.

Så här kommer du åt den virtuella Ubuntu-Datavetenskap-datorn

Du kan komma åt Ubuntu DSVM på något av fyra sätt:

  • SSH för terminalsessioner
  • xrdp för grafiska sessioner
  • X2Go för grafiska sessioner
  • JupyterHub och JupyterLab för Jupyter Notebook

SSH

Om du har konfigurerat den virtuella datorn med SSH-autentisering kan du logga in med de kontoautentiseringsuppgifter som du skapade i avsnittet Grundläggande i steg 3 för textgränssnittet. Mer information finns i Läs mer om hur du ansluter till en virtuell Linux-dator.

Xrdp

xrdp är standardverktyget för åtkomst till grafiska Linux-sessioner. Även om distributionen inte innehåller det här verktyget som standard, förklarar dessa instruktioner hur du installerar det.

X2Go

Kommentar

Vid testningen presterade X2Go-klienten bättre än X11-vidarebefordran. Vi rekommenderar att du använder X2Go-klienten för ett grafiskt skrivbordsgränssnitt.

Den virtuella Linux-datorn är redan etablerad med X2Go-servern och är redo att ta emot klientanslutningar. För att ansluta till den virtuella Linux-datorns grafiska skrivbord, slutför du följande procedur på klienten:

  1. Hämta och installera X2Go-klienten för klientplattformen från X2Go.

  2. Observera den virtuella datorns offentliga IP-adress. Öppna den virtuella datorn som du skapade i Azure-portalen för att hitta den här informationen.

    Skärmbild som visar den virtuella datorns offentliga IP-adress.

  3. Kör X2Go-klienten. Om fönstret "Ny session" inte visas automatiskt går du till Session –> Ny session.

  4. Ange följande konfigurationsparametrar i det resulterande konfigurationsfönstret:

    • Fliken Session:
      • Värd: Ange IP-adressen för den virtuella datorn, som du antecknade tidigare.
      • Inloggning: Ange användarnamnet på den virtuella Linux-datorn.
      • SSH-port: Låt den vara 22. Detta är standardvärdet.
      • Sessionstyp: Ändra värdet till XFCE. Den virtuella Linux-datorn har för närvarande endast stöd för XFCE Desktop.
    • Medieflik: Du kan inaktivera ljudstöd och klientutskrifter om du inte behöver använda dem.
    • Delade mappar: Använd den här fliken om du vill lägga till den klientdatorkatalog som du vill montera på den virtuella datorn.

    Skärmbild som visar inställningar för en ny X2Go-session.

  5. Välj OK.

  6. Välj i rutan i den högra rutan i X2Go-fönstret för att visa inloggningsskärmen för den virtuella datorn.

  7. Ange lösenordet för den virtuella datorn.

  8. Välj OK.

  9. Du kan behöva ge X2Go behörighet att kringgå brandväggen för att slutföra anslutningsprocessen.

  10. Nu bör du se det grafiska gränssnittet för din Ubuntu DSVM.

JupyterHub och JupyterLab

Ubuntu DSVM kör JupyterHub, en Jupyter-server med flera användare. Utför följande steg för att ansluta:

  1. Observera den offentliga IP-adressen för den virtuella datorn. Du hittar det här värdet genom att söka efter och välja den virtuella datorn i Azure-portalen, som du ser i den här skärmbilden:

    Skärmbild som visar den offentliga IP-adressen för den virtuella datorn.

  2. Öppna en webbläsare från den lokala datorn och gå till https:// your-vm-ip:8000 och ersätt "your-vm-ip" med den IP-adress som du antecknade tidigare.

  3. Webbläsaren förhindrar förmodligen att du öppnar sidan direkt. Det kan bero på ett certifikatfel. DSVM ger säkerhet med ett självsignerat certifikat. De flesta webbläsare gör att du kan välja igenom efter den här varningen. Många webbläsare fortsätter att ge någon form av visuell varning om certifikatet under hela webbsessionen.

    Kommentar

    Om du ser felmeddelandet ERR_EMPTY_RESPONSE i webbläsaren kontrollerar du att du har åtkomst till datorn genom att uttryckligen använda HTTPS-protokollet . HTTP eller bara webbadressen fungerar inte för det här steget. Om du skriver webbadressen utan https:// på adressraden kommer de flesta webbläsare som standard att httpvara , och felet visas.

  4. Ange användarnamnet och lösenordet som du använde för att skapa den virtuella datorn och logga in, som du ser i den här skärmbilden

    Skärmbild av jupyterHub-inloggningsskärmen.

    Kommentar

    Om du får ett 500-fel i det här skedet använde du förmodligen versaler i ditt användarnamn. Detta är en känd interaktion mellan Jupyter Hub och PAMAuthenticator som används. Om du får felet "Det går inte att nå den här sidan" är det troligt att behörigheterna för nätverkssäkerhetsgruppen behöver justeras. Leta reda på resursen Nätverkssäkerhetsgrupp i resursgruppen i Azure-portalen. För att få åtkomst till JupyterHub från det offentliga Internet måste du ha port 8000 öppen. (Avbildningen visar att den här virtuella datorn är konfigurerad för just-in-time-åtkomst, vilket rekommenderas starkt. Mer information finns i Skydda dina hanteringsportar med just-in-time-åtkomst.)

    Skärmbild av konfigurationsvärden för nätverkssäkerhetsgrupp.

  5. Bläddra bland de tillgängliga exempelanteckningsböckerna.

JupyterLab, nästa generations Jupyter Notebooks och JupyterHub, är också tillgängligt. För att komma åt den loggar du in på JupyterHub och bläddrar sedan till URL:en https://your-vm-ip:8000/user/ditt användarnamn/labb och ersätter "ditt användarnamn" med det användarnamn du valde när du konfigurerade den virtuella datorn. Återigen kan potentiella certifikatfel till en början hindra dig från att komma åt webbplatsen.

Om du vill ange JupyterLab som standardserver för notebook-filer lägger du till den här raden i /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

Nästa steg

  • Genomgången Data science on the Datavetenskap Virtual Machine for Linux visar hur du utför flera vanliga datavetenskapsuppgifter med Linux DSVM som etableras här.
  • Prova de verktyg som beskrivs i den här artikeln för att utforska de olika datavetenskapsverktygen på DSVM. Du kan också köra dsvm-more-info på gränssnittet i den virtuella datorn för en grundläggande introduktion och pekare på mer information om verktygen som är installerade på den virtuella datorn.
  • Lär dig hur du systematiskt skapar analyslösningar med Team Datavetenskap Process.
  • Besök Azure AI-galleriet för maskininlärning och dataanalysexempel som använder Azure AI-tjänsterna.
  • Gå till lämplig referensdokumentation för den här virtuella datorn.