Snabbstart: Konfigurera Data Science Virtual Machine för Linux (Ubuntu)

Kom igång med Ubuntu 18.04 och Ubuntu 20.04 Data Science Virtual Machines.

Förutsättningar

Om du vill skapa en Ubuntu 18.04 eller Ubuntu 20.04 Data Science Virtual Machine måste du ha en Azure-prenumeration. Prova Azure kostnadsfritt.

Anteckning

Kostnadsfria Azure-konton stöder inte GPU-aktiverade SKU:er för virtuella datorer.

Skapa din Data Science Virtual Machine för Linux

Här följer stegen för att skapa en instans av Data Science Virtual Machine från Ubuntu 18.04 eller Ubuntu 20.04:

  1. Gå till Azure-portalen. Du kan uppmanas att logga in på ditt Azure-konto om du inte redan är inloggad.

  2. Hitta listan över virtuella datorer genom att skriva "data science virtual machine" och välja "Data Science Virtual Machine- Ubuntu 18.04" eller "Data Science Virtual Machine– Ubuntu 20.04"

  3. I nästa fönster väljer du Skapa.

  4. Du bör omdirigeras till bladet "Skapa en virtuell dator".

  5. Ange följande information för att konfigurera varje steg i guiden:

    1. Grunderna:

      • Prenumeration: Om du har fler än en prenumeration väljer du den som datorn ska skapas och faktureras på. Du måste ha behörighet att skapa resurser för prenumerationen.

      • Resursgrupp: Skapa en ny grupp eller använd en befintlig.

      • Namn på virtuell dator: Ange namnet på den virtuella datorn. Det här namnet används i Azure-portalen.

      • Region: Välj det datacenter som passar bäst. För snabbast nätverksåtkomst är det datacentret som har de flesta av dina data eller är närmast din fysiska plats. Läs mer om Azure-regioner.

      • Bild: Lämna standardvärdet.

      • Storlek: Det här alternativet bör fyllas i automatiskt med en storlek som är lämplig för allmänna arbetsbelastningar. Läs mer om storlekar på virtuella Linux-datorer i Azure.

      • Autentiseringstyp: För snabbare installation väljer du "Lösenord".

        Anteckning

        Om du tänker använda JupyterHub ska du välja "Lösenord" eftersom JupyterHub inte har konfigurerats för att använda offentliga SSH-nycklar.

      • Användarnamn: Ange administratörens användarnamn. Du använder det här användarnamnet för att logga in på den virtuella datorn. Det här användarnamnet behöver inte vara samma som ditt Azure-användarnamn. Använd inte versaler.

        Viktigt

        Om du använder versaler i ditt användarnamn fungerar inte JupyterHub och du får ett internt serverfel på 500.

      • Lösenord: Ange det lösenord som du ska använda för att logga in på den virtuella datorn.

    2. Välj Granska + skapa.

    3. Granska+skapa

      • Kontrollera att all information som du angav är korrekt.
      • Välj Skapa.

    Etableringen bör ta cirka 5 minuter. Statusen visas i Azure-portalen.

Så här kommer du åt Ubuntu Data Science Virtual Machine

Du kan komma åt Ubuntu DSVM på något av tre sätt:

  • SSH för terminalsessioner
  • X2Go för grafiska sessioner
  • JupyterHub och JupyterLab för Jupyter Notebook

SSH

Om du har konfigurerat den virtuella datorn med SSH-autentisering kan du logga in med de kontoautentiseringsuppgifter som du skapade i avsnittet Grundläggande i steg 3 för textgränssnittet. I Windows kan du ladda ned ett SSH-klientverktyg som PuTTY. Om du föredrar ett grafiskt skrivbord (X-fönstersystem) kan du använda X11-vidarebefordran på PuTTY.

Anteckning

X2Go-klienten presterade bättre än X11-vidarebefordring vid testning. Vi rekommenderar att du använder X2Go-klienten för ett grafiskt skrivbordsgränssnitt.

X2Go

Den virtuella Linux-datorn har redan etablerats med X2Go Server och är redo att acceptera klientanslutningar. För att ansluta till den virtuella Linux-datorns grafiska skrivbord, slutför du följande procedur på klienten:

  1. Hämta och installera X2Go-klienten för klientplattformen från X2Go.

  2. Anteckna den virtuella datorns offentliga IP-adress, som du hittar i Azure-portalen genom att öppna den virtuella dator som du skapade.

    Ubuntu machine IP address

  3. Kör X2Go-klienten. Om fönstret "Ny session" inte visas automatiskt går du till Session –> ny session.

  4. I konfigurationsfönstret anger du följande konfigurationsparametrar:

    • Fliken Session:
      • Värd: Ange IP-adressen för din virtuella dator, som du antecknade tidigare.
      • Logga in: Ange användarnamnet på den virtuella Linux-datorn.
      • SSH Port: Lämna det på 22, standardvärdet.
      • Sessionstyp: Ändra värdet till XFCE. Den virtuella Linux-datorn har för närvarande endast stöd för XFCE Desktop.
    • Fliken Media: Du kan stänga av ljudsupporten och klientutskrift om du inte behöver använda dem.
    • Delade mappar: Använd den här fliken om du vill lägga till en klientdatorkatalog som du vill montera på den virtuella datorn.

    X2go configuration

  5. Välj OK.

  6. Klicka på rutan i det högra fönstret i X2Go-fönstret för att visa inloggningsskärmen för den virtuella datorn.

  7. Ange lösenordet för den virtuella datorn.

  8. Välj OK.

  9. Du kan behöva ge X2Go-behörighet för att kringgå brandväggen för att slutföra anslutningen.

  10. Nu bör du se det grafiska gränssnittet för din Ubuntu DSVM.

JupyterHub och JupyterLab

Ubuntu DSVM kör JupyterHub, en Jupyter-server med flera användare. Anslut genom att utföra följande steg:

  1. Anteckna den offentliga IP-adressen för den virtuella datorn genom att söka efter och välja den virtuella datorn i Azure-portalen. Ubuntu machine IP address

  2. Öppna en webbläsare från den lokala datorn och gå till https://your-vm-ip:8000och ersätt "your-vm-ip" med den IP-adress som du antecknade tidigare.

  3. Webbläsaren förhindrar förmodligen att du öppnar sidan direkt, vilket talar om för dig att det finns ett certifikatfel. DSVM tillhandahåller säkerhet via ett självsignerat certifikat. De flesta webbläsare gör att du kan klicka dig igenom efter den här varningen. Många webbläsare fortsätter att ge någon form av visuell varning om certifikatet under hela webbsessionen.

    Anteckning

    Om du ser felmeddelandet ERR_EMPTY_RESPONSE i webbläsaren kontrollerar du att du har åtkomst till datorn genom att uttryckligen använda HTTPS-protokollet och inte genom att använda HTTP eller bara webbadressen. Om du skriver in webbadressen utan https:// på adressraden kommer de flesta webbläsare som standard att httpvara , och du ser det här felet.

  4. Ange användarnamnet och lösenordet som du använde för att skapa den virtuella datorn och logga in.

    Enter Jupyter login

    Anteckning

    Om du får ett 500-fel i det här skedet är det troligt att du använde versaler i ditt användarnamn. Det här är en känd interaktion mellan Jupyter Hub och PAMAuthenticator som används. Om du får felet "Det går inte att nå den här sidan" är det troligt att behörigheterna för nätverkssäkerhetsgruppen måste justeras. I Azure-portalen letar du reda på resursen Nätverkssäkerhetsgrupp i resursgruppen. För att få åtkomst till JupyterHub från det offentliga Internet måste du ha port 8000 öppen. (Avbildningen visar att den här virtuella datorn är konfigurerad för just-in-time-åtkomst, vilket rekommenderas starkt. Se Skydda dina hanteringsportar med just-in-time-åtkomst.) Configuration of Network Security Group

  5. Bläddra bland de många exempelanteckningsböcker som är tillgängliga.

JupyterLab, nästa generation Jupyter Notebooks och JupyterHub, är också tillgängligt. Om du vill komma åt den loggar du in på JupyterHub och bläddrar sedan till URL:en https://your-vm-ip:8000/user/your-username/laboch ersätter "ditt-användarnamn" med det användarnamn som du valde när du konfigurerade den virtuella datorn. Återigen kan du till en början blockeras från att komma åt webbplatsen på grund av ett certifikatfel.

Du kan ange JupyterLab som standardserver för notebook-filer genom att lägga till den här raden i /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

Nästa steg

Så här kan du fortsätta din inlärning och utforskning:

  • Genomgången Data science på Data Science Virtual Machine for Linux visar hur du utför flera vanliga datavetenskapsuppgifter med Linux DSVM som etableras här.
  • Utforska de olika datavetenskapsverktygen på DSVM genom att testa verktygen som beskrivs i den här artikeln. Du kan också köra dsvm-more-info på gränssnittet i den virtuella datorn för en grundläggande introduktion och pekar på mer information om de verktyg som är installerade på den virtuella datorn.
  • Lär dig hur du systematiskt skapar analytiska lösningar med hjälp av Team Data Science Process.
  • Besök Azure AI-galleriet för maskininlärnings- och dataanalysexempel som använder Azure AI-tjänsterna.
  • Läs lämplig referensdokumentation för den här virtuella datorn.