Quickstart: De Data Science Virtual Machine instellen voor Linux (Ubuntu)

Ga aan de slag met de Ubuntu 20.04-Data Science Virtual Machine en Azure DSVM voor PyTorch.

Vereisten

Als u een Ubuntu 20.04-Data Science Virtual Machine of een Azure-DSVM voor PyTorch wilt maken, moet u een Azure-abonnement hebben. Azure gratis uitproberen.

Notitie

Gratis Azure-accounts bieden geen ondersteuning voor SKU’s voor virtuele machines met GPU ingeschakeld.

Uw Data Science Virtual Machine voor Linux maken

Dit zijn de stappen voor het maken van een exemplaar van de Ubuntu 20.04-Data Science Virtual Machine of de Azure DSVM voor PyTorch:

  1. Ga naar de Azure Portal. Als u nog niet bent aangemeld bij uw Azure-account, wordt u gevraagd om dit te doen.

  2. Zoek de vermelding van de virtuele machine door 'data science virtual machine' te typen en 'Data Science Virtual Machine- Ubuntu 20.04' of 'Azure DSVM for PyTorch' te selecteren

  3. Selecteer Maken in het volgende venster.

  4. U wordt omgeleid naar de blade Een virtuele machine maken.

  5. Voer de volgende gegevens in voor het configureren van elke stap in de wizard:

    1. Basisprincipes:

      • Abonnement: Als u meer dan één abonnement hebt, selecteert u datgene waarop de machine wordt gemaakt en gefactureerd. U hebt privileges voor het maken van resources nodig voor dit abonnement.

      • Resourcegroep: Maak een nieuwe groep of gebruik een bestaande.

      • Naam van virtuele machine: Voer de naam van de virtuele machine in. Deze naam wordt gebruikt in uw Azure Portal.

      • Regio: Selecteer het geschiktste datacenter. Dit is het datacenter waarop de meeste van uw gegevens zijn opgeslagen of dat zich fysiek het dichtst bij u in de buurt bevindt, voor de snelste netwerktoegang. Meer informatie over Azure-regio's.

      • Installatiekopie: Laat de standaardwaarde staan.

      • Grootte: Deze optie moet automatisch worden gevuld met een grootte die geschikt is voor algemene werkbelastingen. VM Linux VM-grootten in Azure.

      • Verificatietype: Selecteer Wachtwoord voor snellere installatie.

        Notitie

        Als u JupyterHub wilt gebruiken moet u Wachtwoord selecteren, omdat JupyterHub niet is geconfigureerd voor het gebruik van openbare SSH-sleutels.

      • Gebruikersnaam: Voer de gebruikersnaam van de beheerder in. Met deze gebruikersnaam meldt u zich aan bij de virtuele machine. Deze gebruikersnaam hoeft niet hetzelfde te zijn als uw Azure-gebruikersnaam. Gebruik geen hoofdletters.

        Belangrijk

        Als u hoofdletters gebruikt in de gebruikersnaam, werkt JupyterHub niet en krijgt u een foutmelding 500 Interne serverfout.

      • Wachtwoord: Voer het wachtwoord in waarmee u zich gaat aanmelden bij de virtuele machine.

    2. Selecteer Controleren + maken.

    3. Beoordelen en maken

      • Controleer of alle informatie die u hebt ingevoerd, correct is.
      • Selecteer Maken.

    Het inrichten duurt ongeveer 5 minuten. De status wordt weergegeven in de Azure Portal.

Toegang tot de Ubuntu Data Science Virtual Machine

U hebt op vier manieren toegang tot de Ubuntu-DSVM:

  • SSH voor terminalsessies
  • xrdp voor grafische sessies
  • X2Go voor grafische sessies
  • JupyterHub en JupyterLab voor Jupyter-notebooks

SSH

Als u uw VM hebt geconfigureerd met SSH-verificatie, kunt u zich aanmelden met de accountreferenties die u hebt gemaakt in de sectie Basisbeginselen van stap 3 voor de text shell-interface. Meer informatie over verbinding maken met een Linux-VM.

Xrdp

xrdp is het standaardhulpprogramma voor toegang tot grafische Linux-sessies. Hoewel dit niet standaard is opgenomen in de distributie, kunt u deze installeren door deze instructies te volgen.

X2Go

Notitie

In tests presteerde de X2Go-client beter dan X11-doorsturing. Voor een grafische desktop adviseren we het gebruik van de X2Go-client.

De virtuele Linux-machine is al ingericht met X2Go Server en is klaar om clientverbindingen te accepteren. Om verbinding te maken met het grafische bureaublad van de virtuele Linux-machine, voert u de volgende procedure uit op de client:

  1. Download en installeer de X2Go-client voor uw clientplatform van X2Go.

  2. Noteer het openbare IP-adres van de virtuele machine, dat u in de Azure Portal kunt vinden door de virtuele machine te openen die u hebt gemaakt.

    IP-adres Ubuntu-machine

  3. Start de X2Go-client. Als het venster 'Nieuwe sessie' niet automatisch wordt weergegeven, gaat u naar Sessie -> Nieuwe sessie.

  4. Voer in het configuratievenster dat wordt geopend de volgende configuratieparameters in:

    • Tabblad sessie:
      • Host: Voer het IP-adres van uw virtuele machine in, dat u eerder hebt genoteerd.
      • Aanmelden: Voer de gebruikersnaam in op de virtuele Linux-machine.
      • SSH-poort: Behoud de standaardwaarde 22.
      • Sessietype: Wijzig de waarde in XFCE. Momenteel ondersteunt de virtuele Linux-machine alleen het XFCE-bureaublad.
    • Tabblad media: U kunt ondersteuning voor geluid en afdrukken met de client uitschakelen als u die niet nodig hebt.
    • Gedeelde mappen: Gebruik dit tabblad om de map op de clientmachine toe te voegen die u wilt koppelen aan de virtuele machine.

    X2go-configuratie

  5. Selecteer OK.

  6. Klik op het vak in het rechterdeelvenster van het X2Go-venster om het aanmeldingsscherm voor uw virtuele machine weer te geven.

  7. Voer het wachtwoord voor de virtuele machine in.

  8. Selecteer OK.

  9. Mogelijk moet u X2Go toestemming geven om uw firewall te omzeilen voor het voltooien van de verbinding.

  10. De grafische interface van de Ubuntu Data Science Virtual Machine wordt nu weergegeven.

JupyterHub en Jupyterlab

Op de Ubuntu DSVM wordt JupyterHub uitgevoerd, een Jupyter-server voor meerdere gebruikers. Voer dan de volgende stappen uit om verbinding te maken:

  1. Noteer het openbare IP-adres van uw virtuele machine door de virtuele machine in de Azure Portal te zoeken en te selecteren. IP-adres van Ubuntu-machine

  2. Open vanaf uw lokale computer een webbrowser en navigeer naar https://your-vm-ip:8000, waarbij u 'uw-vm-ip' vervangt door het IP-adres dat u eerder hebt genoteerd.

  3. Waarschijnlijk kunt u de pagina niet rechtstreeks openen in de browser vanwege een certificaatfout. De DSVM is beveiligd met een zelfondertekend certificaat. In de meeste browsers kunt u verdergaan na deze waarschuwing. In veel browsers wordt er gedurende de websessie een visuele waarschuwing over het certificaat getoond.

    Notitie

    Als het foutbericht ERR_EMPTY_RESPONSE in uw browser wordt weergegeven, controleert u of u toegang hebt tot de computer door expliciet het HTTPS-protocol te gebruiken en niet HTTP of alleen het webadres. Als u het webadres zonder https:// in de adresregel typt, gaan de meeste browsers standaard naar http en dan ziet u deze fout.

  4. Voer de gebruikersnaam en het wachtwoord in die u hebt gebruikt om de virtuele machine te maken en meld u aan.

    Aanmeldingsgegevens Jupyter invoeren

    Notitie

    Als er in deze fase een 500-fout wordt weergegeven, hebt u waarschijnlijk hoofdletters gebruikt in uw gebruikersnaam. Dit is een bekende interactie tussen Jupyter Hub en de PAMAuthenticator die wordt gebruikt. Als u de fout 'Kan deze pagina niet bereiken' ontvangt, moeten uw machtigingen voor de netwerkbeveiligingsgroep waarschijnlijk worden aangepast. Zoek in Azure Portal de netwerkbeveiligingsgroep binnen de resourcegroep. Als u via openbaar internet toegang wilt tot JupyterHub, moet poort 8000 open zijn. (In de afbeelding ziet u dat deze VM is geconfigureerd voor Just-In-Time-toegang. Dit wordt ten zeerste aanbevolen. Zie Uw beheerpoorten beveiligen met Just-In-Time-toegang.) Configuratie van netwerkbeveiligingsgroep

  5. Blader door de vele beschikbare voorbeeldnotitieblokken.

Jupyterlab, de volgende generatie Jupyter-notebooks en JupyterHub, is ook beschikbaar. Als u toegang wilt krijgen, meldt u zich aan bij JupyterHub en bladert u naar de URL https://your-vm-ip:8000/user/your-username/lab, waarbij u 'uw-gebruikersnaam' vervangt door de gebruikersnaam die u hebt gekozen bij het configureren van de VM. Ook nu wordt de toegang tot de site mogelijk geblokkeerd vanwege een certificaatfout.

U kunt Jupyterlab instellen als de standaard notebookserver door deze regel toe te voegen aan /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

Volgende stappen

U kunt nu verder leren en verkennen:

  • Zie Datatechnologie op de Linux Data Science Virtual Machine voor een overzicht waarin wordt getoond hoe u enkele algemene data-sciencetaken uitvoert met de Linux DSVM die hier is ingericht.
  • U kunt de verschillende hulpprogramma’s voor data science op de DSVM verkennen door de hulpprogramma’s uit te proberen die in dit artikel worden beschreven. U kunt ook dsvm-more-info uitvoeren in de shell in de virtuele machine voor een basisintroductie en verwijzingen naar meer informatie over de hulpprogramma’s die op de virtuele machine zijn geïnstalleerd.
  • Meer informatie over het systematisch bouwen van analytische oplossingen met het Team Data Science Process.
  • Ga naar de Azure AI Gallery voor voorbeelden van machine learning en gegevensanalyse die gebruikmaken van de Azure AI-services.
  • Raadpleeg de bijbehorende referentiedocumentatie voor deze virtuele machine.