Avvio rapido: Configurare Data Science Virtual Machine per Linux (Ubuntu)

Iniziare a usare La Data Science Virtual Machine (DSVM) ubuntu 20.04 e La DSVM di Azure per PyTorch.

Prerequisiti

È necessaria una sottoscrizione di Azure per creare una Data Science Virtual Machine Ubuntu 20.04 o una DSVM di Azure per PyTorch. Provare Azure gratuitamente.

Nota

Gli account Azure gratuiti non supportano SKU di macchine virtuali abilitate per GPU.

Creare la macchina virtuale per l'analisi scientifica dei dati per Linux

Questi passaggi descrivono come creare un'istanza di Ubuntu 20.04 Data Science Virtual Machine (DSVM) o azure DSVM per PyTorch:

  1. Vai al portale di Azure. Se non è ancora stato eseguito l'accesso, potrebbe essere visualizzato un prompt per accedere all'account Azure

  2. Trovare l'elenco delle macchine virtuali. Digitare prima "data science virtual machine" e quindi selezionare "Data Science Virtual Machine- Ubuntu 20.04" o "Azure DSVM per PyTorch"

  3. Nella finestra successiva selezionare Crea

  4. Si dovrebbe essere reindirizzati al pannello "Crea una macchina virtuale"

  5. Immettere le informazioni seguenti per configurare ogni passaggio della procedura guidata:

    1. Nozioni di base:

      • Sottoscrizione: se si ha più di una sottoscrizione, selezionare quella in cui verrà creata e fatturata la macchina virtuale. È necessario disporre di privilegi di creazione delle risorse per questa sottoscrizione.

      • Gruppo di risorse: creare un nuovo gruppo o usarne uno esistente.

      • Nome macchina virtuale: immettere il nome della macchina virtuale. Questo nome viene usato nel portale di Azure.

      • Area: selezionare il data center più appropriato. Per l'accesso alla rete più veloce, si tratta del data center con la maggior parte dei dati o più vicino alla posizione fisica. Per altre informazioni, vedere Aree di Azure.

      • Immagine: non modificare il valore predefinito.

      • Dimensioni: questa opzione dovrebbe essere completata automaticamente con dimensioni appropriate per carichi di lavoro generici. Per altre informazioni, vedere Dimensioni delle macchine virtuali Linux in Azure.

      • Tipo di autenticazione: per velocizzare la configurazione, selezionare "Password".

        Nota

        Se si prevede di usare JupyterHub, assicurarsi di selezionare "Password", perché JupyterHub non è configurato per l'uso delle chiavi pubbliche SSH.

      • Nome utente: immettere il nome utente dell'amministratore. Usare questo nome utente per accedere alla macchina virtuale. Questo nome utente non deve corrispondere al nome utente di Azure. Non usare lettere maiuscole.

        Importante

        Se si usano lettere maiuscole nel nome utente, JupyterHub non funzionerà e si verificherà un errore interno del server (errore 500).

      • Password: immettere la password da usare per accedere alla macchina virtuale.

    2. Selezionare Rivedi e crea.

    3. Rivedi e crea

      • Verificare che tutte le informazioni immesse siano corrette.
      • Seleziona Crea.

    Il processo di provisioning richiede circa 5 minuti. Il portale di Azure visualizza lo stato.

Come accedere alla Data Science Virtual Machine Ubuntu

È possibile accedere alla DSVM Ubuntu in uno dei quattro modi seguenti:

  • SSH per le sessioni terminale
  • xrdp per le sessioni grafiche
  • X2Go per le sessioni grafiche
  • JupyterHub e JupyterLab per i notebook di Jupyter

SSH

Se la macchina virtuale è stata configurata con l'autenticazione SSH, è possibile accedere con le credenziali dell'account create nella sezione Informazioni di base del passaggio 3 per l'interfaccia della shell di testo. Per altre informazioni, vedere Altre informazioni sulla connessione a una macchina virtuale Linux.

xrdp

xrdp è lo strumento standard per l'accesso alle sessioni grafiche Linux. Anche se la distribuzione non include questo strumento per impostazione predefinita, queste istruzioni spiegano come installarlo.

X2Go

Nota

Nei test, il client X2Go ha eseguito prestazioni migliori rispetto all'inoltro X11. È consigliabile usare il client X2Go per un'interfaccia desktop grafica.

Il provisioning della VM Linux è già stato eseguito con il server X2Go e la VM è pronta ad accettare le connessioni client. Per connettersi al desktop con interfaccia grafica della VM Linux, è necessario completare la procedura seguente nel client:

  1. Scaricare e installare il client X2Go per la piattaforma client da X2Go.

  2. Prendere nota dell'indirizzo IP pubblico della macchina virtuale. Nella portale di Azure aprire la macchina virtuale creata per trovare queste informazioni.

    Screenshot che mostra l'indirizzo IP pubblico della macchina virtuale.

  3. Eseguire il client X2Go. Se la finestra "Nuova sessione" non viene visualizzata automaticamente, passare a Sessione -> Nuova sessione.

  4. Nella finestra di configurazione risultante immettere questi parametri di configurazione:

    • Scheda Session(Sessione):
      • Host: immettere l'indirizzo IP della macchina virtuale annotato in precedenza.
      • Accesso: immettere il nome utente nella VM Linux.
      • Porta SSH: lasciarla 22. Questo è il valore predefinito.
      • Session Type(Tipo sessione): modificare il valore in XFCE. Attualmente, la VM Linux supporta solo l'ambiente desktop XFCE.
    • Scheda Media(Supporti): è possibile disattivare il supporto audio e la stampa client se non è necessario usarli.
    • Cartelle condivise: usare questa scheda per aggiungere la directory del computer client da montare sulla VM.

    Screenshot che mostra le preferenze per una nuova sessione X2Go.

  5. Seleziona OK.

  6. Selezionare nella casella nel riquadro destro della finestra X2Go per visualizzare la schermata di accesso per la macchina virtuale.

  7. Immettere la password per la VM.

  8. Seleziona OK.

  9. Potrebbe essere necessario concedere a X2Go l'autorizzazione per ignorare il firewall per completare il processo di connessione.

  10. Verrà ora visualizzata l'interfaccia grafica per la DSVM Ubuntu.

JupyterHub e JupyterLab

La DSVM Ubuntu esegue JupyterHub, un server Jupyter multiutente. Per connettersi, seguire questa procedura:

  1. Prendere nota dell'indirizzo IP pubblico della macchina virtuale. Per trovare questo valore, cercare e selezionare la macchina virtuale nel portale di Azure, come illustrato in questo screenshot:

    Screenshot che evidenzia l'indirizzo IP pubblico della macchina virtuale.

  2. Dal computer locale aprire un Web browser e passare a https:// your-vm-ip:8000, sostituendo "your-vm-ip" con l'indirizzo IP annotato in precedenza.

  3. Il browser probabilmente impedirà di aprire direttamente la pagina. Potrebbe indicare che si è verificato un errore di certificato. La DSVM offre sicurezza con un certificato autofirmato. La maggior parte dei browser consentirà di selezionare dopo questo avviso. Molti browser continueranno a fornire un certo tipo di avviso visivo sul certificato nell'intera sessione Web.

    Nota

    Se viene visualizzato il ERR_EMPTY_RESPONSE messaggio di errore nel browser, assicurarsi di accedere al computer usando esplicitamente il protocollo HTTPS . HTTP o solo l'indirizzo Web non funziona per questo passaggio. Se si digita l'indirizzo Web senza https:// nella riga dell'indirizzo, per impostazione predefinita httpla maggior parte dei browser sarà e verrà visualizzato l'errore.

  4. Immettere il nome utente e la password usati per creare la macchina virtuale e accedere, come illustrato in questo screenshot

    Screenshot della schermata di accesso di JupyterHub.

    Nota

    Se si riceve un errore 500 in questa fase, probabilmente hai usato lettere maiuscole nel tuo nome utente. Si tratta di un'interazione nota tra l'hub Jupyter e l'oggetto PAMAuthenticator che usa. Se viene visualizzato un errore "Non è possibile raggiungere questa pagina", è probabile che le autorizzazioni del gruppo di sicurezza di rete richiedano modifiche. Nel portale di Azure individuare la risorsa gruppo di sicurezza di rete all'interno del gruppo di risorse. Per accedere a JupyterHub dalla rete Internet pubblica, è necessario che la porta 8000 sia aperta. L'immagine mostra che questa macchina virtuale è configurata per l'accesso JUST-In-Time, consigliato. Per altre informazioni, vedere Proteggere le porte di gestione con accesso JUST-In-Time.

    Screenshot dei valori di configurazione del gruppo di sicurezza di rete.

  5. Esplorare i notebook di esempio disponibili.

Sono disponibili anche JupyterLab, la prossima generazione di notebook Jupyter e JupyterHub. Per accedervi, accedere a JupyterHub e quindi passare all'URL https://your-vm-ip:8000/user/nome utente/lab, sostituendo "your-username" con il nome utente scelto al momento della configurazione della macchina virtuale. Anche in questo caso, potenziali errori di certificato potrebbero impedire inizialmente di accedere al sito.

Per impostare JupyterLab come server notebook predefinito, aggiungere questa riga a /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

Passaggi successivi

  • La procedura dettagliata data science nella data science virtual machine per Linux illustra come eseguire diverse attività comuni di data science con la DSVM Linux di cui è stato effettuato il provisioning qui.
  • Provare gli strumenti descritti in questo articolo per esplorare i vari strumenti di data science nella DSVM. È anche possibile eseguire dsvm-more-info nella shell della macchina virtuale per un'introduzione di base e per visualizzare collegamenti ad altre informazioni sugli strumenti installati nella VM.
  • Informazioni su come creare sistematicamente soluzioni analitiche con il processo di analisi scientifica dei dati per i team.
  • Per esempi di apprendimento automatico e di analisi dei dati che usano i servizi di intelligenza artificiale per Azure, visitare Azure AI Gallery.
  • Visitare la documentazione di riferimento appropriata per questa macchina virtuale.