Share via


Avvio rapido: Configurare Data Science Virtual Machine per Linux (Ubuntu)

Iniziare a usare La Data Science Virtual Machine (DSVM) ubuntu 20.04 e La DSVM di Azure per PyTorch.

Prerequisiti

È necessaria una sottoscrizione di Azure per creare una Data Science Virtual Machine Ubuntu 20.04 o una DSVM di Azure per PyTorch. Provare Azure gratuitamente.

Gli account gratuiti di Azure non supportano SKU di macchine virtuali abilitate per GPU.

Creare la macchina virtuale per l'analisi scientifica dei dati per Linux

Per creare un'istanza della DSVM Ubuntu 20.04 o della DSVM di Azure per PyTorch:

  1. Vai al portale di Azure. Se non è ancora stato eseguito l'accesso, potrebbe essere visualizzato un prompt per accedere all'account Azure.

  2. Trovare l'elenco di macchine virtuali immettendo la macchina virtuale per l'analisi scientifica dei dati. Selezionare quindi Data Science Virtual Machine- Ubuntu 20.04 o Azure DSVM per PyTorch.

  3. Seleziona Crea.

  4. Nel riquadro Crea una macchina virtuale compilare la scheda Informazioni di base :

    • Sottoscrizione: se si ha più di una sottoscrizione, selezionare quella in cui verrà creata e fatturata la macchina virtuale. È necessario disporre di privilegi di creazione delle risorse per questa sottoscrizione.

    • Gruppo di risorse: creare un nuovo gruppo o usarne uno esistente.

    • Nome macchina virtuale: immettere il nome della macchina virtuale. Questo nome viene usato nel portale di Azure.

    • Area: selezionare il data center più appropriato. Per l'accesso alla rete più veloce, il data center che ospita la maggior parte dei dati o si trova più vicino alla posizione fisica è la scelta migliore. Per altre informazioni, vedere Aree di Azure.

    • Immagine: non modificare il valore predefinito.

    • Dimensioni: questa opzione deve essere popolata automaticamente con una dimensione appropriata per i carichi di lavoro generali. Per altre informazioni, vedere Dimensioni delle macchine virtuali Linux in Azure.

    • Tipo di autenticazione: per la configurazione più rapida, selezionare Password.

      Nota

      Se si prevede di usare JupyterHub, assicurarsi di selezionare Password perché JupyterHub non è configurato per l'uso delle chiavi pubbliche del protocollo SSH (Secure Shell).

    • Nome utente: immettere il nome utente dell'amministratore. Usare questo nome utente per accedere alla macchina virtuale. Non è necessario che corrisponda al nome utente di Azure. Non usare lettere maiuscole.

      Importante

      Se si usano lettere maiuscole nel nome utente, JupyterHub non funzionerà e si verifica un errore interno del server 500.

    • Password: immettere la password che si prevede di usare per accedere alla macchina virtuale.

  5. Selezionare Rivedi e crea.

  6. Nel riquadro Rivedi e crea:

    • Verificare che tutte le informazioni immesse siano corrette.
    • Seleziona Crea.

    Il processo di provisioning richiede circa 5 minuti. È possibile visualizzare lo stato della macchina virtuale nella portale di Azure.

Accedere a Ubuntu Data Science Virtual Machine

È possibile accedere alla DSVM Ubuntu in uno dei quattro modi seguenti:

  • SSH per le sessioni terminale
  • xrdp per le sessioni grafiche
  • X2Go per le sessioni grafiche
  • JupyterHub e JupyterLab per i notebook di Jupyter

SSH

Se la macchina virtuale è stata configurata con l'autenticazione SSH, è possibile accedere con le credenziali dell'account create nella sezione Informazioni di base del passaggio 4 per l'interfaccia della shell di testo. Per altre informazioni, vedere Altre informazioni sulla connessione a una macchina virtuale Linux.

xrdp

Lo strumento standard per l'accesso alle sessioni grafiche Linux è xrdp. Anche se la distribuzione non include questo strumento per impostazione predefinita, queste istruzioni spiegano come installarlo.

X2Go

Nota

Nei test, il client X2Go ha eseguito prestazioni migliori rispetto all'inoltro X11. È consigliabile usare il client X2Go per un'interfaccia desktop grafica.

Il provisioning della VM Linux è già stato eseguito con il server X2Go e la VM è pronta ad accettare le connessioni client. Per connettersi al desktop con interfaccia grafica della VM Linux, è necessario completare la procedura seguente nel client:

  1. Scaricare e installare il client X2Go per la piattaforma client da X2Go.

  2. Prendere nota dell'indirizzo IP pubblico della macchina virtuale. Nella portale di Azure aprire la macchina virtuale creata per trovare queste informazioni.

    Screenshot che mostra l'indirizzo IP pubblico della macchina virtuale.

  3. Eseguire il client X2Go. Se il riquadro Nuova sessione non viene visualizzato automaticamente, selezionare Sessione>nuova.

  4. Nel riquadro di configurazione risultante immettere questi parametri di configurazione:

    • Sessione:
      • Host: immettere l'indirizzo IP della macchina virtuale annotato in precedenza.
      • Accesso: immettere il nome utente nella VM Linux.
      • Porta SSH: lasciare il valore predefinito 22.
      • Tipo di sessione: modificare il valore impostandolo su XFCE. Attualmente, la VM Linux supporta solo l'ambiente desktop XFCE.
    • Supporti: è possibile disattivare il supporto audio e la stampa client se non è necessario usarli.
    • Cartelle condivise: usare questa scheda per aggiungere la directory del computer client da montare nella macchina virtuale.

    Screenshot che mostra le preferenze per una nuova sessione X2Go.

  5. Seleziona OK.

  6. Selezionare la casella nel riquadro destro del riquadro X2Go per visualizzare il riquadro di accesso per la macchina virtuale.

  7. Immettere la password per la VM.

  8. Seleziona OK.

  9. Potrebbe essere necessario concedere a X2Go l'autorizzazione per ignorare il firewall per completare il processo di connessione.

  10. Verrà ora visualizzata l'interfaccia grafica per la DSVM Ubuntu.

JupyterHub e JupyterLab

La DSVM Ubuntu esegue JupyterHub, ovvero un server Jupyter multiutente. Per connettersi, seguire questa procedura:

  1. Prendere nota dell'indirizzo IP pubblico della macchina virtuale. Per trovare questo valore, cercare e selezionare la macchina virtuale nel portale di Azure, come illustrato in questo screenshot.

    Screenshot che mostra l'indirizzo IP pubblico della macchina virtuale.

  2. Dal computer locale aprire un Web browser e passare a https://your-vm-ip:8000. Sostituire your-vm-ip con l'indirizzo IP annotato in precedenza.

  3. Il browser probabilmente impedirà di aprire direttamente il riquadro. Potrebbe indicare che si è verificato un errore di certificato. La DSVM offre sicurezza con un certificato autofirmato. La maggior parte dei browser consentirà di selezionare dopo questo avviso. Molti browser continueranno a fornire un certo tipo di avviso visivo sul certificato durante la sessione Web.

    Se viene visualizzato il ERR_EMPTY_RESPONSE messaggio di errore nel browser, assicurarsi di accedere al computer usando esplicitamente il protocollo HTTPS . HTTP o solo l'indirizzo Web non funziona per questo passaggio. Se si immette l'indirizzo Web senza https:// nella riga dell'indirizzo, per la maggior parte dei browser verrà visualizzato l'impostazione predefinita http e verrà visualizzato l'errore.

  4. Immettere il nome utente e la password usati per creare la macchina virtuale e accedere, come illustrato in questo screenshot.

    Screenshot che mostra il riquadro di accesso di JupyterHub.

    Se viene visualizzato un errore 500 in questa fase, probabilmente hai usato lettere maiuscole nel tuo nome utente. Questo problema è un'interazione nota tra JupyterHub e l'autenticatore PAM usato.

    Se viene visualizzato un errore "Non è possibile raggiungere questa pagina", è probabile che le autorizzazioni del gruppo di sicurezza di rete (NSG) richiedano modifiche. Nella portale di Azure trovare la risorsa del gruppo di sicurezza di rete all'interno del gruppo di risorse. Per accedere a JupyterHub dalla rete Internet pubblica, è necessario aprire la porta 8000. L'immagine mostra che questa macchina virtuale è configurata per l'accesso JUST-In-Time, consigliato. Per altre informazioni, vedere Proteggere le porte di gestione con accesso JUST-In-Time.

    Screenshot che mostra i valori di configurazione del gruppo di sicurezza di rete.

  5. Esplorare i notebook di esempio disponibili.

Sono disponibili anche JupyterLab, la prossima generazione di notebook Jupyter e JupyterHub. Per accedervi, accedere a JupyterHub. Passare quindi all'URL https://your-vm-ip:8000/user/your-username/lab. Sostituire your-username con il nome utente scelto durante la configurazione della macchina virtuale. Anche in questo caso, potenziali errori di certificato potrebbero impedire inizialmente di accedere al sito.

Per impostare JupyterLab come server notebook predefinito, aggiungere questa riga a /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

Passaggi successivi

  • Per informazioni su come eseguire diverse attività comuni di data science con la DSVM Linux, vedere la procedura dettagliata relativa all'analisi scientifica dei dati nella Data Science Virtual Machine per Linux di cui è stato effettuato il provisioning qui.
  • Provare gli strumenti descritti in questo articolo per esplorare i vari strumenti di data science nella DSVM. È anche possibile eseguire dsvm-more-info nella shell all'interno della macchina virtuale per un'introduzione di base e puntatori per altre informazioni sugli strumenti installati nella macchina virtuale.
  • Informazioni su come creare sistematicamente soluzioni analitiche con il processo di analisi scientifica dei dati per i team.
  • Vedere Azure AI Gallery per esempi di machine learning e analisi dei dati che usano i servizi di intelligenza artificiale di Azure.
  • Vedere la documentazione di riferimento appropriata per questa macchina virtuale.