Démarrage rapide : Configurer la machine virtuelle Science des données pour Linux (Ubuntu)

Démarrez avec la machine virtuelle Ubuntu 20.04 Data Science et Azure DSVM pour PyTorch.

Prérequis

Pour créer une instance Data Science Virtual Machine Ubuntu 20.04 ou Azure DSVM pour PyTorch, vous devez avoir un abonnement Azure. Essayez Azure gratuitement.

Notes

Les comptes gratuits Azure ne prennent pas en charge les références SKU de machines virtuelles où le GPU est activé.

Créer une machine virtuelle pour la science des données pour Linux

Voici les étapes pour créer une instance de Data Science Virtual Machine Ubuntu 20.04 ou d’Azure DSVM pour PyTorch :

  1. Accédez au portail Azure. Si vous n’êtes pas connecté, vous pouvez être invité à vous connecter à votre compte Azure.

  2. Trouvez la liste des machines virtuelles en tapant "data science virtual machine" et en sélectionnant "Data Science Virtual Machine- Ubuntu 20.04" ou "Azure DSVM for PyTorch"

  3. Dans la fenêtre suivante, sélectionnez Créer.

  4. Vous devez être redirigé vers le panneau « Créer une machine virtuelle ».

  5. Entrez les informations suivantes pour configurer chaque étape de l’Assistant :

    1. Paramètres de base:

      • Abonnement: Si vous disposez de plusieurs abonnements, sélectionnez celui qui sera associé à la création et à la facturation de la machine. Vous devez disposer des privilèges de création de ressources pour cet abonnement.

      • Groupe de ressources : Créez un groupe ou sélectionnez-en un.

      • Nom de la machine virtuelle : Entrez le nom de la machine virtuelle. C’est le nom qui sera utilisé sur votre portail Azure.

      • Région : Sélectionnez le centre de données qui convient le mieux. Pour un accès réseau plus rapide, il s’agit du centre de données qui héberge la plupart de vos données ou du centre de données le plus proche de votre emplacement physique. Apprenez-en davantage sur les régions Azure.

      • Image : Conservez la valeur par défaut.

      • Size : Cette option doit être renseignée automatiquement avec une taille adaptée aux charges de travail générales. Découvrez-en plus sur les tailles des machines virtuelles Linux dans Azure.

      • Type d'authentification : Pour une configuration plus rapide, sélectionnez « Mot de passe ».

        Notes

        Si vous envisagez d’utiliser JupyterHub, veillez à sélectionner « Mot de passe », car JupyterHub n’est pas configuré pour utiliser des clés publiques SSH.

      • Nom d’utilisateur : Entrez le nom d’utilisateur de l’administrateur. C’est le nom d’utilisateur que vous utiliserez pour vous connecter à votre machine virtuelle. Ce nom d’utilisateur ne doit pas nécessairement être votre nom d’utilisateur Azure. N’utilisez pas de lettres majuscules.

        Important

        Si vous utilisez des lettres majuscules dans votre nom d’utilisateur, JupyterHub ne fonctionnera pas et vous rencontrerez une erreur 500 interne au serveur.

      • Mot de passe : Entrez le mot de passe que vous utiliserez pour vous connecter à votre machine virtuelle.

    2. Sélectionnez Revoir + créer.

    3. Vérifier+créer

      • Vérifiez que toutes les informations que vous avez saisies sont correctes.
      • Sélectionnez Create (Créer).

    L’approvisionnement prend environ 5 minutes. Cet état est affiché dans le portail Azure.

Comment accéder à la machine virtuelle Data Science Virtual Machine Ubuntu

Vous pouvez accéder à la machine DSVM Ubuntu de l’une des quatre manières suivantes:

  • SSH pour les sessions Terminal Server
  • xrdp pour les sessions graphiques
  • X2Go pour les sessions graphiques
  • JupyterHub et JupyterLab pour les blocs-notes Jupyter

SSH

Si vous avez configuré votre machine virtuelle avec l’authentification SSH, vous pouvez vous connecter avec les informations d’identification de compte que vous avez créées dans la section Paramètres de base de l’étape 3 pour l’interface d’interpréteur de commandes texte. En savoir plus sur la connexion à une machine virtuelle Linux.

xrdp

xrdp est l’outil standard permettant d’accéder aux sessions graphiques Linux. Bien qu’il ne soit pas inclus dans la distribution par défaut, vous pouvez l’installer en suivant ces instructions.

X2Go

Notes

Lors de tests, le client X2Go a obtenu de meilleures performances que le transfert X11. Nous recommandons d’utiliser le client X2Go pour une interface de bureau graphique.

La machine virtuelle Linux est déjà provisionnée avec le serveur X2Go et elle est prête à accepter des connexions clientes. Pour vous connecter au bureau graphique de la machine virtuelle Linux, effectuez les opérations suivantes sur votre client :

  1. Téléchargez et installez le client X2Go pour votre plateforme cliente sur X2Go.

  2. Notez l’adresse IP publique de la machine virtuelle, que vous pouvez trouver sur le portail Azure en ouvrant la machine virtuelle que vous avez créée.

    Adresse IP de la machine Ubuntu

  3. Exécutez le client X2Go. Si la fenêtre « Nouvelle session » ne s’affiche pas automatiquement, accédez à Session -> Nouvelle session.

  4. Dans la fenêtre de configuration obtenue, entrez les paramètres de configuration suivants :

    • Onglet Session:
      • Hôte : Entrez l’adresse IP de votre machine virtuelle, que vous avez notée précédemment.
      • Connexion : Entrez le nom d’utilisateur dans la machine virtuelle Linux.
      • Port SSH : conservez la valeur par défaut (22).
      • Type de session : remplacez la valeur par XFCE. La machine virtuelle Linux prend uniquement en charge l’environnement de bureau XFCE.
    • Onglet Multimédia : vous pouvez désactiver l’impression client et la prise en charge du son si vous n’en avez pas besoin.
    • Dossiers partagés : Utilisez cet onglet pour ajouter le répertoire de l’ordinateur client que vous souhaitez monter sur la machine virtuelle.

    Configuration X2go

  5. Sélectionnez OK.

  6. Cliquez sur la zone dans le volet droit de la fenêtre X2Go pour accéder à l’écran de connexion de votre machine virtuelle.

  7. Entrez le mot de passe de votre machine virtuelle.

  8. Sélectionnez OK.

  9. Vous devrez peut-être accorder à X2Go l’autorisation de contourner votre pare-feu pour terminer la connexion.

  10. Vous devez maintenant voir l’interface graphique de votre machine DSVM Ubuntu.

JupyterHub et JupyterLab

La machine DSVM Ubuntu exécute JupyterHub, qui est un serveur multi-utilisateur Jupyter. Pour vous connecter, effectuez les étapes suivantes :

  1. Notez l’adresse IP publique de votre machine virtuelle, en recherchant et en sélectionnant cette dernière dans le portail Azure. Adresse IP de la machine Ubuntu

  2. À partir de votre machine locale, ouvrez un navigateur web et accédez à https://your-vm-ip:8000, en remplaçant « your-vm-ip » par l’adresse IP que vous avez notée précédemment.

  3. Votre navigateur va probablement vous empêcher d’ouvrir la page directement en indiquant qu’il y a une erreur de certificat. DSVM (Data Science Virtual Machine) garantit la sécurité via un certificat auto-signé. La plupart des navigateurs vous permettent de cliquer après cet avertissement. De nombreux navigateurs maintiennent un genre d’avertissement visuel par rapport au certificat tout au long de votre session web.

    Notes

    Si le message d’erreur ERR_EMPTY_RESPONSE s’affiche dans votre navigateur, vérifiez que vous accédez à la machine en utilisant explicitement le protocole HTTPS, et non en utilisant HTTP ou simplement l’adresse web. Comme la plupart des navigateurs utilisent par défaut http, si vous tapez l’adresse web sans https:// dans la ligne d’adresse, vous verrez cette erreur.

  4. Pour vous connecter, entrez le nom d’utilisateur et le mot de passe que vous avez utilisés pour créer la machine virtuelle.

    Entrer la connexion Jupyter

    Notes

    Si vous obtenez une erreur 500 à ce stade, vous avez probablement utilisé des majuscules dans votre nom d’utilisateur. Il s’agit d’une interaction connue entre Jupyter Hub et le module PAMAuthenticator qu’il utilise. Si vous recevez une erreur « Impossible d’atteindre cette page », vous devrez probablement ajuster vos autorisations de groupe de sécurité réseau. Dans le portail Azure, recherchez la ressource de groupe de sécurité réseau dans votre groupe de ressources. Pour accéder à JupyterHub à partir de l’Internet public, le port 8000 doit être ouvert. (L'image montre que cette machine virtuelle est configurée pour un accès juste-à-temps, ce qui est fortement recommandé. Consultez Sécuriser vos ports de gestion avec un accès juste-à-temps.) Configuration du groupe de sécurité réseau

  5. Parcourez les nombreux exemples de notebooks disponibles.

JupyterLab, nouvelle génération de blocs-notes Jupyter, et JupyterHub, sont également disponibles. Pour y accéder, connectez-vous à JupyterHub, puis accédez à l’URL https://your-vm-ip:8000/user/your-username/lab, en remplaçant « your-username » par le nom d’utilisateur que vous avez choisi lors de la configuration de la machine virtuelle. Là encore, vous risquez dans un premier temps de ne pas pouvoir accéder au site en raison d’une erreur de certificat.

Vous pouvez définir JupyterLab en tant que serveur de notebooks par défaut en ajoutant la ligne suivante à /etc/jupyterhub/jupyterhub_config.py :

c.Spawner.default_url = '/lab'

Étapes suivantes

Voici comment poursuivre votre formation et votre exploration :

  • La procédure Science des données sur la machine virtuelle pour la science des données pour Linux vous montre comment effectuer plusieurs tâches courantes relatives à la science des données avec la machine virtuelle DSVM Linux provisionnée ici.
  • Explorez les différents outils de science des données sur la machine virtuelle DSVM en testant les outils décrits dans cet article. Vous pouvez également exécuter dsvm-more-info dans l’interpréteur de commandes sur la machine virtuelle pour accéder à une présentation de base et à des liens vers des informations supplémentaires concernant les outils installés sur la machine virtuelle.
  • Découvrez comment créer systématiquement des solutions analytiques à l’aide du processus TDSP (Team Data Science Process).
  • Pour des exemples d’apprentissage automatique et d’analyse de données utilisant les services d’intelligence artificielle d’Azure, visitez Azure AI Gallery.
  • Consultez la documentation de référence appropriée pour cette machine virtuelle.