Szybki start: konfigurowanie maszyny wirtualnej Nauka o danych dla systemu Linux (Ubuntu)

Rozpocznij pracę z maszyną wirtualną z systemem Ubuntu 20.04 Nauka o danych (DSVM) i maszyną Wirtualną DSVM platformy Azure dla platformy PyTorch.

Wymagania wstępne

Potrzebujesz subskrypcji platformy Azure, aby utworzyć maszynę wirtualną z systemem Ubuntu 20.04 Nauka o danych lub maszynę wirtualną DSVM platformy Azure dla rozwiązania PyTorch. Wypróbuj platformę Azure bezpłatnie.

Uwaga

Bezpłatne konta platformy Azure nie obsługują jednostek SKU maszyn wirtualnych z obsługą procesora GPU.

Tworzenie maszyny wirtualnej Nauka o danych dla systemu Linux

W poniższych krokach opisano sposób tworzenia wystąpienia maszyny wirtualnej z systemem Ubuntu 20.04 Nauka o danych (DSVM) lub maszyny wirtualnej DsVM platformy Azure dla platformy PyTorch:

  1. Przejdź do portalu Azure Portal. Jeśli jeszcze nie zalogowałeś się, może zostać wyświetlony monit o zalogowanie się do konta platformy Azure

  2. Znajdź listę maszyn wirtualnych. Najpierw wpisz ciąg "data science virtual machine", a następnie wybierz pozycję "Nauka o danych Virtual Machine- Ubuntu 20.04" lub "Azure DSVM for PyTorch"

  3. W następnym oknie wybierz pozycję Utwórz

  4. Powinno nastąpić przekierowanie do bloku "Tworzenie maszyny wirtualnej"

  5. Wprowadź następujące informacje, aby skonfigurować każdy krok kreatora:

    1. Podstawy:

      • Subskrypcja: jeśli masz więcej niż jedną subskrypcję, wybierz tę, na której zostanie utworzona i naliczona maszyna. Musisz mieć uprawnienia do tworzenia zasobów dla tej subskrypcji.

      • Grupa zasobów: utwórz nową grupę lub użyj istniejącej.

      • Nazwa maszyny wirtualnej: wprowadź nazwę maszyny wirtualnej. Ta nazwa jest używana w witrynie Azure Portal.

      • Region: wybierz najbardziej odpowiednie centrum danych. W przypadku najszybszego dostępu do sieci jest to centrum danych, które ma większość danych lub znajduje się najbliżej twojej lokalizacji fizycznej. Aby uzyskać więcej informacji, odwiedź stronę Regiony platformy Azure.

      • Obraz: Nie zmieniaj wartości domyślnej.

      • Rozmiar: ta opcja powinna być automatycznie wypełniana przy użyciu rozmiaru odpowiedniego dla ogólnych obciążeń. Aby uzyskać więcej informacji, odwiedź stronę Rozmiary maszyn wirtualnych z systemem Linux na platformie Azure.

      • Typ uwierzytelniania: aby szybciej skonfigurować, wybierz pozycję "Hasło".

        Uwaga

        Jeśli planujesz używać usługi JupyterHub, upewnij się, że wybrano pozycję "Hasło", ponieważ usługa JupyterHub nie jest skonfigurowana do używania kluczy publicznych SSH.

      • Nazwa użytkownika: wprowadź nazwę użytkownika administratora. Ta nazwa użytkownika służy do logowania się do maszyny wirtualnej. Ta nazwa użytkownika nie musi być zgodna z nazwą użytkownika platformy Azure. Nie używaj wielkich liter.

        Ważne

        Jeśli używasz wielkich liter w nazwie użytkownika, aplikacja JupyterHub nie będzie działać i wystąpi błąd wewnętrzny serwera 500.

      • Hasło: wprowadź hasło, którego będziesz używać do logowania się do maszyny wirtualnej.

    2. Wybierz pozycję Przejrzyj i utwórz.

    3. Przeglądanie i tworzenie

      • Sprawdź, czy wszystkie wprowadzone informacje są poprawne.
      • Wybierz pozycję Utwórz.

    Proces aprowizacji powinien potrwać około 5 minut. W witrynie Azure Portal zostanie wyświetlony stan.

Jak uzyskać dostęp do maszyny wirtualnej z systemem Ubuntu Nauka o danych

Dostęp do maszyny DSVM z systemem Ubuntu można uzyskać na jeden z czterech sposobów:

  • Protokół SSH w sesjach terminalu
  • xrdp dla sesji graficznych
  • Program X2Go w sesjach graficznych
  • Serwery JupyterHub i JupyterLab w notesach programu Jupyter

SSH

Jeśli skonfigurowano maszynę wirtualną przy użyciu uwierzytelniania SSH, możesz zalogować się przy użyciu poświadczeń konta utworzonych w sekcji Podstawy kroku 3 dla interfejsu powłoki tekstu. Aby uzyskać więcej informacji, odwiedź stronę Dowiedz się więcej na temat nawiązywania połączenia z maszyną wirtualną z systemem Linux.

xrdp

xrdp to standardowe narzędzie do uzyskiwania dostępu do sesji graficznych systemu Linux. Chociaż dystrybucja domyślnie nie zawiera tego narzędzia, te instrukcje wyjaśniają, jak go zainstalować.

X2Go

Uwaga

Podczas testowania klient X2Go działał lepiej niż przekazywanie X11. Zalecamy użycie klienta X2Go dla graficznego interfejsu pulpitu.

Maszyna wirtualna z systemem Linux została już aprowizowana przy użyciu serwera X2Go i jest gotowa do akceptowania połączeń klienckich. Aby nawiązać połączenie z graficznym pulpitem maszyny wirtualnej z systemem Linux, wykonaj poniższą procedurę w obrębie klienta:

  1. Pobierz i zainstaluj klienta X2Go na platformie klienckiej z witryny X2Go.

  2. Zanotuj publiczny adres IP maszyny wirtualnej. W witrynie Azure Portal otwórz utworzoną maszynę wirtualną, aby znaleźć te informacje.

    Zrzut ekranu przedstawiający publiczny adres IP maszyny wirtualnej.

  3. Uruchom klienta X2Go. Jeśli okno "Nowa sesja" nie zostanie automatycznie wyświetlone, przejdź do pozycji Sesja —> nowa sesja.

  4. W wyświetlonym oknie konfiguracji wprowadź następujące parametry konfiguracji:

    • Karta Sesja:
      • Host: wprowadź adres IP maszyny wirtualnej, który został zanotowany wcześniej.
      • Logowanie: wprowadź nazwę użytkownika na maszynie wirtualnej z systemem Linux.
      • Port SSH: pozostaw go na 22. Jest to wartość domyślna.
      • Typ sesji: zmień wartość na XFCE. Obecnie maszyna wirtualna z systemem Linux obsługuje tylko pulpit XFCE.
    • Karta Nośnik: możesz wyłączyć obsługę dźwięku i drukowanie klienta, jeśli nie trzeba ich używać.
    • Foldery udostępnione: użyj tej karty, aby dodać katalog maszyny klienckiej, który chcesz zainstalować na maszynie wirtualnej.

    Zrzut ekranu przedstawiający preferencje dla nowej sesji X2Go.

  5. Wybierz przycisk OK.

  6. Wybierz pole w okienku po prawej stronie okna X2Go, aby wyświetlić ekran logowania dla maszyny wirtualnej.

  7. Wprowadź hasło maszyny wirtualnej.

  8. Wybierz przycisk OK.

  9. Może być konieczne nadanie uprawnienia X2Go w celu obejścia zapory w celu zakończenia procesu połączenia.

  10. Powinien zostać wyświetlony interfejs graficzny dla maszyny DSVM z systemem Ubuntu.

JupyterHub i JupyterLab

Maszyna DSVM z systemem Ubuntu uruchamia serwer JupyterHub z wieloma użytkownikami. Aby nawiązać połączenie, wykonaj następujące czynności:

  1. Zanotuj publiczny adres IP maszyny wirtualnej. Aby znaleźć tę wartość, wyszukaj i wybierz maszynę wirtualną w witrynie Azure Portal, jak pokazano na poniższym zrzucie ekranu:

    Zrzut ekranu przedstawiający publiczny adres IP maszyny wirtualnej.

  2. Na komputerze lokalnym otwórz przeglądarkę internetową i przejdź do https:// our-vm-ip:8000, zastępując ciąg "your-vm-ip" zanotowaną wcześniej adresem IP.

  3. Przeglądarka prawdopodobnie uniemożliwi bezpośrednie otwarcie strony. Może to spowodować wyświetlenie komunikatu o błędzie certyfikatu. Maszyna DSVM zapewnia zabezpieczenia z certyfikatem z podpisem własnym. Większość przeglądarek umożliwia wybranie opcji po tym ostrzeżeniu. Wiele przeglądarek będzie nadal dostarczać pewnego rodzaju ostrzeżenie wizualne dotyczące certyfikatu w całej sesji sieci Web.

    Uwaga

    Jeśli w przeglądarce zostanie wyświetlony ERR_EMPTY_RESPONSE komunikat o błędzie, upewnij się, że uzyskujesz dostęp do maszyny za pomocą jawnego protokołu HTTPS . Protokół HTTP lub tylko adres internetowy nie działają w tym kroku. Jeśli wpiszesz adres internetowy bez https:// w wierszu adresu, większość przeglądarek będzie domyślnie ustawiona na http, a zostanie wyświetlony błąd.

  4. Wprowadź nazwę użytkownika i hasło użyte do utworzenia maszyny wirtualnej i zaloguj się, jak pokazano na tym zrzucie ekranu

    Zrzut ekranu przedstawiający ekran logowania jupyterHub.

    Uwaga

    Jeśli na tym etapie zostanie wyświetlony błąd 500, prawdopodobnie użyto wielkich liter w nazwie użytkownika. Jest to znana interakcja między usługą Jupyter Hub a używanym modułem PAMAuthenticator. Jeśli zostanie wyświetlony błąd "Nie można uzyskać dostępu do tej strony", prawdopodobnie uprawnienia sieciowej grupy zabezpieczeń wymagają dostosowania. W witrynie Azure Portal znajdź zasób sieciowej grupy zabezpieczeń w grupie zasobów. Aby uzyskać dostęp do aplikacji JupyterHub z publicznego Internetu, musisz mieć otwarty port 8000. (Obraz pokazuje, że ta maszyna wirtualna jest skonfigurowana do uzyskiwania dostępu just in time, co jest zdecydowanie zalecane. Aby uzyskać więcej informacji, zobacz Zabezpieczanie portów zarządzania przy użyciu dostępu just in time.

    Zrzut ekranu przedstawiający wartości konfiguracji sieciowej grupy zabezpieczeń.

  5. Przeglądaj dostępne przykładowe notesy.

Aplikacja JupyterLab, następna generacja notesów Jupyter i JupyterHub, jest również dostępna. Aby uzyskać do niego dostęp, zaloguj się do witryny JupyterHub, a następnie przejdź do adresu URL https://your-vm-ip:8000/user/your-username/lab, zastępując ciąg "your-username" nazwą użytkownika wybraną podczas konfigurowania maszyny wirtualnej. Ponownie potencjalne błędy certyfikatów mogą początkowo blokować dostęp do witryny.

Aby ustawić narzędzie JupyterLab jako domyślny serwer notesu, dodaj ten wiersz do :/etc/jupyterhub/jupyterhub_config.py

c.Spawner.default_url = '/lab'

Następne kroki

  • Przewodnik dotyczący nauki o danych na maszynie wirtualnej Nauka o danych dla systemu Linux pokazuje, jak wykonać kilka typowych zadań nauki o danych z aprowizowaną maszyną DSVM z systemem Linux tutaj.
  • Wypróbuj narzędzia opisane w tym artykule, aby zapoznać się z różnymi narzędziami do nauki o danych na maszynie DSVM. Możesz również uruchomić dsvm-more-info powłokę na maszynie wirtualnej, aby uzyskać podstawowe wprowadzenie i wskaźniki, aby uzyskać więcej informacji na temat narzędzi zainstalowanych na maszynie wirtualnej.
  • Dowiedz się, jak systematycznie tworzyć rozwiązania analityczne za pomocą zespołu Nauka o danych Process.
  • Odwiedź witrynę Azure AI Gallery for machine learning and data analytics samples that use the Azure AI services (Galeria sztucznej inteligencji platformy Azure na potrzeby uczenia maszynowego i analizy danych), które korzystają z usług Azure AI.
  • Odwiedź odpowiednią dokumentację referencyjną dla tej maszyny wirtualnej.