Compartilhar via


Início Rápido: Configurar a Máquina Virtual de Ciência de Dados para Linux (Ubuntu)

Comece a usar a Máquina Virtual de Ciência de Dados (DSVM) do Ubuntu 20.04 e a DSVM do Azure para PyTorch.

Pré-requisitos

Você precisa de uma assinatura do Azure para criar uma Máquina Virtual de Ciência de Dados do Ubuntu 20.04 ou uma DSVM do Azure para PyTorch. Experimentar o Azure gratuitamente.

As contas gratuitas do Azure não dão suporte a SKUs de máquina virtual (VM) habilitada para GPU.

Criar sua Máquina Virtual de Ciência de Dados para Linux

Para criar uma instância da DSVM do Ubuntu 20.04 ou da DSVM do Azure para PyTorch:

  1. Acesse o portal do Azure. Você poderá receber uma solicitação para entrar na sua conta do Azure se ainda não tiver entrado.

  2. Encontre a listagem de VMs inserindo máquina virtual de ciência de dados. Em seguida, selecione Máquina Virtual de Ciência de Dados– Ubuntu 20.04 ou DSVM do Azure para PyTorch.

  3. Selecione Criar.

  4. No painel Criar uma máquina virtual, preencha a guia Informações básicas:

    • Assinatura: se você tiver mais de uma assinatura, selecione aquela em que o computador será criado e cobrado. Você deve ter privilégios de criação de recurso nessa assinatura.

    • Grupo de recursos: crie um novo grupo ou use um existente.

    • Nome da máquina virtual: insira o nome da VM. Esse nome é usado no portal do Azure.

    • Região: selecione o datacenter mais apropriado. Para você ter um acesso mais rápido à rede, o datacenter que hospeda a maior parte dos seus dados ou que está mais perto da sua localização física é a melhor opção. Para obter mais informações, consulte Regiões do Azure.

    • Imagem: não altere o valor padrão.

    • Tamanho: essa opção deve ser preenchida automaticamente com um tamanho apropriado para cargas de trabalho gerais. Para obter mais informações, consulte Tamanhos de VM Linux no Azure.

    • Tipo de Autenticação: para uma configuração mais rápida, selecione Senha.

      Observação

      Se você quer usar o JupyterHub, selecione Senha porque o JupyterHub não está configurado para usar as chaves públicas do Protocolo SSH (Secure Shell).

    • Nome de usuário: Insira o nome de usuário do administrador. Use esse nome de usuário para entrar na sua VM. Ele não precisa corresponder ao nome de usuário do Azure. Não use letras maiúsculas.

      Importante

      Se você usar letras maiúsculas no seu nome de usuário, o JupyterHub não funcionará e você encontrará um erro de 500 servidores internos.

    • Senha: insira a senha que você quer usar para entrar na sua VM.

  5. Selecione Examinar + criar.

  6. No painel Revisar + criar:

    • Verifique se todas as informações inseridas estão corretas.
    • Selecione Criar.

    O processo de provisionamento leva cerca de 5 minutos. Você pode exibir o status da sua VM no portal do Azure.

Acessar a Máquina Virtual de Ciência de Dados do Ubuntu

É possível acessar a DSVM do Ubuntu usando um de três métodos:

  • SSH para sessões de terminal
  • xrdp para sessões gráficas
  • X2Go para sessões gráficas
  • JupyterHub e JupyterLab para notebooks Jupyter

SSH

Se você configurou sua VM com a autenticação SSH, poderá entrar com as credenciais da conta que criou na seção Informações Básicas da Etapa 4 da interface do shell de texto. Para obter mais informações, consulte Saiba mais sobre como se conectar a uma VM do Linux.

xrdp

A ferramenta padrão para acessar sessões gráficas do Linux é xrdp. Embora a distribuição não inclua essa ferramenta por padrão, essas instruções explicam como instalá-la.

X2Go

Observação

No teste, o cliente X2Go teve um desempenho melhor que o encaminhamento X11. Recomendamos o uso do cliente X2Go para uma interface gráfica de área de trabalho.

A VM do Linux já está provisionada com o X2Go Server e está pronta para aceitar conexões de cliente. Para se conectar à área de trabalho gráfica da VM do Linux, realize o seguinte procedimento em seu cliente:

  1. Baixe e instale o cliente X2Go para sua plataforma de cliente X2Go.

  2. Anote o Endereço IP público da VM. No portal do Azure, abra a VM que você criou para encontrar essas informações.

    Captura de tela mostrando o endereço de IP público da VM.

  3. Execute o cliente X2Go. Se o painel Nova Sessão não aparecer automaticamente, selecione Sessão>Nova Sessão.

  4. No painel de configuração resultante, insira estes parâmetros de configuração:

    • Session:
      • Host: Insira o endereço IP da VM que foi anotado anteriormente.
      • Logon: Insira o nome de usuário na VM Linux.
      • Porta SSH: deixe-a no valor padrão 22.
      • Tipo de sessão: Altere o valor para XFCE. No momento, a VM Linux dá suporte apenas à área de trabalho XFCE.
    • Media: você pode desativar o suporte de som e a impressão do cliente se não precisar usá-los.
    • Pastas compartilhadas: use esta guia para adicionar o diretório do computador cliente que você quer montar na VM.

    Captura de tela mostrando as preferências de uma nova sessão X2Go.

  5. Selecione OK.

  6. Selecione a caixa no painel direito do painel X2Go para abrir o painel de entrada da VM.

  7. Insira a senha de sua VM.

  8. Selecione OK.

  9. Pode ser necessário dar permissão X2Go para ignorar o firewall e concluir o processo de conexão.

  10. Agora você deve ver a interface gráfica para sua DSVM do Ubuntu.

JupyterHub e JupyterLab

A DSVM do Ubuntu é executada JupyterHub, que é um servidor Jupyter multiusuário. Para se conectar, siga essas etapas:

  1. Anote o endereço IP público da sua VM. Para localizar esse valor, pesquise e selecione sua VM no portal do Azure, conforme mostrado nesta captura de tela:

    Captura de tela mostrando o endereço de IP público da sua VM.

  2. No computador local, abra um navegador da Web e acesse https://your-vm-ip:8000. Substitua seu vm-ip pelo endereço de IP que você anotou anteriormente.

  3. Seu navegador provavelmente impedirá que você abra o painel diretamente. Ele poderá dizer que há um erro de certificado. A DSVM fornece segurança com um certificado autoassinado. A maioria dos navegadores permitirá que você selecione após este aviso. Muitos navegadores continuarão a fornecer algum tipo de aviso visual sobre o certificado durante toda a sua sessão na Web.

    Se você vir a mensagem de erro ERR_EMPTY_RESPONSE em seu navegador, certifique-se de acessar o computador usando explicitamente o protocolo HTTPS. HTTP ou apenas o endereço da Web não funciona para esta etapa. Se você inserir o endereço da Web sem https:// na linha de endereço, a maioria dos navegadores usará como padrão para http e o erro será exibido.

  4. Insira o nome de usuário e a senha que você usou para criar a VM e entre, conforme mostrado nesta captura de tela

    Captura de tela mostrando o painel de entrada do JupyterHub.

    Se você receber um erro 500 nessa etapa, provavelmente usou letras maiúsculas no seu nome de usuário. Esse problema é uma interação conhecida entre o JupyterHub e o autenticador PAM que ele usa.

    Se você receber um erro "Não é possível acessar esta página", é provável que as permissões do grupo de segurança de rede (NSG) precisem de ajuste. No portal do Azure, localize o recurso NSG no seu grupo de recursos. Para acessar o JupyterHub da Internet pública, você deve ter a porta 8000 aberta. (A imagem mostra que essa VM está configurada para acesso just-in-time, o que é altamente recomendável. Para obter mais informações, consulte Proteger suas portas de gerenciamento com acesso just-in-time.)

    Captura de tela mostrando os valores de configuração do NSG.

  5. Navegue pelos notebooks de exemplo disponíveis.

O JupyterLab, a próxima geração de notebooks Jupyter e JupyterHub, também está disponível. Para acessá-lo, entre no JupyterHub. Em seguida, navegue até a URL https://your-vm-ip:8000/user/your-username/lab. Substitua seu-nome de usuário pelo nome de usuário que você escolheu quando configurou a VM. Novamente, possíveis erros de certificado podem inicialmente impedir que você acesse o site.

Para definir o JupyterLab como o servidor de notebook padrão, adicione essa linha a /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

Próximas etapas

  • Consulte passo a passo da Ciência de Dados na Máquina Virtual de Ciência de Dados para Linux para saber como realizar várias tarefas comuns da ciência de dados com a DSVM do Linux provisionada aqui.
  • Experimente as ferramentas que este artigo descreve para explorar as várias ferramentas de ciência de dados na DSVM. Você também pode executar dsvm-more-info no shell na VM para obter uma introdução básica e ponteiros para obter mais informações sobre as ferramentas instaladas na VM.
  • Saiba como criar soluções analíticas sistematicamente com o Processo de Ciência de Dados em Equipe.
  • Consulte a Galeria de IA do Azure para obter exemplos de aprendizado de máquina e análise de dados que usam os serviços de IA do Azure.
  • Consulte a documentação de referência apropriada desta VM.