Guia de início rápido: configurar a máquina virtual de ciência de dados para Linux (Ubuntu)

Comece a trabalhar com a Máquina Virtual de Ciência de Dados (DSVM) do Ubuntu 20.04 e a DSVM do Azure para PyTorch.

Pré-requisitos

Você precisa de uma assinatura do Azure para criar uma Máquina Virtual de Ciência de Dados do Ubuntu 20.04 ou uma DSVM do Azure para PyTorch. Experimente o Azure gratuitamente.

Nota

As contas gratuitas do Azure não suportam SKUs de máquina virtual habilitadas para GPU.

Crie sua máquina virtual de ciência de dados para Linux

Estas etapas descrevem como criar uma instância da Máquina Virtual de Ciência de Dados (DSVM) do Ubuntu 20.04 ou da DSVM do Azure para PyTorch:

  1. Aceda ao portal do Azure. Poderá receber um pedido para iniciar sessão na sua conta do Azure se ainda não tiver iniciado sessão

  2. Encontre a listagem da máquina virtual. Primeiro, digite "máquina virtual de ciência de dados" e, em seguida, selecione "Máquina Virtual de Ciência de Dados - Ubuntu 20.04" ou "DSVM do Azure para PyTorch"

  3. Na janela seguinte, selecione Criar

  4. Você deve ser redirecionado para a folha "Criar uma máquina virtual"

  5. Insira as seguintes informações para configurar cada etapa do assistente:

    1. Noções básicas:

      • Assinatura: se você tiver mais de uma assinatura, selecione aquela na qual a máquina será criada e cobrada. Tem de ter privilégios de criação de recursos para esta subscrição.

      • Grupo de recursos: crie um novo grupo ou use um existente.

      • Nome da máquina virtual: insira o nome da máquina virtual. Esse nome é usado em seu portal do Azure.

      • Região: selecione o datacenter mais apropriado. Para um acesso mais rápido à rede, este é o datacenter que tem a maioria dos seus dados ou está mais próximo da sua localização física. Para obter mais informações, visite Regiões do Azure.

      • Imagem: Não altere o valor padrão.

      • Tamanho: esta opção deve ser preenchida automaticamente com um tamanho apropriado para cargas de trabalho gerais. Para obter mais informações, visite Tamanhos de VM do Linux no Azure.

      • Tipo de autenticação: Para uma configuração mais rápida, selecione "Senha".

        Nota

        Se você planeja usar o JupyterHub, certifique-se de selecionar "Senha", porque o JupyterHub não está configurado para usar chaves públicas SSH.

      • Nome de usuário: digite o nome de usuário do administrador. Você usa esse nome de usuário para fazer logon em sua máquina virtual. Esse nome de usuário não precisa corresponder ao seu nome de usuário do Azure. Não utilize letras maiúsculas.

        Importante

        Se você usar letras maiúsculas em seu nome de usuário, o JupyterHub não funcionará e você encontrará um erro de servidor interno 500.

      • Palavra-passe: introduza a palavra-passe que irá utilizar para iniciar sessão na sua máquina virtual.

    2. Selecione Rever + criar.

    3. Revisão+criação

      • Verifique se todas as informações inseridas estão corretas.
      • Selecione Criar.

    O processo de provisionamento deve levar cerca de 5 minutos. O portal do Azure exibe o status.

Como acessar a máquina virtual de ciência de dados do Ubuntu

Você pode acessar o Ubuntu DSVM de uma das quatro maneiras:

  • SSH para sessões de terminal
  • xrdp para sessões gráficas
  • X2Go para sessões gráficas
  • JupyterHub e JupyterLab para blocos de notas do Jupyter

SSH

Se você configurou sua VM com autenticação SSH, poderá entrar com as credenciais de conta criadas na seção Noções básicas da etapa 3 para a interface do shell de texto. Para obter mais informações, visite Saiba mais sobre como se conectar a uma VM Linux.

XRDP

xrdp é a ferramenta padrão para acessar sessões gráficas do Linux. Embora a distro não inclua essa ferramenta por padrão, estas instruções explicam como instalá-la.

X2Go

Nota

Nos testes, o cliente X2Go teve um desempenho melhor do que o encaminhamento X11. Recomendamos o uso do cliente X2Go para uma interface gráfica de desktop.

A VM do Linux já está aprovisionada com o X2Go Server e está pronta para aceitar ligações de cliente. Para se ligar ao ambiente de trabalho gráfico da VM do Linux, conclua o seguinte procedimento no seu cliente:

  1. Transfira e instale o X2Go Client na sua plataforma de cliente a partir do X2Go.

  2. Observe o endereço IP público da máquina virtual. No portal do Azure, abra a máquina virtual que você criou para localizar essas informações.

    Captura de tela mostrando o endereço IP público da máquina virtual.

  3. Execute o X2Go Client. Se a janela "Nova sessão" não aparecer automaticamente, vá para Sessão -> Nova sessão.

  4. Na janela de configuração resultante, insira estes parâmetros de configuração:

    • Guia Sessão:
      • Host: insira o endereço IP da sua VM, que você anotou anteriormente.
      • Login: Digite o nome de usuário na VM Linux.
      • Porto SSH: Deixe às 22. Este é o valor predefinido.
      • Tipo de sessão: altere o valor para XFCE. Atualmente, a VM do Linux apenas suporta o ambiente de trabalho XFCE.
    • Guia Mídia: você pode desativar o suporte de som e a impressão do cliente se não precisar usá-los.
    • Pastas compartilhadas: use esta guia para adicionar o diretório da máquina cliente que você gostaria de montar na VM.

    Captura de ecrã a mostrar preferências para uma nova sessão X2Go.

  5. Selecione OK.

  6. Selecione na caixa no painel direito da janela X2Go para abrir a tela de entrada para sua VM.

  7. Introduza a palavra-passe da sua VM.

  8. Selecione OK.

  9. Talvez seja necessário dar permissão ao X2Go para ignorar o firewall para concluir o processo de conexão.

  10. Agora você deve ver a interface gráfica para o seu Ubuntu DSVM.

JupyterHub e JupyterLab

O Ubuntu DSVM executa JupyterHub, um servidor Jupyter multiusuário. Para se conectar, execute as seguintes etapas:

  1. Observe o endereço IP público da sua VM. Para encontrar esse valor, pesquise e selecione sua VM no portal do Azure, conforme mostrado nesta captura de tela:

    Captura de ecrã a realçar o endereço IP público da sua VM.

  2. Na sua máquina local, abra um navegador da Web e navegue até https:// your-vm-ip:8000, substituindo "your-vm-ip" pelo endereço IP que você anotou anteriormente.

  3. Seu navegador provavelmente impedirá que você abra a página diretamente. Ele pode dizer que há um erro de certificado. A DSVM fornece segurança com um certificado autoassinado. A maioria dos navegadores permitirá que você selecione após este aviso. Muitos navegadores continuarão a fornecer algum tipo de aviso visual sobre o certificado durante toda a sessão da Web.

    Nota

    Se vir a ERR_EMPTY_RESPONSE mensagem de erro no navegador, certifique-se de que acede à máquina através da utilização explícita do protocolo HTTPS . HTTP ou apenas o endereço da Web não funcionam para esta etapa. Se você digitar o endereço da Web sem https:// na linha de endereço, a maioria dos navegadores assumirá como padrão httpo , e o erro aparecerá.

  4. Digite o nome de usuário e a senha que você usou para criar a VM e entre, conforme mostrado nesta captura de tela

    Captura de tela da tela de entrada do JupyterHub.

    Nota

    Se receber um erro 500 nesta fase, provavelmente utilizou letras maiúsculas no seu nome de utilizador. Esta é uma interação conhecida entre o Jupyter Hub e o PAMAuthenticator que ele usa. Se você receber um erro "Não é possível acessar esta página", é provável que as permissões do Grupo de Segurança de Rede precisem de ajustes. No portal do Azure, localize o recurso Grupo de Segurança de Rede no seu Grupo de Recursos. Para acessar o JupyterHub a partir da Internet pública, você deve ter a porta 8000 aberta. (A imagem mostra que essa VM está configurada para acesso just-in-time, o que é altamente recomendado. Para obter mais informações, visite Proteger suas portas de gerenciamento com acesso just-in-time.)

    Captura de ecrã dos valores de configuração do Grupo de Segurança de Rede.

  5. Navegue pelos blocos de anotações de exemplo disponíveis.

JupyterLab, a próxima geração de notebooks Jupyter e JupyterHub, também está disponível. Para acessá-lo, entre no JupyterHub e navegue até o URL https://your-vm-ip:8000/user/your-username/lab, substituindo "your-username" pelo nome de usuário que você escolheu quando configurou a VM. Novamente, possíveis erros de certificado podem inicialmente bloqueá-lo de acessar o site.

Para definir o JupyterLab como o servidor de bloco de anotações padrão, adicione esta linha a /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

Próximos passos

  • O passo a passo Ciência de dados na Máquina Virtual de Ciência de Dados para Linux mostra como fazer várias tarefas comuns de ciência de dados com a DSVM Linux provisionada aqui.
  • Experimente as ferramentas descritas neste artigo para explorar as várias ferramentas de ciência de dados na DSVM. Você também pode executar dsvm-more-info no shell dentro da máquina virtual para uma introdução básica e ponteiros para obter mais informações sobre as ferramentas instaladas na VM.
  • Aprenda a construir sistematicamente soluções analíticas com o Processo de Ciência de Dados da Equipe.
  • Visite a Galeria de IA do Azure para obter exemplos de aprendizado de máquina e análise de dados que usam os serviços de IA do Azure.
  • Visite a documentação de referência apropriada para esta máquina virtual.