Exercício – Usar as ferramentas pré-instaladas

Concluído

Agora que você está conectado à DSVM, pode usá-la para executar a ciência de dados. A DSVM vem com ferramentas pré-instaladas para:

  • Python
  • R
  • Julia
  • Node.js
  • Java

Além disso, você pode adicionar outras linguagens de programação, aplicativos de área de trabalho, ferramentas de bancos de dados e assim por diante.

Ativar um ambiente Python do Conda

O gerenciador de pacotes Conda é uma forma conhecida de gerenciar ambientes de programação Python. A DSVM (Máquina Virtual de Ciência de Dados) usa-o como o gerenciador de ambiente padrão. A DSVM oferece vários ambientes configurados para trabalhar com pacotes populares de ciência de dados e aprendizado de máquina. Como exemplo, vamos iniciar, ativar e usar o PyTorch em execução com o Python 3.6.

Para ativar o ambiente Conda desejado:

  1. Selecione o ícone do emulador de terminal na barra de ferramentas da área de trabalho da DSVM:

    Captura de tela da área de trabalho do Ubuntu com o terminal realçado.

  2. Para inicializar o Conda e ativá-lo, execute:

    conda init && source ~/.bashrc
    
  3. Para listar os ambientes Conda instalados, execute:

    conda info --envs
    

    O resultado deve ser assim:

    # conda environments:
    #
    base                  *  /anaconda
    azureml_py310_sdkv2      /anaconda/envs/azureml_py310_sdkv2
    azureml_py38             /anaconda/envs/azureml_py38
    azureml_py38_PT_and_TF     /anaconda/envs/azureml_py38_PT_and_TF
    py38_default             /anaconda/envs/py37_default
    

    O asterisco indicará que o ambiente base está ativo no momento.

  4. Execute python --version e será possível conferir se o ambiente base está executando o Python 3.7. Execute conda list para ver quais pacotes estão instalados. Execute conda env export -n base para obter uma lista completa de dependências.

  5. Ative o ambiente que queremos usar executando:

    conda activate azureml_py38_PT_and_TF
    
  6. Execute python --version e conda list novamente para confirmar a alteração no ambiente Python.

Para iniciar um servidor Jupyter, execute:

jupyter notebook

Após a inicialização, o navegador do Firefox na DSVM deverá iniciar. Ele deverá abrir para localhost:8888/tree e exibir o diretório base do usuário da DSVM. Embora o diretório notebooks contenha vários tutoriais sobre as várias estruturas instaladas, quase todos eles exigem o download de dados de fontes externas. Como neste módulo a DSVM está sendo executada em um ambiente gratuito e restrito do Azure, não será possível acessar esses dados no momento.

Fique à vontade para experimentar outros softwares no computador. No entanto, as restrições de área restrita afetam programas que dependem do acesso à Internet.