O que é a Máquina Virtual de Ciência de Dados do Azure para Linux e Windows?

A Máquina Virtual de Ciência de Dados (DSVM) é uma imagem VM personalizada disponível na plataforma de nuvem Azure e pode lidar com ciência de dados. Ela tem muitas ferramentas populares de ciência de dados pré-instaladas e pré-configuradas para iniciar rapidamente a criação de aplicativos inteligentes para análise avançada.

O DSVM está disponível em:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

Além disso, oferecemos Azure DSVM para PyTorch - uma imagem Ubuntu 20.04 do Azure Marketplace otimizada para grandes cargas de trabalho de aprendizagem profunda distribuídas. Esse DSVM pré-instalado é validado com a versão mais recente do PyTorch, para reduzir os custos de configuração e acelerar o tempo de obtenção de valor. Ele vem com vários recursos de otimização:

  • Tempo de execução ONNX
  • DeepSpeed​
  • MSCCL​
  • ORTMoE​
  • Fairscale​
  • Nvidia Apex​
  • Uma pilha atualizada com as versões compatíveis mais recentes do Ubuntu, Python, PyTorch e CUDA

Comparação com o Azure Machine Learning

O DSVM é uma imagem de VM personalizada para Ciência de Dados, mas o Azure Machine Learning é uma plataforma ponta a ponta que abrange:

  • Computação totalmente gerenciada
    • Instâncias de computação
    • Clusters de computação para tarefas de ML distribuídas
    • Clusters de inferência para pontuação em tempo real
  • Armazenamentos de dados (por exemplo, Blob, ADLS Gen2, BD SQL)
  • Acompanhamento de experimentos
  • Gerenciamento de modelos
  • Notebooks
  • Ambientes (gerenciam dependências do Conda e do R)
  • Rotulagem
  • Pipelines (automatizam fluxos de trabalho de ciência de dados de ponta a ponta)

Comparação com as instâncias de computação do Azure Machine Learning

As Instâncias de Computação do Machine Learning Azure são uma imagem de VM totalmente configurada e gerenciada, enquanto o DSVM é uma VM não gerenciada.

Principais diferenças entre um DSVM e uma instância de computação do Azure Machine Learning:

Recurso Ciência de dados
VM
Azure Machine Learning
Instância de computação
Totalmente gerenciado Não Sim
Suporte ao idioma Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python e R
Sistema operacional Ubuntu
Windows
Ubuntu
Opção de GPU pré-configurada Sim Sim
Opção de escala vertical Sim Sim
Acesso ao SSH Sim Sim
Acesso ao RDP Sim Não
Interno
Notebooks hospedados
Não
(exige configuração adicional)
Sim
SSO interno Nenhum
(exige configuração adicional)
Sim
Colaboração interna Não Yes
Ferramentas pré-instaladas Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter (laboratório)

Exemplos de casos de uso de clientes DSVM

Avaliação e experimento de curto prazo

O DSVM pode avaliar ou aprender novas ferramentas de ciência de dados. Experimente alguns de nossos exemplos e orientações publicados.

Aprendizado profundo com GPUs

No DSVM, seus modelos de treinamento podem usar algoritmos de aprendizagem profunda em hardware baseado em unidade de processamento gráfico (GPU). Se você aproveitar os recursos de escala de VM da plataforma Azure, o DSVM ajudará você a aproveitar o hardware baseado em GPU na nuvem, de acordo com suas necessidades. Você pode mudar para uma VM baseada em GPU ao treinar modelos grandes ou quando precisar de cálculos de alta velocidade enquanto mantém o mesmo disco do sistema operacional. Você pode escolher qualquer um dos SKUs de máquina virtual habilitados para GPU da série N com DSVM. As contas gratuitas do Azure não dão suporte aos SKUs de máquina virtual habilitados para GPU.

Um DSVM de edição do Windows vem pré-instalado com drivers de GPU, estruturas e versões de GPU de estruturas de aprendizado profundo. Nas edições do Linux, o aprendizado profundo em GPUs está habilitado nas DSVMs do Ubuntu.

Também pode implementar as edições Ubuntu ou Windows DSVM numa máquina virtual Azure que não seja baseada em GPUs. Nesse caso, todas as estruturas de aprendizado profundo voltam ao modo CPU.

Saiba mais sobre o aprendizado profundo e as estruturas de IA disponíveis.

Educação e treinamento de ciência de dados

Os treinadores corporativos e educadores que dão aulas de ciência de dados geralmente fornecem uma imagem de máquina virtual. A imagem garante que os alunos tenham uma configuração consistente e que as amostras funcionem de maneira previsível.

O DSVM cria um ambiente sob demanda com uma configuração consistente, para facilitar os desafios de suporte e incompatibilidade. Nos casos em que esses ambientes precisam ser criados com frequência, especialmente para aulas rápidas de treinamento, os alunos são consideravelmente beneficiados.

O que o DSVM inclui?

Para obter mais informações, veja essa lista completa de ferramentas em DSVMs Windows e Linux.

Próximas etapas

Para obter mais informações, visite esses recursos: