O que é o Máquina Virtual de Ciência de Dados Azure para Linux e Windows?

O Máquina Virtual de Ciência de Dados (DSVM) é uma imagem VM personalizada na plataforma nuvem Azure construída especificamente para fazer ciência de dados. Tem muitas ferramentas populares de ciência de dados pré-instaladas e pré-configuradas para iniciar a construção de aplicações inteligentes para análise avançada.

Importante

Os itens marcados (pré-visualização) neste artigo estão atualmente em pré-visualização pública. A versão de pré-visualização é fornecida sem um acordo de nível de serviço, e não é recomendado para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para obter mais informações, veja Termos Suplementares de Utilização para Pré-visualizações do Microsoft Azure.

O DSVM está disponível em:

  • Windows Server 2019
  • Ubuntu 20.04 LTS

Além disso, estamos entusiasmados por oferecer Azure DSVM para PyTorch (pré-visualização), que é uma imagem Ubuntu 20.04 de Azure Marketplace que é otimizada para grandes cargas de trabalho de aprendizagem profunda distribuídas. Vem pré-instalado e validado com a versão mais recente do PyTorch para reduzir os custos de configuração e acelerar o tempo de valor. Vem embalado com várias funcionalidades de otimização (ONNX Runtime, DeepSpeed, MSCCL, ORTMoE, Fairscale, Nvidia Apex), bem como uma pilha atualizada com as versões mais recentes compatíveis de Ubuntu, Python, PyTorch, CUDA.

Comparação com Azure Machine Learning

O DSVM é uma imagem VM personalizada para a Data Science, mas a Azure Machine Learning (AzureML) é uma plataforma de ponta a ponta que abrange:

  • Cálculo totalmente gerido
    • Instâncias de Computação
    • Clusters de cálculo para tarefas ML distribuídas
    • Inferência Clusters para pontuação em tempo real
  • Datastores (por exemplo Blob, ADLS Gen2, SQL DB)
  • Rastreio de experiências
  • Gestão de modelos
  • Notebooks
  • Ambientes (gerir dependências conda e R)
  • Rotulagem
  • Pipelines (automatizar fluxos de trabalho científicos de dados de ponta a ponta)

Comparação com AzureML Computação

Azure Machine Learning Compute Instances é uma imagem VM totalmente configurada e gerida , enquanto o DSVM é um VM não gerido .

As principais diferenças entre estas duas ofertas de produtos são detalhadas abaixo:

Funcionalidade Ciência dos Dados
VM
AzureML
Instância de Computação
Totalmente gerido No Yes
Suporte de Idiomas Python, R, Julia, SQL, C#,
Java, Node.js, F #
Python e R
Sistema Operativo Ubuntu
Windows
Ubuntu
Opção GPU pré-configurada Yes Yes
Opção de escala Yes Yes
Acesso SSH Yes Yes
Acesso RDP Yes No
Incorporado
Cadernos hospedados
No
(requer uma configuração adicional)
Yes
SSO embutido No
(requer uma configuração adicional)
Yes
Colaboração Incorporada No Yes
Ferramentas pré-instaladas Jupyter (laboratório), VSCode,
Estúdio Visual, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(laboratório)

Exemplos de casos de utilização

Abaixo ilustramos alguns casos de uso comum para clientes DSVM.

Experimentação e avaliação a curto prazo

Você pode usar o DSVM para avaliar ou aprender novas ferramentas de ciência de dados, especialmente através de algumas das nossas amostras publicadas e walkthroughs.

Aprendizagem profunda com GPUs

No DSVM, os seus modelos de treino podem usar algoritmos de aprendizagem profunda em hardware que é baseado em unidades de processamento de gráficos (GPUs). Ao tirar partido das capacidades de escala VM da plataforma Azure, o DSVM ajuda-o a utilizar hardware baseado em GPU na nuvem de acordo com as suas necessidades. Pode mudar para uma VM baseada em GPU quando estiver a preparar modelos grandes ou quando precisar de computações de alta velocidade, sem mudar o disco do SO. Pode escolher qualquer uma das GPUs da série N com a máquina virtual SKUs com DSVM. Note que as máquinas virtuais ativadas por GPU não são suportadas em contas gratuitas do Azure.

As edições windows do DSVM vêm pré-instaladas com controladores de GPU, quadros e versões gpu de quadros de deep learning. Nas edições Linux, a aprendizagem profunda nas GPUs está ativada nos DSVMs Ubuntu.

Também pode implementar as edições Ubuntu ou Windows do DSVM para uma máquina virtual Azure que não se baseia em GPUs. Neste caso, todos os quadros de aprendizagem profunda voltarão ao modo CPU.

Saiba mais sobre a aprendizagem profunda disponível e os quadros de IA.

Formação e educação em ciência de dados

Os formadores e educadores empresariais que ensinam aulas de ciência de dados geralmente fornecem uma imagem de máquina virtual. A imagem garante que os alunos têm uma configuração consistente e que as amostras funcionam previsivelmente.

O DSVM cria um ambiente a pedido com uma configuração consistente que facilita os desafios de apoio e incompatibilidade. Os casos em que estes ambientes têm de ser criados constantemente, especialmente para aulas de formação mais pequenas, retiram benefícios significativos destas características.

O que está incluído no DSVM?

Consulte aqui uma lista completa de ferramentas nos DSVMs Windows e Linux.

Passos seguintes

Saiba mais com estes artigos: