O que é o Máquina Virtual de Ciência de Dados Azure para Linux e Windows?
O Máquina Virtual de Ciência de Dados (DSVM) é uma imagem VM personalizada na plataforma nuvem Azure construída especificamente para fazer ciência de dados. Tem muitas ferramentas populares de ciência de dados pré-instaladas e pré-configuradas para iniciar a construção de aplicações inteligentes para análise avançada.
Importante
Os itens marcados (pré-visualização) neste artigo estão atualmente em pré-visualização pública. A versão de pré-visualização é fornecida sem um acordo de nível de serviço, e não é recomendado para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para obter mais informações, veja Termos Suplementares de Utilização para Pré-visualizações do Microsoft Azure.
O DSVM está disponível em:
- Windows Server 2019
- Ubuntu 20.04 LTS
Além disso, estamos entusiasmados por oferecer Azure DSVM para PyTorch (pré-visualização), que é uma imagem Ubuntu 20.04 de Azure Marketplace que é otimizada para grandes cargas de trabalho de aprendizagem profunda distribuídas. Vem pré-instalado e validado com a versão mais recente do PyTorch para reduzir os custos de configuração e acelerar o tempo de valor. Vem embalado com várias funcionalidades de otimização (ONNX Runtime, DeepSpeed, MSCCL, ORTMoE, Fairscale, Nvidia Apex), bem como uma pilha atualizada com as versões mais recentes compatíveis de Ubuntu, Python, PyTorch, CUDA.
Comparação com Azure Machine Learning
O DSVM é uma imagem VM personalizada para a Data Science, mas a Azure Machine Learning (AzureML) é uma plataforma de ponta a ponta que abrange:
- Cálculo totalmente gerido
- Instâncias de Computação
- Clusters de cálculo para tarefas ML distribuídas
- Inferência Clusters para pontuação em tempo real
- Datastores (por exemplo Blob, ADLS Gen2, SQL DB)
- Rastreio de experiências
- Gestão de modelos
- Notebooks
- Ambientes (gerir dependências conda e R)
- Rotulagem
- Pipelines (automatizar fluxos de trabalho científicos de dados de ponta a ponta)
Comparação com AzureML Computação
Azure Machine Learning Compute Instances é uma imagem VM totalmente configurada e gerida , enquanto o DSVM é um VM não gerido .
As principais diferenças entre estas duas ofertas de produtos são detalhadas abaixo:
Funcionalidade | Ciência dos Dados VM |
AzureML Instância de Computação |
---|---|---|
Totalmente gerido | No | Yes |
Suporte de Idiomas | Python, R, Julia, SQL, C#, Java, Node.js, F # |
Python e R |
Sistema Operativo | Ubuntu Windows |
Ubuntu |
Opção GPU pré-configurada | Yes | Yes |
Opção de escala | Yes | Yes |
Acesso SSH | Yes | Yes |
Acesso RDP | Yes | No |
Incorporado Cadernos hospedados |
No (requer uma configuração adicional) |
Yes |
SSO embutido | No (requer uma configuração adicional) |
Yes |
Colaboração Incorporada | No | Yes |
Ferramentas pré-instaladas | Jupyter (laboratório), VSCode, Estúdio Visual, PyCharm, Juno, Power BI Desktop, SSMS, Microsoft Office 365, Apache Drill |
Jupyter(laboratório) |
Exemplos de casos de utilização
Abaixo ilustramos alguns casos de uso comum para clientes DSVM.
Experimentação e avaliação a curto prazo
Você pode usar o DSVM para avaliar ou aprender novas ferramentas de ciência de dados, especialmente através de algumas das nossas amostras publicadas e walkthroughs.
Aprendizagem profunda com GPUs
No DSVM, os seus modelos de treino podem usar algoritmos de aprendizagem profunda em hardware que é baseado em unidades de processamento de gráficos (GPUs). Ao tirar partido das capacidades de escala VM da plataforma Azure, o DSVM ajuda-o a utilizar hardware baseado em GPU na nuvem de acordo com as suas necessidades. Pode mudar para uma VM baseada em GPU quando estiver a preparar modelos grandes ou quando precisar de computações de alta velocidade, sem mudar o disco do SO. Pode escolher qualquer uma das GPUs da série N com a máquina virtual SKUs com DSVM. Note que as máquinas virtuais ativadas por GPU não são suportadas em contas gratuitas do Azure.
As edições windows do DSVM vêm pré-instaladas com controladores de GPU, quadros e versões gpu de quadros de deep learning. Nas edições Linux, a aprendizagem profunda nas GPUs está ativada nos DSVMs Ubuntu.
Também pode implementar as edições Ubuntu ou Windows do DSVM para uma máquina virtual Azure que não se baseia em GPUs. Neste caso, todos os quadros de aprendizagem profunda voltarão ao modo CPU.
Saiba mais sobre a aprendizagem profunda disponível e os quadros de IA.
Formação e educação em ciência de dados
Os formadores e educadores empresariais que ensinam aulas de ciência de dados geralmente fornecem uma imagem de máquina virtual. A imagem garante que os alunos têm uma configuração consistente e que as amostras funcionam previsivelmente.
O DSVM cria um ambiente a pedido com uma configuração consistente que facilita os desafios de apoio e incompatibilidade. Os casos em que estes ambientes têm de ser criados constantemente, especialmente para aulas de formação mais pequenas, retiram benefícios significativos destas características.
O que está incluído no DSVM?
Consulte aqui uma lista completa de ferramentas nos DSVMs Windows e Linux.
Passos seguintes
Saiba mais com estes artigos: