Carga de trabalho de aplicativos analíticos e de ciência de dados no Visual Studio

A carga de trabalho de aplicativos analíticos e de ciência de dados no Visual Studio reúne várias linguagens e suas respectivas distribuições de runtime:

Python é uma linguagem de script primária usada para ciência de dados. O Python é fácil de aprender e tem suporte de um ecossistema avançado de pacotes. Esses pacotes abordam uma ampla gama de cenários, como aquisição de dados, limpeza, treinamento de modelo, implantação e plotagem. F# também é uma linguagem .NET avançada e funcional aplicável a uma ampla variedade de tarefas de processamento de dados.

Captura de tela que mostra o Visual Studio com projetos de código R, Python e F#.

Instalação da Workload

A carga de trabalho de ciência de dados e aplicativos analíticos está disponível no Instalador do Visual Studio em Cargas de Trabalho>Outros Conjuntos de Ferramentas:

Captura de tela que mostra como selecionar a carga de trabalho de aplicativos de ciência de dados e análise no Instalador do Visual Studio.

Por padrão, a carga de trabalho instala as seguintes opções, que você pode modificar na seção resumo da carga de trabalho no Instalador do Visual Studio:

  • Suporte à linguagem F# da área de trabalho
  • Python
    • Suporte da linguagem Python
    • Suporte Web do Python
    • Ferramentas de desenvolvimento nativo do Python

Integração do SQL Server

O SQL Server dá suporte ao uso do Python para fazer análises avançadas diretamente no SQL Server. O suporte ao Python está disponível no SQL Server 2017 CTP 2.0 e posterior.

Você aproveita as seguintes vantagens executando seu código onde seus dados já residem:

  • Eliminação da movimentação de dados: em vez de mover dados do banco de dados para seu aplicativo ou modelo, você pode criar aplicativos no banco de dados. Essa funcionalidade elimina barreiras de segurança, conformidade, governança, integridade e uma série de problemas semelhantes relacionados à movimentação de grandes quantidades de dados. Você também pode consumir conjuntos de dados que não se encaixam na memória de um computador cliente.

  • Implantação fácil: depois de ter um modelo pronto, implantá-lo em produção é uma questão simples de inserir o modelo em um script T-SQL. Qualquer aplicativo cliente SQL escrito em qualquer idioma pode aproveitar os modelos e a inteligência por meio de uma chamada de procedimento armazenado. Nenhuma integração de idioma específica é necessária.

  • Desempenho e escala de nível empresarial: você pode usar os recursos avançados do SQL Server, como índices de tabela em memória e de armazenamento de colunas com as APIs escalonáveis de alto desempenho nos pacotes RevoScale. A eliminação da movimentação de dados também significa que você evita restrições de memória do cliente à medida que seus dados aumentam ou você deseja aumentar o desempenho do aplicativo.

  • Extensibilidade avançada: você pode instalar e executar qualquer um dos pacotes de software livre mais recentes no SQL Server para criar aplicativos de IA e aprendizado profundo em grandes quantidades de dados no SQL Server. Instalar um pacote no SQL Server é tão simples quanto instalar um pacote no computador local.

  • Ampla disponibilidade sem custo adicional: as integrações de linguagem estão disponíveis em todas as edições do SQL Server 2017 e posterior, incluindo a edição Express.

Instalação de integração do SQL Server

Para aproveitar ao máximo a integração do SQL Server, use o Instalador do Visual Studio para instalar as cargas de trabalho de Outros Conjuntos de Ferramentas>Armazenamento e Processamento de Dados>. Selecione a opção SQL Server Data Tools para habilitar o SQL IntelliSense, realce de sintaxe e implantação:

Captura de tela que mostra como selecionar a carga de trabalho de armazenamento e processamento de dados no Instalador do Visual Studio.

Para obter mais informações, consulte Python no SQL Server 2017: Aprendizado de máquina avançado no banco de dados (blog).

Outros serviços e SDKs

Além do que está diretamente na carga de trabalho para aplicativos de ciência de dados e de análise, o Notebooks no Visual Studio Code e o SDK do Azure para Python também são úteis para ciência de dados.

O SDK do Azure para Python facilita o consumo e o gerenciamento de serviços do Microsoft Azure de aplicativos em execução no Windows, Mac e Linux. Para obter mais informações, consulte o Azure para Desenvolvedores do Python.

Você pode combinar a extensão Jupyter com Notebooks no Visual Studio Code para dar suporte ao desenvolvimento do Jupyter e aprimorar seu projeto com extensões de linguagem extras. O serviço inclui blocos de anotações de exemplo em Python, R e F# para você começar. Para obter mais informações, consulte as experiências de Notebooks da Microsoft e do GitHub.

Captura de tela mostrando o uso de notebooks com Jupyter em uma introdução à amostra de R.