O que são os Serviços de Machine Learning do SQL Server com Python e R?

Aplica-se a: SQL Server 2017 (14.x) e versões posteriores Instância Gerenciada de SQL do Azure

Os Serviços de Machine Learning são um recurso no SQL Server que possibilita executar scripts do Python e do R usando dados relacionais. Você pode usar pacotes e estruturas de software livre, bem como os pacotes do R e do Python da Microsoft para análise preditiva e aprendizado de máquina. Os scripts são executados no banco de dados sem mover dados para fora do SQL Server ou pela rede. Este artigo explica os conceitos básicos dos Serviços de Machine Learning do SQL Server e como começar.

Observação

Serviços de Machine Learning também estão disponíveis na Instância Gerenciada de SQL do Azure. Para aprendizado de máquina em outras plataformas do SQL, confira a documentação do aprendizado de máquina do SQL.

Observação

Serviços de Machine Learning também estão disponíveis na Instância Gerenciada de SQL do Azure. Para aprendizado de máquina em outras plataformas do SQL, confira a documentação do aprendizado de máquina do SQL.

Para executar o Java no SQL Server, confira a Documentação da Extensão de Linguagem Java.

Para executar o C# no SQL Server, confira a Documentação da Extensão de Linguagem C#.

Executar scripts do Python e do R no SQL Server

Os Serviços de Machine Learning do SQL Server permitem executar scripts de Python e R no banco de dados. Você pode usá-lo para preparar e limpar dados, fazer engenharia de recursos e treinar, avaliar e implantar modelos de machine learning em um banco de dados. O recurso executa seus scripts onde os dados residem e elimina a transferência dos dados pela rede para outro servidor.

Você pode executar scripts de Python e R em uma instância do SQL Server com o procedimento armazenado sp_execute_external_script.

As distribuições base do Python e do R estão incluídas nos Serviços de Machine Learning. Você pode instalar e usar estruturas e pacotes de software livre, como PyTorch, TensorFlow e scikit-learn, além dos pacotes da Microsoft.

Os Serviços de Machine Learning usam uma estrutura de extensibilidade para executar scripts do R e do Python no SQL Server. Saiba mais sobre como isso funciona:

Introdução aos Serviços de Machine Learning

Versões do Python e do R

Confira a seguir as versões do Python e do R incluídas nos Serviços de Machine Learning.

Versão do SQL Server Atualização Cumulativa Versão de runtime do Python Versões de runtime do R
SQL Server 2022* RTM e posterior 3.10.2 4.2.0
SQL Server 2019 RTM e posterior 3.7.1 3.5.2
Microsoft SQL Server 2017 CU22 e posteriores 3.5.2 e 3.7.2 3.3.3 e 3.5.2
Microsoft SQL Server 2017 RTM – CU21 3.5.2 3.3.3
SQL Server 2016 Veja a versão do R

* Para versões com suporte do R, do Python e do RevoScaleR e pacotes revoscalepy, confira Instalar Serviços de Machine Learning do SQL Server 2022 (Python e R) no Windows ou Instalar Serviços de Machine Learning do SQL Server (Python e R) no Linux.

Pacotes do Python e do R

Você pode usar pacotes e estruturas de software livre, além dos pacotes corporativos da Microsoft. Os pacotes de software livre do Python e do R mais comuns são pré-instalados nos Serviços de Machine Learning.

Observação

A partir do SQL Server 2022 (16.x), os runtimes do R, do Python e do Java não são mais instalados com a Instalação do SQL. Portanto, instale os pacotes e os runtimes personalizados R e/ou Python desejados. Para obter mais informações, confira Instalar os Serviços de Machine Learning do SQL Server 2022 no Windows ou Instalar os Serviços de Machine Learning do SQL Server (Python e R) no Linux.

Os seguintes pacotes do R e do Python da Microsoft também estão incluídos na instalação:

Linguagem Pacote Descrição
Python revoscalepy O pacote principal para Python escalonável. Transformações e manipulação de dados, resumo estatístico, visualização e muitas formas de modelagem. Além disso, as funções nesse pacote distribuem automaticamente as cargas de trabalho entre os núcleos disponíveis para processamento paralelo.
Python microsoftml Aplica-se apenas ao SQL Server 2016, SQL Server 2017 e SQL Server 2019. Adiciona algoritmos de aprendizado de máquina para criar modelos personalizados para análise de texto, análise de imagem e análise de sentimentos.
R RevoScaleR O pacote primário para R escalonável. Transformações e manipulação de dados, resumo estatístico, visualização e muitas formas de modelagem. Além disso, as funções nesse pacote distribuem automaticamente as cargas de trabalho entre os núcleos disponíveis para processamento paralelo.
R MicrosoftML (R) Aplica-se apenas ao SQL Server 2016, SQL Server 2017 e SQL Server 2019. Adiciona algoritmos de aprendizado de máquina para criar modelos personalizados para análise de texto, análise de imagem e análise de sentimentos.
R olapR Aplica-se apenas ao SQL Server 2016, SQL Server 2017 e SQL Server 2019. As funções do R usadas para consultas MDX em um cubo OLAP do SQL Server Analysis Services.
R sqlrutils Aplica-se apenas ao SQL Server 2016, SQL Server 2017 e SQL Server 2019. Um mecanismo para usar scripts do R em um procedimento armazenado do T-SQL, registrar esse procedimento armazenado em um banco de dados e executar procedimento armazenado em um ambiente de desenvolvimento em R.
R Microsoft R Open (descontinuado) Aplica-se a: SQL Server 2016, SQL Server 2017 e SQL Server 2019.

O Microsoft R Open (MRO) foi uma distribuição aprimorada do R da Microsoft.

Para obter mais informações sobre os pacotes que são instalados com os Serviços de Machine Learning e como instalar outros pacotes, consulte:

Próximas etapas