O que é Machine Learning Server ou Microsoft R Server autônomo no SQL Server?

Aplica-se a: SQL Server 2016 (13.x) e versões posteriores

Importante

O suporte para Machine Learning Server (conhecido anteriormente como Microsoft R Server) terminou em 1º de julho de 2022. Para obter mais informações, confira O que está acontecendo com Machine Learning Server?

O SQL Server fornece suporte à instalação de um Microsoft R Server ou Machine Learning Server autônomo que é executado independentemente do SQL Server. Dependendo de sua versão do SQL Server, um servidor autônomo tem uma base de R de software livre e, possivelmente, Python, sobreposto com bibliotecas de alto desempenho da Microsoft que adicionam análise estatística e preditiva em escala. As bibliotecas também habilitam tarefas de aprendizado de máquina com script em R ou Python.

No SQL Server 2016, esse recurso é chamado Microsoft R Server (autônomo) e inclui apenas R. No SQL Server 2017, é chamado Machine Learning Server (autônomo) e inclui R e Python.

Observação

Conforme instalado pela instalação do SQL Server, um servidor autônomo é funcionalmente equivalente às versões sem marca SQL do Microsoft Machine Learning Server, compatível com os mesmos cenários de usuário, incluindo execução remota, operacionalização e serviços Web, bem como a coleção completa de bibliotecas de R e Python.

Componentes

O SQL Server 2016 inclui apenas o R. O SQL Server 2017 oferece suporte às linguagens R e Python. A tabela a seguir descreve os recursos de cada versão.

Componente Descrição
Pacotes R O RevoScaleR é a biblioteca principal para R escalonável com funções para transformação, visualização, análise e manipulação de dados.
O MicrosoftML adiciona algoritmos de aprendizado de máquina para criar modelos personalizados para análise de texto, análise de imagem e análise de sentimentos.
O sqlRUtils fornece funções auxiliares para colocar scripts de R em um procedimento armazenado do T-SQL, registrando esse procedimento armazenado em um banco de dados e executando o procedimento armazenado em um ambiente de desenvolvimento de R.
O olapR é para especificar consultas MDX em R.
Microsoft R Open (MRO) O Microsoft R Open (descontinuado) foi uma distribuição de código aberto do R fornecida pela Microsoft.
Ferramentas do R Os prompts de comando e as janelas do console do R são ferramentas padrão em uma distribuição do R. Encontre-os em \Program Files\Microsoft SQL Server\140\R_SERVER\bin\x64.
Scripts e exemplos de R Os pacotes do R e do RevoScaleR de software livre incluem conjuntos de dados internos para que você possa criar e executar scripts usando dados pré-instalados. Procure por eles em \Program Files\Microsoft SQL Server\140\R_SERVER\library\datasets e \library\RevoScaleR.
Pacotes do Python O revoscalepy é a biblioteca principal para Python escalonável com funções para transformação, visualização, análise e manipulação de dados.
O microsoftml adiciona algoritmos de aprendizado de máquina para criar modelos personalizados para análise de texto, análise de imagem e análise de sentimentos.
Ferramentas do Python A ferramenta de linha de comando interna do Python é útil para tarefas e testes ad hoc. Encontre a ferramenta em \Program Files\Microsoft SQL Server\140\PYTHON_SERVER\python.exe.
Anaconda O Anaconda é uma distribuição de software livre de pacotes do Python e essenciais.
Scripts e exemplos de Python Assim como acontece com o R, o Python inclui scripts e conjuntos de dados internos. Localize os dados do revoscalepy em \Program Files\Microsoft SQL Server\140\PYTHON_SERVER\lib\site-packages\revoscalepy\data\sample-data.
Modelos pré-treinados em R e Python Os modelos pré-treinados são criados para casos de uso específicos e mantidos pela equipe de engenharia de ciência de dados na Microsoft. Você pode usar os modelos pré-treinados no estado em que se encontram para pontuar sentimentos positivos e negativos no texto ou detectar recursos em imagens, usando novas entradas de dados fornecidas por você. Os modelos pré-treinados são compatíveis e podem ser usados em um servidor autônomo, mas você não pode instalá-los usando a instalação do SQL Server. Para obter mais informações, confira Instalar os modelos de machine learning pré-treinados do SQL Server.

Como usar um servidor autônomo

Os desenvolvedores de R e Python normalmente escolhem um servidor autônomo para passar além da memória e das restrições de processamento de R e Python de software livre. As bibliotecas do R e do Python executadas em um servidor autônomo podem carregar e processar grandes quantidades de dados em vários núcleos e agregar os resultados em uma única saída consolidada. As funções de alto desempenho são projetadas para escala e utilitário: entrega de análise preditiva, modelagem estatística, visualizações de dados e algoritmos de aprendizado de máquina de ponta em um produto para servidores comerciais projetado e com suporte da Microsoft.

Como um servidor independente dissociado do SQL Server, o ambiente do R e do Python é configurado, protegido e acessado usando o sistema operacional subjacente e as ferramentas padrão fornecidas no servidor autônomo, não no SQL Server. Não há suporte interno para dados relacionais do SQL Server. Se você quiser usar dados do SQL Server, poderá criar conexões e objetos de fonte de dados como faria usando qualquer cliente.

Como um suplemento para SQL Server, um servidor autônomo também será útil como um ambiente de desenvolvimento avançado se você precisar de computação local e remota. Os pacotes do R e do Python em um servidor autônomo são os mesmos fornecidos com uma instalação do mecanismo de banco de dados, permitindo portabilidade de código e alternância de contexto de computação.

Como começar

Inicie a instalação, anexe os binários à sua ferramenta de desenvolvimento favorita e escreva seu primeiro script.

Etapa 1: Instalar o software

Instale uma destas versões:

Etapa 2: Configurar uma ferramenta de desenvolvimento

Em um servidor autônomo, é comum trabalhar localmente usando um desenvolvimento instalado no mesmo computador.

Etapa 3: Escrever seu primeiro script

Escreva o script do R ou do Python usando funções de RevoScaleR, revoscalepy e algoritmos de aprendizado de máquina.

  • Explorar R e RevoScaleR em 25 funções: Comece com comandos básicos do R e progrida para funções analíticas distribuíveis do RevoScaleR que proporcionam alto desempenho e escala para as soluções de R. Inclui versões paralelizáveis de muitos dos pacotes mais populares de modelagem do R, como clustering k-means, árvores de decisão e florestas de decisão, bem como as ferramentas para a manipulação de dados.

  • Início Rápido: Um exemplo de classificação binária com o pacote microsoftml do Python: Crie um modelo de classificação binária usando as funções de microsoftml e o conjunto de dados sobre câncer de mama conhecido.

Escolha a melhor linguagem para a tarefa. A linguagem R é melhor para cálculos estatísticos que podem ser difíceis de implementar usando SQL. Para operações baseadas em conjunto sobre dados, aproveite o poder de SQL Server para alcançar o desempenho máximo. Use o mecanismo de banco de dados em memória para computações muito rápidas sobre colunas.

Etapa 4: Operacionalizar sua solução

Os servidores autônomos podem usar a funcionalidade de operacionalização do Microsoft Machine Learning Server não SQL. Você pode configurar um servidor autônomo para operacionalização, que oferece estes benefícios: implantar e hospedar seu código como serviços Web, executar diagnóstico, testar a capacidade do serviço Web.

Etapa 5: Manter seus servidores

O SQL Server libera atualizações cumulativas regularmente. A aplicação das atualizações cumulativas adiciona aprimoramentos funcionais e de segurança a uma instalação existente.

As descrições de funcionalidades novas ou alteradas podem ser encontradas no artigo Downloads do CAB e nas páginas da Web das Atualizações cumulativas do SQL Server 2016 e das Atualizações cumulativas do SQL Server 2017.

Para obter mais informações sobre como aplicar atualizações a uma instância existente, confira Aplicar atualizações nas instruções de instalação.

Confira também

Instalar o Microsoft R Server (autônomo) ou o Machine Learning Server (autônomo)