Compartilhar via


Guia de machine learning para Clusters de Big Data do SQL Server

Aplica-se a: SQL Server 2019 (15.x)

Neste artigo, explicamos como usar os Clusters de Big Data do SQL Server em cenários de machine learning.

Importante

O complemento Clusters de Big Data do Microsoft SQL Server 2019 será desativado. O suporte para Clusters de Big Data do SQL Server 2019 será encerrado em 28 de fevereiro de 2025. Todos os usuários existentes do SQL Server 2019 com Software Assurance terão suporte total na plataforma e o software continuará a ser mantido por meio de atualizações cumulativas do SQL Server até esse momento. Para obter mais informações, confira a postagem no blog de anúncio e as opções de Big Data na plataforma do Microsoft SQL Server.

Introdução a machine learning em Clusters de Big Data do SQL Server

Clusters de Big Data do SQL Server habilitam cenários e soluções de aprendizado de máquina usando diferentes pilhas de tecnologia: Serviços de Machine Learning do SQL Server e Apache Spark ML.

Clusters de Big Data do SQL Server oferecem recursos de machine learning dentro do mecanismo SQL Server, usando a pilha de tecnologia estabelecida dos Serviços de Machine Learning do SQL Server; habilitando cenários de pontuação e inferência de machine learning no banco de dados.

Em cenários de aprendizado de máquina baseados em Big Data, o uso do HDFS para hospedagem de Big Data e dos recursos do Apache Spark ML é mais econômico, escalonável e eficiente.

Cenários de machine learning

Os recursos de machine learning permitem diferentes aplicações e soluções, como: detecção de fraudes, previsão, rotatividade e tarefas gerais de classificação e regressão. No entanto, é importante usar a melhor tecnologia para o cenário.

Aspecto Serviços de Machine Learning do SQL Server Apache Spark ML
Posicionamento de dados Aproveita a localidade de dados de tabela no SQL Server. Camada de dados Premium. Camada de dados de Big Data escalonável usando o HDFS; dados não estruturados, semiestruturados e estruturados.
Mais adequado para Cenários de pontuação e inferência de baixa latência 1. Treinamento em lote distribuído e modelos de machine learning de pontuação sobre Big Data
2. Coletores de ETL, bem como preparação de dados e definição de recursos em larga escala para ML
Feeds Painéis, relatórios e aplicativos de BI criados com ML. Baixa latência necessária É possível promover os dados com pontuação em lote para o SQL Server para situações de uso de ML
Latency Baixa latência necessária Latência mais alta aceitável
Leia mais Executar scripts do Python e do R com Serviços de Machine Learning em Clusters de Big Data do SQL Server Apresentando o machine learning do Spark em Clusters de Big Data do SQL Server

Próximas etapas

Para saber mais, confira Introdução a Clusters de Big Data do SQL Server.