Guia de machine learning para Clusters de Big Data do SQL Server
Aplica-se a: SQL Server 2019 (15.x)
Neste artigo, explicamos como usar os Clusters de Big Data do SQL Server em cenários de machine learning.
Importante
O complemento Clusters de Big Data do Microsoft SQL Server 2019 será desativado. O suporte para Clusters de Big Data do SQL Server 2019 será encerrado em 28 de fevereiro de 2025. Todos os usuários existentes do SQL Server 2019 com Software Assurance terão suporte total na plataforma e o software continuará a ser mantido por meio de atualizações cumulativas do SQL Server até esse momento. Para obter mais informações, confira a postagem no blog de anúncio e as opções de Big Data na plataforma do Microsoft SQL Server.
Introdução a machine learning em Clusters de Big Data do SQL Server
Clusters de Big Data do SQL Server habilitam cenários e soluções de aprendizado de máquina usando diferentes pilhas de tecnologia: Serviços de Machine Learning do SQL Server e Apache Spark ML.
Clusters de Big Data do SQL Server oferecem recursos de machine learning dentro do mecanismo SQL Server, usando a pilha de tecnologia estabelecida dos Serviços de Machine Learning do SQL Server; habilitando cenários de pontuação e inferência de machine learning no banco de dados.
Em cenários de aprendizado de máquina baseados em Big Data, o uso do HDFS para hospedagem de Big Data e dos recursos do Apache Spark ML é mais econômico, escalonável e eficiente.
Cenários de machine learning
Os recursos de machine learning permitem diferentes aplicações e soluções, como: detecção de fraudes, previsão, rotatividade e tarefas gerais de classificação e regressão. No entanto, é importante usar a melhor tecnologia para o cenário.
Aspecto | Serviços de Machine Learning do SQL Server | Apache Spark ML |
---|---|---|
Posicionamento de dados | Aproveita a localidade de dados de tabela no SQL Server. Camada de dados Premium. | Camada de dados de Big Data escalonável usando o HDFS; dados não estruturados, semiestruturados e estruturados. |
Mais adequado para | Cenários de pontuação e inferência de baixa latência | 1. Treinamento em lote distribuído e modelos de machine learning de pontuação sobre Big Data 2. Coletores de ETL, bem como preparação de dados e definição de recursos em larga escala para ML |
Feeds | Painéis, relatórios e aplicativos de BI criados com ML. Baixa latência necessária | É possível promover os dados com pontuação em lote para o SQL Server para situações de uso de ML |
Latency | Baixa latência necessária | Latência mais alta aceitável |
Leia mais | Executar scripts do Python e do R com Serviços de Machine Learning em Clusters de Big Data do SQL Server | Apresentando o machine learning do Spark em Clusters de Big Data do SQL Server |
Próximas etapas
Para saber mais, confira Introdução a Clusters de Big Data do SQL Server.