Compartir vía


Guía de Machine Learning para clústeres de macrodatos de SQL Server

Se aplica a: SQL Server 2019 (15.x)

En este artículo se explica cómo usar Clústeres de macrodatos de SQL Server para escenarios de Machine Learning Services.

Importante

El complemento Clústeres de macrodatos de Microsoft SQL Server 2019 se va a retirar. La compatibilidad con Clústeres de macrodatos de SQL Server 2019 finalizará el 28 de febrero de 2025. Todos los usuarios existentes de SQL Server 2019 con Software Assurance serán totalmente compatibles con la plataforma, y el software se seguirá conservando a través de actualizaciones acumulativas de SQL Server hasta ese momento. Para más información, consulte la entrada de blog sobre el anuncio y Opciones de macrodatos en la plataforma Microsoft SQL Server.

Introducción a Machine Learning en clústeres de macrodatos de SQL Server

Clústeres de macrodatos de SQL Server permite escenarios y soluciones de aprendizaje automático mediante diferentes pilas de tecnología: SQL Server Machine Learning Services y Apache Spark ML.

Clústeres de macrodatos de SQL Server ofrece funcionalidades de Machine Learning dentro del motor de SQL Server, mediante la pila de tecnología de SQL Server Machine Learning Services establecida, habilitando escenarios de puntuación e inferencia de Machine Learning en base de datos de alto rendimiento.

En escenarios de aprendizaje automático basados en macrodatos, es más rentable, escalable y eficaz el uso de HDFS para el hospedaje de macrodatos y las funcionalidades de Apache Spark ML.

Escenarios de Machine Learning

Las funcionalidades de aprendizaje automático permiten diferentes aplicaciones y soluciones como detección de fraudes, previsión, abandono, y tareas generales de clasificación y regresión. Aun así, es importante usar la mejor tecnología para un escenario.

Aspecto SQL Server Machine Learning Services Apache Spark ML
Colocación de datos Aprovecha la situación de datos tabulares en SQL Server. Capa de datos premium. Capa de datos de macrodatos escalable mediante HDFS; datos no estructurados, semiestructurados y estructurados.
Más adecuado para Escenarios de inferencia de latencia baja y de puntuación 1. Entrenamiento por lotes distribuido y modelos de Machine Learning de puntuación basados en macrodatos
2. Receptores ETL y preparación y caracterización de datos a gran escala para ML
Fuentes Paneles, informes y aplicaciones de inteligencia empresarial con tecnología de ML. Se requiere baja latencia Los datos puntuados por lotes se pueden promover a SQL Server para impulsar escenarios con tecnología de ML
Latencia Se requiere baja latencia Se acepta una mayor latencia
Más información Ejecución de scripts de Python y R con Machine Learning Services en clústeres de macrodatos de SQL Server Presentación de Machine Learning con Spark en clústeres de macrodatos de SQL Server

Pasos siguientes

Para obtener más información, consulte Presentación de Clústeres de macrodatos de SQL Server.