Guía de Machine Learning para clústeres de macrodatos de SQL Server

Artículo
03/20/2023

Se aplica a: SQL Server 2019 (15.x)

En este artículo se explica cómo usar Clústeres de macrodatos de SQL Server para escenarios de Machine Learning Services.

Importante

El complemento Clústeres de macrodatos de Microsoft SQL Server 2019 se va a retirar. La compatibilidad con Clústeres de macrodatos de SQL Server 2019 finalizará el 28 de febrero de 2025. Todos los usuarios existentes de SQL Server 2019 con Software Assurance serán totalmente compatibles con la plataforma, y el software se seguirá conservando a través de actualizaciones acumulativas de SQL Server hasta ese momento. Para más información, consulte la entrada de blog sobre el anuncio y Opciones de macrodatos en la plataforma Microsoft SQL Server.

Introducción a Machine Learning en clústeres de macrodatos de SQL Server

Clústeres de macrodatos de SQL Server permite escenarios y soluciones de aprendizaje automático mediante diferentes pilas de tecnología: SQL Server Machine Learning Services y Apache Spark ML.

Clústeres de macrodatos de SQL Server ofrece funcionalidades de Machine Learning dentro del motor de SQL Server, mediante la pila de tecnología de SQL Server Machine Learning Services establecida, habilitando escenarios de puntuación e inferencia de Machine Learning en base de datos de alto rendimiento.

En escenarios de aprendizaje automático basados en macrodatos, es más rentable, escalable y eficaz el uso de HDFS para el hospedaje de macrodatos y las funcionalidades de Apache Spark ML.

Escenarios de Machine Learning

Las funcionalidades de aprendizaje automático permiten diferentes aplicaciones y soluciones como detección de fraudes, previsión, abandono, y tareas generales de clasificación y regresión. Aun así, es importante usar la mejor tecnología para un escenario.

Aspecto	SQL Server Machine Learning Services	Apache Spark ML
Colocación de datos	Aprovecha la situación de datos tabulares en SQL Server. Capa de datos premium.	Capa de datos de macrodatos escalable mediante HDFS; datos no estructurados, semiestructurados y estructurados.
Más adecuado para	Escenarios de inferencia de latencia baja y de puntuación	1. Entrenamiento por lotes distribuido y modelos de Machine Learning de puntuación basados en macrodatos 2. Receptores ETL y preparación y caracterización de datos a gran escala para ML
Fuentes	Paneles, informes y aplicaciones de inteligencia empresarial con tecnología de ML. Se requiere baja latencia	Los datos puntuados por lotes se pueden promover a SQL Server para impulsar escenarios con tecnología de ML
Latencia	Se requiere baja latencia	Se acepta una mayor latencia
Más información	Ejecución de scripts de Python y R con Machine Learning Services en clústeres de macrodatos de SQL Server	Presentación de Machine Learning con Spark en clústeres de macrodatos de SQL Server

Pasos siguientes

Para obtener más información, consulte Presentación de Clústeres de macrodatos de SQL Server.

Compartir vía

Guía de Machine Learning para clústeres de macrodatos de SQL Server

Introducción a Machine Learning en clústeres de macrodatos de SQL Server

Escenarios de Machine Learning

Pasos siguientes

Comentarios

Recursos adicionales