Guía de Machine Learning para clústeres de macrodatos de SQL Server
Se aplica a: SQL Server 2019 (15.x)
En este artículo se explica cómo usar Clústeres de macrodatos de SQL Server para escenarios de Machine Learning Services.
Importante
El complemento Clústeres de macrodatos de Microsoft SQL Server 2019 se va a retirar. La compatibilidad con Clústeres de macrodatos de SQL Server 2019 finalizará el 28 de febrero de 2025. Todos los usuarios existentes de SQL Server 2019 con Software Assurance serán totalmente compatibles con la plataforma, y el software se seguirá conservando a través de actualizaciones acumulativas de SQL Server hasta ese momento. Para más información, consulte la entrada de blog sobre el anuncio y Opciones de macrodatos en la plataforma Microsoft SQL Server.
Introducción a Machine Learning en clústeres de macrodatos de SQL Server
Clústeres de macrodatos de SQL Server permite escenarios y soluciones de aprendizaje automático mediante diferentes pilas de tecnología: SQL Server Machine Learning Services y Apache Spark ML.
Clústeres de macrodatos de SQL Server ofrece funcionalidades de Machine Learning dentro del motor de SQL Server, mediante la pila de tecnología de SQL Server Machine Learning Services establecida, habilitando escenarios de puntuación e inferencia de Machine Learning en base de datos de alto rendimiento.
En escenarios de aprendizaje automático basados en macrodatos, es más rentable, escalable y eficaz el uso de HDFS para el hospedaje de macrodatos y las funcionalidades de Apache Spark ML.
Escenarios de Machine Learning
Las funcionalidades de aprendizaje automático permiten diferentes aplicaciones y soluciones como detección de fraudes, previsión, abandono, y tareas generales de clasificación y regresión. Aun así, es importante usar la mejor tecnología para un escenario.
Aspecto | SQL Server Machine Learning Services | Apache Spark ML |
---|---|---|
Colocación de datos | Aprovecha la situación de datos tabulares en SQL Server. Capa de datos premium. | Capa de datos de macrodatos escalable mediante HDFS; datos no estructurados, semiestructurados y estructurados. |
Más adecuado para | Escenarios de inferencia de latencia baja y de puntuación | 1. Entrenamiento por lotes distribuido y modelos de Machine Learning de puntuación basados en macrodatos 2. Receptores ETL y preparación y caracterización de datos a gran escala para ML |
Fuentes | Paneles, informes y aplicaciones de inteligencia empresarial con tecnología de ML. Se requiere baja latencia | Los datos puntuados por lotes se pueden promover a SQL Server para impulsar escenarios con tecnología de ML |
Latencia | Se requiere baja latencia | Se acepta una mayor latencia |
Más información | Ejecución de scripts de Python y R con Machine Learning Services en clústeres de macrodatos de SQL Server | Presentación de Machine Learning con Spark en clústeres de macrodatos de SQL Server |
Pasos siguientes
Para obtener más información, consulte Presentación de Clústeres de macrodatos de SQL Server.