Novedades de SQL Server Machine Learning Services

Se aplica a: SQL Server 2016 (13.x) y versiones posteriores

En este artículo se describen las nuevas funcionalidades y características que se incluyen en cada versión de Machine Learning Services de SQL Server. Se han agregado funciones de aprendizaje automático a SQL Server en cada versión a medida que se continúa la expansión, ampliación y profundización de la integración entre la plataforma de datos, el análisis avanzado y la ciencia de datos.

Nota:

Las funcionalidades de características y las opciones de instalación varían entre las versiones de SQL Server. Use la lista desplegable del selector de versiones para elegir la versión adecuada de SQL Server.

Novedades de SQL Server 2022

A partir de SQL Server 2022 (16.x), los entornos de ejecución de R, Python y Java ya no se instalan con el programa de instalación de SQL. En su lugar, instale los paquetes y entornos de ejecución personalizados que quiera. Para obtener más información, consulte Instalación de SQL Server 2022 Machine Learning Services (Python y R) en Windows o Instalación de SQL Server Machine Learning Services (Python y R) en Linux.

Novedades de SQL Server 2019

En esta versión se agregan las características principales solicitadas para las operaciones de aprendizaje automático de Python y R en SQL Server. Para obtener más información sobre todas las características de esta versión, consulte Novedades de SQL Server 2019 y Notas de la versión de SQL Server 2019.

Para obtener la documentación sobre las novedades de Java y C# en SQL Server 2019, vea las Novedades de Extensiones de lenguaje de SQL Server.

A continuación, se muestran las características nuevas para SQL Server Machine Learning Services, disponibles en Windows y en Linux:

Novedades de SQL Server 2017

En esta versión se agregan compatibilidad con Python y algoritmos de aprendizaje automático líderes del sector. Después de cambiar el nombre para reflejar el nuevo ámbito, SQL Server 2017 marca la introducción de SQL Server Machine Learning Services (en base de datos), con compatibilidad de lenguaje para Python y R.

Para obtener todos los anuncios de características, vea Novedades de SQL Server 2017.

Mejoras de R

El componente R de SQL Server Machine Learning Services es la próxima generación de SQL Server 2016 R Services, con versiones actualizadas de R, RevoScaler y otros paquetes.

Las nuevas funcionalidades de R incluyen la administración de paquetes, con los siguientes aspectos destacados:

Bibliotecas de R

Paquete Descripción
MicrosoftML En esta versión, MicrosoftML se incluye en una instalación predeterminada de R, lo que elimina el paso de actualización necesario en los servicios de SQL Server 2016 R anteriores. MicrosoftML proporciona algoritmos de aprendizaje automático de última generación y transformaciones de datos que se pueden escalar o ejecutar en contextos de cálculo remotos. Los algoritmos incluyen redes neuronal profundas personalizables, árboles de decisión y bosques de decisión rápidos, regresión lineal y regresión logística.

Integración de Python para el análisis en base de datos

Python es un lenguaje que ofrece una gran flexibilidad y capacidad para distintas tareas de aprendizaje automático. Las bibliotecas de código abierto para Python incluyen varias plataformas para redes neuronales personalizables, así como bibliotecas conocidas para el procesamiento de lenguaje natural.

Como Python se integra con el motor de base de datos, puede mantener el análisis cerca de los datos y eliminar los costos y riesgos de seguridad asociados con el movimiento de datos. Puede implementar soluciones de aprendizaje automático basadas en Python mediante herramientas como Visual Studio. Las aplicaciones de producción pueden obtener predicciones, modelos u objetos visuales del tiempo de ejecución de Python 3.5 mediante métodos de acceso a datos de SQL Server.

La integración de T-SQL y Python se admite a través del procedimiento almacenado del sistema sp_execute_external_script. Puede llamar a cualquier código de Python mediante este procedimiento almacenado. El código se ejecuta en una arquitectura segura y dual que permite la implementación de nivel empresarial de modelos y scripts de Python, a los que se puede llamar desde una aplicación mediante un procedimiento almacenado simple. Se consiguen mejoras de rendimiento adicionales mediante el streaming de datos desde SQL a procesos de Python y la paralelización de anillos de MPI.

Puede usar la función PREDICT de T-SQL para realizar la puntuación nativa en un modelo previamente entrenado que se haya guardado antes en el formato binario requerido.

Bibliotecas de Python

Paquete Descripción
revoscalepy Equivalente de RevoScaleR en Python. Puede crear modelos de Python para regresiones lineales y logísticas, árboles de decisión, árboles mejorados y bosques aleatorios, que se pueden usar en paralelo y ejecutarse en contextos de cálculo remotos. Este paquete admite el uso de varios orígenes de datos y contextos de cálculo remotos. El científico de datos o el desarrollador puede ejecutar código de Python en una instancia remota de SQL Server para explorar datos o crear modelos sin mover datos.
microsoftml El equivalente al paquete de R MicrosoftML en Python.

Modelos entrenados previamente

Existen modelos previamente entrenados para Python y R. Use estos modelos para el reconocimiento de imágenes y el análisis de opiniones positivas y negativas, con el fin de generar predicciones sobre datos propios.

Servidor independiente como una característica compartida en el programa de instalación de SQL Server

En esta versión también se agrega SQL Server Machine Learning Server (independiente), un servidor de ciencia de datos totalmente independiente, que admite el análisis predictivo y estadístico en R y Python. Como sucede con R Services, este servidor es la próxima versión de SQL Server 2016 R Server (independiente). Con el servidor independiente, puede distribuir y escalar soluciones de R o Python sin dependencias en SQL Server.

Novedades de SQL Server 2016

En esta versión se han introducido funciones de aprendizaje automático en SQL Server a través de SQL Server 2016 R Services, un motor de análisis en la base de datos para procesar scripts de R en datos residentes dentro de una instancia del motor de base de datos.

Además, se ha publicado SQL Server 2016 R Server (independiente) como una manera de instalar R Server en un servidor de Windows. Inicialmente, el programa de instalación de SQL Server proporcionaba la única forma de instalar R Server para Windows. En versiones posteriores, los desarrolladores y científicos de datos que querían R Server en Windows podían usar otro instalador independiente para lograr el mismo objetivo. El servidor independiente en SQL Server es funcionalmente equivalente al producto de servidor independiente, Microsoft R Server para Windows.

Para obtener todos los anuncios de características, vea Novedades de SQL Server 2016.

Release Actualización de características
Adiciones de CU La puntuación en tiempo real se basa en bibliotecas nativas de C++ para leer un modelo almacenado en un formato binario optimizado y, después, generar predicciones sin tener que llamar al tiempo de ejecución de R. Esto hace que las operaciones de puntuación sean mucho más rápidas. Con la puntuación en tiempo real, puede ejecutar un procedimiento almacenado o realizar una puntuación en tiempo real desde código de R. La puntuación en tiempo real también está disponible para SQL Server 2016, si la instancia se actualiza a la versión más reciente de Microsoft R Server.
Versión inicial Integración de R para el análisis en base de datos.

Paquetes de R para llamar a funciones de R en T-SQL y viceversa. Las funciones de RevoScaleR proporcionan análisis de R a escala mediante la fragmentación de datos en partes de componente, la coordinación y la administración del procesamiento distribuido, y la agregación de resultados. En SQL Server 2016 R Services (en base de datos), el motor de RevoScaleR se integra con una instancia del motor de base de datos, donde se agrupan los datos y los análisis en el mismo contexto de procesamiento.

Integración de T-SQL y R a través de sp_execute_external_script. Puede llamar a cualquier código de R mediante este procedimiento almacenado. Esta infraestructura segura permite la implementación de nivel empresarial de modelos y scripts de Rn, a los que se puede llamar desde una aplicación mediante un procedimiento almacenado simple. Se consiguen mejoras de rendimiento adicionales mediante el streaming de datos desde SQL a procesos de R y la paralelización de anillos de MPI.

Puede usar la función PREDICT de T-SQL para realizar la puntuación nativa en un modelo previamente entrenado que se haya guardado antes en el formato binario requerido.

Compatibilidad de Linux

SQL Server 2019 agrega compatibilidad con Linux para R y Python cuando se instalan los paquetes de aprendizaje automático con una instancia del motor de base de datos. Para obtener más información, vea Instalación de SQL Server Machine Learning Services en Linux.

En Linux, SQL Server 2017 no tiene integración de R o Python, pero puede usar la puntuación nativa en Linux porque esa funcionalidad está disponible a través de PREDICT de T-SQL, que se ejecuta en Linux. La puntuación nativa habilita la puntuación de alto rendimiento a partir de un modelo previamente entrenado, sin llamar a un tiempo de ejecución de R ni siquiera requerirlo.

Pasos siguientes